JP2005135167A - Device, method, and program for data analysis - Google Patents
Device, method, and program for data analysis Download PDFInfo
- Publication number
- JP2005135167A JP2005135167A JP2003370808A JP2003370808A JP2005135167A JP 2005135167 A JP2005135167 A JP 2005135167A JP 2003370808 A JP2003370808 A JP 2003370808A JP 2003370808 A JP2003370808 A JP 2003370808A JP 2005135167 A JP2005135167 A JP 2005135167A
- Authority
- JP
- Japan
- Prior art keywords
- data
- quantitative
- qualitative
- search
- quantitative data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000004458 analytical method Methods 0.000 claims description 40
- 238000005065 mining Methods 0.000 claims description 25
- 230000010354 integration Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 14
- 102100040160 Rabankyrin-5 Human genes 0.000 description 9
- 101710086049 Rabankyrin-5 Proteins 0.000 description 9
- 230000001186 cumulative effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 125000002704 decyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、定量データと定性データを融合したデータ分析を実行するデータ分析装置、データ分析方法及びデータ分析プログラムに関する。 The present invention relates to a data analysis apparatus, a data analysis method, and a data analysis program for executing data analysis in which quantitative data and qualitative data are fused.
昨今、消費者は様々なライフスタイルや価値観を持ち、移り変わりの激しい消費者のニーズを的確に捉え、売れる商品の開発や顧客満足度の向上につなげるためには、消費者の“生の声”に耳を傾け、言葉の裏に隠された本音を聞き出すことが非常に重要になっている。近年のネットリサーチ・コールセンター等の普及により、“生の声”を大量に収集・蓄積することが可能な環境にあるが、分析するには非常に手間と時間がかかる為、そのデータは十分に活用されていない。 In recent years, consumers have a variety of lifestyles and values, to accurately grasp the needs of consumers who are changing rapidly, and to develop products that can sell and improve customer satisfaction. It is very important to listen to "and listen to the real intentions hidden behind words." Due to the recent spread of Internet research call centers, etc., there is an environment that can collect and accumulate a large amount of “live voices”, but it takes a lot of time and labor to analyze, so the data is sufficient It is not utilized.
このような問題を解決するため、従来、特許文献1に開示されるようなマーケティングシステムが考えられている。この発明によれば、複数のモニタ側情報処理端末と、顧客側情報処理端末と、センタ内に備えるサーバとをネットワークを介して接続してマーケティングシステムを構築する。そして、サーバは、顧客から受けた依頼概要指示により、依頼情報の作成とモニタを選定し、選定したモニタから依頼情報に対する回答情報を受け取って記憶し、顧客から受けた分析要求指示に基づいて、記憶された回答情報から分析結果を作成する。そして、作成した分析結果を顧客へ送信すると、モニタは、依頼情報を受け、回答情報を入力する。一方、顧客は、依頼概要指示と分析要求指示とを送信し、サーバから送信された分析結果を受け取り、出力する。このように構成することで、顧客のニーズにあったマーケティングデータを的確にかつ、容易に提供することができる。
上述のマーケティングシステムによれば、ある側面から見た場合には、顧客のニーズに合うようなマーケティングデータが抽出される。しかし、これは、データマイニングによる消費者の購買履歴データの分析等にとどまっており、より売れる商品開発・顧客満足度の向上に効果的なマーケティングデータが欲しいというニーズには必ずしも応えることができていないという問題点があった。 According to the above-described marketing system, when viewed from a certain aspect, marketing data that meets customer needs is extracted. However, this is limited to the analysis of consumer purchase history data by data mining, etc., and it is not always possible to meet the need for marketing data that is effective in developing more sellable products and improving customer satisfaction. There was no problem.
本発明は、このような事情を考慮してなされたものであり、その目的は、定量データと定性データを融合したデータ分析により、顧客のニーズにあったマーケティングデータを的確にかつ、容易に提供するデータ分析装置、データ分析方法及びデータ分析プログラムを提供することにある。 The present invention has been made in consideration of such circumstances, and its purpose is to provide accurate and easy marketing data that meets customer needs through data analysis that combines quantitative data and qualitative data. The present invention provides a data analysis apparatus, a data analysis method, and a data analysis program.
この発明は上記の課題を解決すべくなされたもので、本発明は、分析対象の識別子と紐付けられた定量データを記憶する第1の記憶手段と、前記分析対象の識別子と紐付けられた定性データを記憶する第2の記憶手段と、前記定量データと前記定性データとを前記分析対象の識別子により紐付けるデータ統合手段と、前記定量データの検索条件を入力して、当該検索条件に該当する定量データと、前記データ統合手段により前記検索条件に該当する定量データと紐付けられた定性データとからなる検索結果を出力するデータ検索手段とを具備することを特徴とする。 The present invention has been made to solve the above-described problems. The present invention relates to first storage means for storing quantitative data associated with an identifier to be analyzed, and associated with the identifier to be analyzed. The second storage means for storing qualitative data, the data integration means for linking the quantitative data and the qualitative data with the identifier of the analysis target, the search condition for the quantitative data is input, and the search condition is met And data search means for outputting a search result including quantitative data corresponding to the search condition and qualitative data associated with the search condition by the data integration means.
また、本発明は、前記定性データを1又は複数の分類階層に分類して所定の分類コードを付加するテキストマイニング手段をさらに備え、前記データ検索手段は、前記定量データの検索条件と前記テキストマイニング手段が付加した分類コードとを入力して、当該定量データの検索条件に該当し、かつ、当該分類コードを含む前記データ統合手段により紐付けられた前記定量データ及び前記定性データを検索結果として出力することを特徴とする。 The present invention further includes text mining means for classifying the qualitative data into one or a plurality of classification hierarchies and adding a predetermined classification code, wherein the data search means includes the quantitative data search condition and the text mining The classification code added by the means is input, and the quantitative data and the qualitative data corresponding to the quantitative data search condition and linked by the data integration means including the classification code are output as search results. It is characterized by doing.
また、本発明は、前記テキストマイニング手段は、前記定性データを大分類から小分類へと複数の範囲の異なる階層に分類して、所定の分類コードを付加し、前記データ検索手段は、前記定量データの検索条件と前記テキストマイニング手段が付加した大分類から小分類までのいずれかの1または複数の分類コードとを入力して、当該定量データの検索条件に該当し、かつ、当該分類コードを含む前記データ統合手段により紐付けられた前記定量データ及び前記定性データを検索結果として出力することを特徴とする。 Further, according to the present invention, the text mining means classifies the qualitative data into a plurality of different hierarchies from a large classification to a small classification, adds a predetermined classification code, and the data search means The data search condition and one or more classification codes from the large classification to the small classification added by the text mining means are input, and the classification code is matched with the quantitative data retrieval condition. The quantitative data and the qualitative data linked by the data integration means are output as search results.
また、本発明は、分析対象の識別子と紐付けられた定量データを記憶する第1の記憶手段と、前記分析対象の識別子と紐付けられた定性データを記憶する第2の記憶手段とを具備するデータ分析装置におけるデータ分析方法であって、前記定量データと前記定性データとを前記分析対象の識別子により紐付けて統合し、前記定量データの検索条件を入力して、当該検索条件に該当する定量データと、前記検索条件に該当する定量データと紐付けられた定性データとからなる検索結果を出力することを特徴とする。 In addition, the present invention includes first storage means for storing quantitative data associated with an identifier to be analyzed, and second storage means for storing qualitative data associated with the identifier to be analyzed. A data analysis method in the data analysis apparatus for performing the analysis by linking and integrating the quantitative data and the qualitative data with the identifier of the analysis target, inputting a search condition for the quantitative data, and corresponding to the search condition A search result comprising quantitative data and qualitative data associated with the quantitative data corresponding to the search condition is output.
また、本発明は、分析対象の識別子と紐付けられた定量データを記憶する第1の記憶手段と、前記分析対象の識別子と紐付けられた定性データを記憶する第2の記憶手段とを具備するデータ分析装置にデータ分析処理を実行させるためのプログラムであって、前記定量データと前記定性データとを前記分析対象の識別子により紐付けて統合する処理と、前記定量データの検索条件を入力して、当該検索条件に該当する定量データと、前記検索条件に該当する定量データと紐付けられた定性データとからなる検索結果を出力する処理とを実行させるためのデータ分析プログラムである。 In addition, the present invention includes first storage means for storing quantitative data associated with an identifier to be analyzed, and second storage means for storing qualitative data associated with the identifier to be analyzed. A program for causing a data analysis apparatus to execute data analysis processing, wherein the quantitative data and the qualitative data are linked by the identifier of the analysis target and integrated, and a search condition for the quantitative data is input. A data analysis program for executing a process for outputting a search result including quantitative data corresponding to the search condition and qualitative data associated with the quantitative data corresponding to the search condition.
以上説明したように、本発明によれば、定量データと定性データとを分析対象の識別子により紐付けて統合し、定量データの検索条件を入力して、当該検索条件に該当する定量データと、検索条件に該当する定量データと紐付けられた定性データとからなる検索結果を出力する。
このように構成することで、大量の分析対象を所望の定量データに関する検索条件で絞込み、絞り込んだ結果と紐付いている定性データを印刷・表示等の形で出力する。
したがって、数値化が不向きであり検索性の低い定性データを大量に分析する場合でも、効率的かつ適切に抽出することができる。また、このような定量データと定性データを融合したデータ分析により、顧客のニーズにあったマーケティングデータを的確にかつ、容易に提供することができる効果が得られる。
As described above, according to the present invention, the quantitative data and the qualitative data are linked and integrated by the identifier of the analysis target, the search condition for the quantitative data is input, the quantitative data corresponding to the search condition, A search result consisting of quantitative data corresponding to the search condition and qualitative data associated with the search condition is output.
With this configuration, a large amount of analysis objects are narrowed down by a search condition regarding desired quantitative data, and qualitative data associated with the narrowed-down result is output in the form of print / display.
Therefore, even when a large amount of qualitative data that is unsuitable for quantification and has low searchability is analyzed, it can be extracted efficiently and appropriately. In addition, the data analysis that combines the quantitative data and the qualitative data can provide an effect that the marketing data meeting the needs of the customer can be provided accurately and easily.
また、本発明によれば、定性データを1又は複数の分類階層に分類して所定の分類コードを付加し、定量データの検索条件と付加した分類コードとを入力して、当該定量データの検索条件に該当し、かつ、当該分類コードを含む定量データ及び定性データを検索結果として出力する。
このように構成することで、所望の定量データに関する検索条件に加えて、定性データに付加されたコードに関する検索条件で大量の分析対象を絞込み、絞り込んだ結果と紐付いている定量データ及び定性データを印刷・表示等の形で出力する。
したがって、定量データに関する検索条件と、定性データに関する検索条件との利用バランスを考慮したデータ検索条件設定が可能となり、より顧客のニーズにあったマーケティングデータを的確にかつ、容易に提供することができる効果が得られる。
Further, according to the present invention, the qualitative data is classified into one or a plurality of classification hierarchies, a predetermined classification code is added, the quantitative data search condition and the added classification code are input, and the quantitative data is searched. Quantitative data and qualitative data that meet the conditions and include the classification code are output as search results.
By configuring in this way, in addition to the search conditions related to the desired quantitative data, a large amount of analysis objects are narrowed down by the search conditions related to the code added to the qualitative data, and the quantitative data and qualitative data associated with the narrowed-down results are obtained. Output in the form of print / display.
Therefore, it is possible to set data search conditions that take into account the usage balance between the search conditions related to quantitative data and the search conditions related to qualitative data, and marketing data that meets customer needs can be provided accurately and easily. An effect is obtained.
また、本発明によれば、定性データを大分類から小分類へと複数の範囲の異なる階層に分類して、所定の分類コードを付加し、定量データの検索条件と付加した大分類から小分類までのいずれかの1または複数の分類コードとを入力して、当該定量データの検索条件に該当し、かつ、当該分類コードを含む定量データ及び定性データを検索結果として出力する。
このように構成することで、所望の定量データに関する検索条件に加えて、大分類から小分類へと複数の範囲の異なる階層に分類された定性データに付加されたコードに関する検索条件で大量の分析対象を絞込み、絞り込んだ結果と紐付いている定量データ及び定性データを印刷・表示等の形で出力する。
したがって、大分類から小分類へと複数の範囲の異なる階層に分類された定性データに関する検索条件と、定性データに関する検索条件との利用バランスを考慮したデータ検索条件設定が可能となり、より顧客のニーズにあったマーケティングデータを的確にかつ、容易に提供することができる効果が得られる。
Further, according to the present invention, the qualitative data is classified into a plurality of different hierarchies from the major classification to the minor classification, a predetermined classification code is added, and the quantitative data search condition and the minor classification to the minor classification are added. Any one or a plurality of classification codes up to are input, and quantitative data and qualitative data that satisfy the search conditions for the quantitative data and include the classification code are output as search results.
By configuring in this way, in addition to the search conditions related to the desired quantitative data, a large amount of analysis is performed with the search conditions related to the codes added to the qualitative data classified into different hierarchies in multiple ranges from large classification to small classification The target is narrowed down, and quantitative data and qualitative data associated with the narrowed down result are output in the form of print / display.
Therefore, it is possible to set data search conditions that take into account the usage balance between the search conditions for qualitative data classified into different levels in multiple ranges, from major classifications to minor classifications, and the search conditions for qualitative data. The marketing data can be provided accurately and easily.
以下、本発明を実施するための最良の形態について説明する。
まず本発明の基本的な考え方について説明する。図1は、本発明の一実施形態として、データ分析装置を利用したサービス提供の流れを示す。大きな流れとしては、図1に示すように、データ分析装置は分析対象のデータを入力し、データ加工・分析処理を施した後、適当な形で出力する。ここで、本発明においては、分析対象のデータをいわゆる定量データと定性データとに分類してそれぞれのデータベースを構築する。定量データとは数値化可能なデータ特性を有するデータであって、具体例としては、図2に示すような購買履歴データ(ポイントカードデータ、POSデータ)をいう。図2に示す例において、購買履歴データは、顧客ID、氏名、年齢、性別、住所等のデータからなる顧客マスタと、顧客が実行した購入トランザクションにより生成される購買履歴ID、購入日、購入金額等のデータからなる属性データとから構成される。
また、定性データとは、数値化が困難なデータ特性を有するデータであって、具体例としては、フリーアンサーアンケート(例;お客様が当店をお選びいただいた理由は何でしょうか?選択式ではなく自由回答)の回答原文データをいう。
Hereinafter, the best mode for carrying out the present invention will be described.
First, the basic concept of the present invention will be described. FIG. 1 shows a flow of service provision using a data analysis apparatus as an embodiment of the present invention. As shown in FIG. 1, the data analysis apparatus inputs data to be analyzed, performs data processing / analysis processing, and then outputs the data in an appropriate form as shown in FIG. Here, in the present invention, data to be analyzed is classified into so-called quantitative data and qualitative data, and respective databases are constructed. The quantitative data is data having data characteristics that can be quantified, and as a specific example, purchase history data (point card data, POS data) as shown in FIG. In the example shown in FIG. 2, the purchase history data includes a customer master including data such as a customer ID, name, age, sex, and address, a purchase history ID generated by a purchase transaction executed by the customer, a purchase date, and a purchase price. And attribute data composed of data such as
In addition, qualitative data is data with data characteristics that are difficult to quantify, and a specific example is a free answer questionnaire (eg; why did you choose our shop? This is the original response data.
定量データはデシルランク付与、RFMランク付与等のデータ加工を施され、データベース(購買履歴DB)に格納される。この様子を図2を用いて説明すると、購買履歴データ(購買履歴ID、顧客ID、氏名、年齢、性別、住所、購入日、購入金額)は、例えば、顧客ID別にデータ集計されて、RFMランク(R:最新購入日、F:累積購入回数、M:累積購入金額)が付与される。
例えば、顧客ID:00001が付番された顧客は、最新購入日に基づいてRランク5が割り当てられ、累積購入回数に基づいてFランク4が割り当てられ、累積購入金額に基づいてMランク4が割り当てられる。
これらの新たに割り当てられたRFMランクは、最新購入日が新しい/古い、累積購入回数が多い/少ない、累積購入金額が多い/少ないといった顧客の検索条件として使用される。
The quantitative data is subjected to data processing such as decyl ranking and RFM ranking and is stored in a database (purchasing history DB). This situation will be described with reference to FIG. 2. The purchase history data (purchase history ID, customer ID, name, age, gender, address, purchase date, purchase price), for example, is aggregated by customer ID, and RFM rank. (R: Latest purchase date, F: Cumulative purchase count, M: Cumulative purchase price).
For example, a customer numbered with a customer ID: 00001 is assigned
These newly assigned RFM ranks are used as search conditions for customers such as the latest purchase date is new / old, the cumulative purchase count is large / small, and the cumulative purchase amount is large / small.
同様に、定性データについても、図3に示すように、テキストマイニングによる定量化等のデータ加工が施され、データベース(アンケートDB)に格納される。この様子を図3を用いて説明すると、複数のアンサーアンケートのアンケート原文から代表語句が抽出され、特定の代表語句を含むか否かによって、複数のアンケート原文はいくつかのグループに分類される。例えば、代表語句(商品、品揃え、品数、豊富)を含むアンケート原文で1つのグループを形成する。そして、この代表語句(以下、小分類という)を包括的に示す分類階層を大分類に対するクラスタ(中分類)とする。例えば、クラスタは、代表分類の中から選択された(商品、品揃え、品数)とする。さらに、このクラスタを包括的に示す分類階層を要因(大分類)とし、コードを付加する。例えば、要因は、クラスタの中から(商品)とし、コード001を付加する。
このように要因、クラスタ、代表語句、アンケート原文は、順に大分類から小分類へと複数の範囲の異なる階層に分類され、アンケート原文以外の定性データ(要因、クラスタ、代表語句)は、数や語句にコーディングされ、顧客の検索条件として使用される。
Similarly, as shown in FIG. 3, qualitative data is also subjected to data processing such as quantification by text mining and stored in a database (questionnaire DB). This situation will be described with reference to FIG. 3. Representative words are extracted from questionnaire originals of a plurality of answer questionnaires, and the plurality of questionnaire originals are classified into several groups depending on whether or not specific representative words are included. For example, one group is formed by original questionnaires including representative words (product, product lineup, number of products, abundant). A classification hierarchy that comprehensively indicates this representative word / phrase (hereinafter referred to as a small classification) is defined as a cluster (medium classification) for the large classification. For example, the cluster is selected from the representative classification (product, assortment, number of items). Furthermore, a code is added using a classification hierarchy that comprehensively indicates the cluster as a factor (major classification). For example, the factor is (product) from the cluster, and a code 001 is added.
In this way, factors, clusters, representative phrases, and questionnaire original text are categorized into a plurality of different levels in order from major classification to minor classification, and qualitative data (factors, clusters, representative phrases) other than the questionnaire original text are Coded in a phrase and used as a customer search criteria.
このようなデータ加工後、定性データ、定量データは、分析対象の識別子(顧客ID)により、統合されてデータベース(統合DB)に格納される。図4は、購買履歴DBに格納された定量データと、アンケートDBに格納された定性データとを顧客IDで結合した様子を示す。図4に示すように、各データの共通項目(顧客ID、氏名、年齢、性別、住所)に加え、定量データであるRFMランクと、定性データであるQ1大分類、Q1中分類、アンケート原文Q1、Q2(図示せず)が結合されて、テーブル(データベース)を構成する。
構築された統合DBは、ASPサーバによってインターネット上の端末から検索される。すなわち、男女別、年代別、購買店別、時系列等の側面から検索条件が設定されて、各側面から見た全体的な傾向を把握した上で、つまり、検索対象の顧客を絞り込んだ上で、さらに、絞り込まれた検索結果と紐付いたアンケート原文(明細データ)へのアクセスを提供する。
After such data processing, the qualitative data and quantitative data are integrated and stored in a database (integrated DB) by an identifier to be analyzed (customer ID). FIG. 4 shows a state in which the quantitative data stored in the purchase history DB and the qualitative data stored in the questionnaire DB are combined with the customer ID. As shown in FIG. 4, in addition to common items (customer ID, name, age, gender, address) of each data, RFM rank as quantitative data, Q1 major classification, Q1 medium classification, questionnaire original Q1 as qualitative data , Q2 (not shown) are combined to form a table (database).
The constructed integrated DB is searched from a terminal on the Internet by the ASP server. In other words, search conditions are set by gender, age, purchase store, time series, etc., and after grasping the overall trend from each aspect, that is, after narrowing down the customers to be searched In addition, it provides access to the original questionnaire (detailed data) associated with the refined search results.
以上のようなサービス提供を実現する。この効果を購買履歴データ(定量データ、数値データ)のみの分析と比較して説明すると、購買履歴データ分析で得られる結果は、顧客の属性、過去の購入実績に対する分析に限定されているため、「何を購入したか」という事実に基づく分析は可能であるが、「なぜ購入したのか(満足要因)、購入したが、何に不満を持っているのか(不満足要因)、何に期待しているのか(期待要因)」という顧客の心理的側面(購入の因果関係)を反映させることができなかった。 The above service provision is realized. Explaining this effect in comparison with the analysis of purchase history data (quantitative data, numerical data) only, the results obtained with the purchase history data analysis are limited to analysis of customer attributes and past purchase results. An analysis based on the fact of "what you purchased" is possible, but "what did you buy (satisfaction factor), what did you buy but what you are dissatisfied with (dissatisfaction factor), what do you expect? The customer ’s psychological aspect (causal relationship) was not reflected.
これを補うのが、定性データであり、本サービスによれば、顧客に対するアンケートによって心理的側面を反映するデータを取得し、これを購買履歴データと統合することにより、顧客の購買理由を明らかにし、ランク付与により設定した各顧客セグメント(男女別、年代別等で区切られるセグメント)に対して、心理的側面を考慮したプロモーション施策を立案する材料を提供することができる。
また、本サービスによれば、データ分析者は、テキストマイニングによって分類された定性データを定量的にインターネットを介して参照することができるため、例えば、部門間での情報共有も容易となる。
Complementing this is qualitative data. According to this service, data that reflects psychological aspects is obtained through questionnaires to customers, and this is integrated with purchase history data to clarify the reasons for purchasing customers. In addition, for each customer segment (segment separated by gender, age group, etc.) set by ranking, a material for planning a promotion measure considering psychological aspects can be provided.
Further, according to this service, the data analyst can quantitatively refer to the qualitative data classified by the text mining via the Internet, so that, for example, information sharing between departments is facilitated.
以下、図面を参照して、本発明のデータ分析装置の一実施形態について説明する。図1は、本実施形態のデータ分析装置1の構成図である。
上述したように、本実施形態のデータ分析装置1は、分析対象のデータとして、定量データと定性データとを入力する。この各入力インターフェイスとなるのが、定量データ入力部10と定性データ入力部20とである。
すなわち、定量データ入力部10は、分析対象の識別子(以下、顧客IDとして説明する)と紐付けられた形式の定量データを入力する。具体例としては、上述したように、POSデータやポイントカードデータ等の購買履歴データであり、入力形態としては、これらを記録した電子媒体からデータを読み込むことで入力する形態が考えられる。
また、定性データ入力部20は、顧客IDと紐付けられた定性データを入力する。具体例としては、上述したように、フリーアンサー形式のアンケートデータであり、入力形式は、Webブラウザを介したデータ送受信形態、手入力形態等が考えられる。
各入力部に入力されたデータは、それぞれ定量データ用DB11、定性データ用DB21に格納される。すなわち、定量データ用DB11は、顧客IDと紐付けられた定量データを記憶する。また、定性データ用DB21は、顧客IDと紐付けられた定性データを記憶する。
Hereinafter, an embodiment of a data analysis apparatus of the present invention will be described with reference to the drawings. FIG. 1 is a configuration diagram of a
As described above, the
That is, the quantitative
Further, the qualitative
Data input to each input unit is stored in the
これらデータベースに格納された定量データ、定性データは、検索性、利便性を向上させるために適宜選択されるランク付与手法を用いてデータ加工される。すなわち、ランク付与部12は、定量データ用DB11より、所望の定量データを読み出して、データクレンジング後、選択されるランク付与手法によって分析し、複数の顧客(顧客ID)を定量データに関するデータ項目を検索条件としてセグメント化して記憶しておく。
また、テキストマイニング部22は、定性データ用DB21より、所望の定性データを読み出して、選択されるテキストマイニング手法により分類(コーディング)する。したがって、選択されたテキストマイニング手法によっては、テキストマイニング部22は、定性データを1又は複数の分類階層に分類して所定の分類コードを付加する処理や定性データを大分類から小分類へと複数の範囲の異なる階層に分類して、所定の分類コードを付加する処理を実行する。
これらの実行結果は、それぞれデータ統合部30に出力される。
Quantitative data and qualitative data stored in these databases are processed using a rank assignment method that is appropriately selected to improve searchability and convenience. That is, the
Further, the
These execution results are output to the
データ統合部30は、ランク付与部11及びテキストマイニング部21よりそれぞれ定量データ、定性データを入力し、これらの定量データと定性データとを顧客IDで紐付けてデータ検索用のテーブル(データベース)を構築する。
このデータ検索用のテーブルは、データ検索部40によって読み込まれ、定量データ、定性データの分析に使用される。すなわち、データ検索部40は、定量データ検索条件部41より定量データの検索条件を入力して、当該検索条件に該当する定量データと、データ統合部により検索条件に該当する定量データと紐付けられた定性データとからなる検索結果を検索結果出力部50より出力する。また、定量データ検索条件部41より定量データの検索条件を入力し、定性データ検索条件入力部42よりテキストマイニング部22が付加した分類コードとを入力した場合、データ検索部40は、当該定量データの検索条件に該当し、かつ、当該分類コードを含むデータ統合部30により紐付けられた定量データ及び定性データを検索結果として検索結果出力部50より出力する
The
This data search table is read by the
このように、定量データ検索条件入力部41及び定性データ検索条件入力部42より入力する検索条件(分類コードを含む)は、データ特性、ランク付与部12が作成したデータ項目、テキストマイニング部22が付加した分類コードによって、データ分析者が任意に入力可能であるが、定性データの絞込みをより効率的に実行するには、少なくとも定量データの検索条件は入力するように構成することが考えられる。この場合、上述したように、定性データ検索条件入力部42には検索条件として分類コードの入力は必須とせず、逐次定量データの検索条件を増やしていくことで全体の傾向を把握するように検索を行う。そして、ある程度の絞込みが完了した段階で、定性データ検索条件により、または定性データ検索条件を用いずに、そのまま絞り込まれた顧客IDと紐付けられたアンケート原文データを出力する。
As described above, the search conditions (including the classification code) input from the quantitative data search
分類コードで絞込みを行う場合、データ検索部40は、定量データ検索条件部41から入力する定量データの検索条件に加えて、さらに、定性データ検索条件入力部42よりテキストマイニング部22が付加した大分類から小分類までのいずれかの1または複数の分類コードとを入力して、当該定量データの検索条件に該当し、かつ、当該分類コードを含むデータ統合部30により紐付けられた定量データ及び定性データを検索結果として出力するように構成することが考えられる。この場合、どれくらい絞込みたいかによって、検索条件として、小分類、中分類、大分類を1または複数使用し、検索結果を得るようにする。
When narrowing down by classification code, in addition to the quantitative data search condition input from the quantitative data
定量データ検索条件入力部41及び定性データ検索条件入力部42は、基本的には、Webベースの入力インターフェイスであって、それぞれ1または複数の検索条件が指定可能である。
検索結果出力部50も、同様に、Webベースの出力インターフェイスであって、実装に応じて、データ分析者の端末への検索結果送信処理、データ分析者の端末上における表示処理、検索結果印刷処理が実行される。
The quantitative data search
Similarly, the search
次に、図面を参照して、本実施形態のデータ分析装置1の動作について説明する。図6は、定量データとして購買履歴が入力され、定性データとしてアンケートデータが入力された場合における本実施形態のデータ分析装置1のデータ分析処理過程を示すフローチャートである。
定量データ入力部10及び定性データ入力部20において、分析対象である顧客に関する定量データ(数値ベースの購買履歴データ)及び定量データ(テキストベースのアンケートデータ)を入力すると(図6のステップS1)、定量データ用DB11(購買履歴DB)、定性データ用DB21(アンケートDB)それぞれが更新された後(ステップS2)、図2、図3に示すように、ランク付与部12、テキストマイニング部22によってそれぞれ新規のデータ項目、分類コードが付加される(ステップS3)。
Next, the operation of the
When the quantitative
図4に示すように、ランク付与部12、テキストマイニング部22が出力する各定量データ、定性データはそれぞれデータ統合部30に入力されて、分析対象の識別子(顧客ID)をキーとして紐付けられてそれぞれのデータベース(テーブル)が統合される(ステップS4)。以上により、新規のデータ項目及び分類コードが付加された多次元の分析DBが構築される。
なお、分析対象の識別子は、定量データ、定性データを紐付けることが可能な識別情報であればどのようなものであってもよく、複数対複数の識別子で紐付けを行うようにしてもよい。
As shown in FIG. 4, each quantitative data and qualitative data output by the
The identifier to be analyzed may be any identification information that can associate quantitative data and qualitative data, and may be associated with a plurality of identifiers. .
このようにして統合されたデータベースは、所定のASPサーバを介してインターネット上に公開される(ステップS5)。インターネット上のデータ分析者の端末より、ASPサーバがアクセスされ、定量データ検索条件入力部41、定性データ検索条件入力部42に定量データ検索条件及び定性データ検索条件が入力されると(ステップS7、S9)、検索部40は、該当する定量データ、定性データを出力する(ステップS8、S10)。このときの出力形式(表示形式)は、図7〜図11に示すように、OLAP(OnLine Analytical Processing)ツールを利用したGUIベースの形式を採用することが考えられる。
The database integrated in this way is published on the Internet via a predetermined ASP server (step S5). When the ASP server is accessed from a data analyst's terminal on the Internet, and the quantitative data search condition and the qualitative data search condition are input to the quantitative data search
以下、このようにして統合されたデータベースを検索する過程について、図7〜図11を用いて説明する。
図7は、定量データ検索条件入力部41において、検索条件として年代、性別の分析軸が指定され、図4に示す統合したデータベースに格納された顧客を年代、性別の分析軸で集計して出力した結果を示す。この場合、定性データ検索条件入力部42には検索条件(図7に示す期待要件カテゴリの分析軸に相当する)が指定されていない。
この出力結果をさらにRランク、Fランクについて展開する、つまり、検索条件として、性別に代えて、Rランク、Fランクの分析軸を指定すると、検索部40は、図8に示すように、統合したデータベースに格納された顧客を年代別にRランク、Fランクの分析軸で集計して出力する。
Hereinafter, the process of searching the database integrated in this way will be described with reference to FIGS.
FIG. 7 shows that the quantitative data search
When the output result is further expanded for R rank and F rank, that is, when the analysis axis of R rank and F rank is designated as a search condition instead of gender, the
今、図8に示す出力結果を見て、データ分析者が検索条件として、Rランク5、Fランク5の期待要因別カテゴリ(定性データ)の分析軸を指定すると、図9に示すように、検索部40は、統合したデータベースに格納された顧客のうち、Rランク5、Fランク5の顧客を、さらに、テキストマイニング部22によって分類された要因(大分類:価格、商品、サービス、販売員)の分析軸で集計して出力する。
この出力結果について、データ分析者がもう一度、年代、性別(顧客属性情報)の分析軸を指定すると、検索部40は、テキストマイニング部22によって分類された要因(大分類)の分析軸で集計した結果を再度、年代、性別の分析軸で集計して出力する。
これを見ると、一例として、30代、男性がサービスに期待していることが分かる。
Now, looking at the output result shown in FIG. 8, when the data analyst specifies the analysis axis of the R-
When the data analyst designates the analysis axis of the age and the sex (customer attribute information) once again for the output result, the
Looking at this, as an example, you can see that men in their 30s are expecting service.
この出力結果について、データ分析者が検索条件として、Rランク5、Fランク5、30代、男性の期待要因別カテゴリの中分類の分析軸を指定すると、図10に示すように、検索部40は、統合したデータベースに格納された顧客のうち、Rランク5、Fランク5、30代、男性の顧客を、さらに、テキストマイニング部22によって分類された要因(中分類:配達、サービスコーナー、駐車料金、アフターサービス、修理、保証、セール、情報提供)の分析軸で集計して出力する。
With respect to this output result, when the data analyst designates the analysis axis of the medium classification of
この出力結果について、データ分析者がテキストマイニング部22によって分類された要因(中分類)のうち、情報提供を指定すると、検索部40は、統合したデータベースに格納された顧客のうち、定量データがRランク5、Fランク5、30代、男性、定性データが中分類:情報提供に該当する顧客とともに、明細データ(定性データ:アンケート原文)を図11に示すようにすべて出力する。
以上のようにして、統合したデータベースから所望のランク、顧客属性に該当し、かつ、所望の分類コードに該当する顧客の定性データを検索・出力する。
With respect to the output result, when the data analyst specifies information provision among the factors (medium classification) classified by the
As described above, the customer's qualitative data corresponding to the desired rank and customer attribute and corresponding to the desired classification code is retrieved and output from the integrated database.
以上説明したように、本実施形態のデータ分析装置1によれば、大量の分析対象を所望の定量データに関する検索条件で絞込み、絞り込んだ結果と紐付いている定性データを印刷・表示等の形で出力する。
したがって、数値化が不向きであり検索性の低い定性データを大量に分析する場合でも、効率的かつ適切に抽出することができる。また、このような定量データと定性データを融合したデータ分析により、顧客のニーズにあったマーケティングデータを的確にかつ、容易に提供することができる効果が得られる。
As described above, according to the
Therefore, even when a large amount of qualitative data that is unsuitable for quantification and has low searchability is analyzed, it can be extracted efficiently and appropriately. In addition, the data analysis that combines the quantitative data and the qualitative data can provide an effect that the marketing data meeting the needs of the customer can be provided accurately and easily.
上述のデータ分析装置1は、内部に、コンピュータシステムを有している。
そして、上述したデータ分析処理に関する一連の処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。
すなわち、データ分析装置1における、各処理手段、処理部は、CPU等の中央演算処理装置がROMやRAM等の主記憶装置に上記プログラムを読み出して、情報の加工・演算処理を実行することにより、実現されるものである。
ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
The
A series of processes related to the data analysis process described above is stored in a computer-readable recording medium in the form of a program, and the above process is performed by the computer reading and executing this program.
That is, each processing means and processing unit in the
Here, the computer-readable recording medium means a magnetic disk, a magneto-optical disk, a CD-ROM, a DVD-ROM, a semiconductor memory, or the like. Alternatively, the computer program may be distributed to the computer via a communication line, and the computer that has received the distribution may execute the program.
1…データ分析装置
10…定量データ入力部
11…定量データ用DB
12…ランク付与部
20…定性データ入力部
21…定性データ用DB
22…テキストマイニング部
30…データ統合部
40…データ検索部
41…定量データ検索条件入力部
42…定性データ検索条件入力部
50…検索結果出力部
DESCRIPTION OF
12 ...
22 ...
Claims (5)
前記分析対象の識別子と紐付けられた定性データを記憶する第2の記憶手段と、
前記定量データと前記定性データとを前記分析対象の識別子により紐付けるデータ統合手段と、
前記定量データの検索条件を入力して、当該検索条件に該当する定量データと、前記データ統合手段により前記検索条件に該当する定量データと紐付けられた定性データとからなる検索結果を出力するデータ検索手段と
を具備することを特徴とするデータ分析装置。 First storage means for storing quantitative data associated with an identifier to be analyzed;
Second storage means for storing qualitative data associated with the identifier to be analyzed;
Data integration means for associating the quantitative data and the qualitative data with the identifier of the analysis target;
Data for inputting search conditions for the quantitative data and outputting search results including quantitative data corresponding to the search conditions and qualitative data associated with the quantitative data corresponding to the search conditions by the data integration unit A data analysis apparatus comprising: a search means.
をさらに備え、
前記データ検索手段は、前記定量データの検索条件と前記テキストマイニング手段が付加した分類コードとを入力して、当該定量データの検索条件に該当し、かつ、当該分類コードを含む前記データ統合手段により紐付けられた前記定量データ及び前記定性データを検索結果として出力する
ことを特徴とする請求項1に記載のデータ分析装置。 Text mining means for classifying the qualitative data into one or more classification hierarchies and adding a predetermined classification code;
The data search means inputs the quantitative data search condition and the classification code added by the text mining means, and corresponds to the quantitative data search condition and includes the classification code by the data integration means. The data analysis apparatus according to claim 1, wherein the linked quantitative data and the qualitative data are output as search results.
前記データ検索手段は、前記定量データの検索条件と前記テキストマイニング手段が付加した大分類から小分類までのいずれかの1または複数の分類コードとを入力して、当該定量データの検索条件に該当し、かつ、当該分類コードを含む前記データ統合手段により紐付けられた前記定量データ及び前記定性データを検索結果として出力する
ことを特徴とする請求項1に記載のデータ分析装置。 The text mining means classifies the qualitative data from a large classification to a small classification into a plurality of ranges of different hierarchies, and adds a predetermined classification code,
The data search means inputs the search condition for the quantitative data and one or more classification codes from the large classification to the small classification added by the text mining means, and corresponds to the search condition for the quantitative data The data analysis apparatus according to claim 1, wherein the quantitative data and the qualitative data linked by the data integration unit including the classification code are output as search results.
前記定量データと前記定性データとを前記分析対象の識別子により紐付けて統合し、
前記定量データの検索条件を入力して、当該検索条件に該当する定量データと、前記検索条件に該当する定量データと紐付けられた定性データとからなる検索結果を出力する
ことを特徴とするデータ分析方法。 Data in a data analysis apparatus comprising first storage means for storing quantitative data associated with an identifier to be analyzed, and second storage means for storing qualitative data associated with the identifier to be analyzed An analysis method,
The quantitative data and the qualitative data are integrated by linking with the identifier of the analysis target,
Data for inputting the search condition for the quantitative data, and outputting a search result comprising quantitative data corresponding to the search condition and qualitative data linked to the quantitative data corresponding to the search condition Analysis method.
前記定量データと前記定性データとを前記分析対象の識別子により紐付けて統合する処理と、
前記定量データの検索条件を入力して、当該検索条件に該当する定量データと、前記検索条件に該当する定量データと紐付けられた定性データとからなる検索結果を出力する処理と
を実行させるためのデータ分析プログラム。
Data is stored in a data analysis apparatus including first storage means for storing quantitative data associated with an identifier to be analyzed, and second storage means for storing qualitative data associated with the identifier to be analyzed. A program for executing analysis processing,
A process of linking and integrating the quantitative data and the qualitative data with the identifier of the analysis target;
To input a search condition for the quantitative data, and to execute a process of outputting a search result including quantitative data corresponding to the search condition and qualitative data linked to the quantitative data corresponding to the search condition Data analysis program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003370808A JP2005135167A (en) | 2003-10-30 | 2003-10-30 | Device, method, and program for data analysis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003370808A JP2005135167A (en) | 2003-10-30 | 2003-10-30 | Device, method, and program for data analysis |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005135167A true JP2005135167A (en) | 2005-05-26 |
Family
ID=34647706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003370808A Withdrawn JP2005135167A (en) | 2003-10-30 | 2003-10-30 | Device, method, and program for data analysis |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005135167A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007114957A (en) * | 2005-10-19 | 2007-05-10 | Toshiba Tec Corp | Merchandise information display system |
JP2010205077A (en) * | 2009-03-04 | 2010-09-16 | Mitsubishi Electric Corp | Device, and program for data integration and recording medium |
JP2015114807A (en) * | 2013-12-11 | 2015-06-22 | 株式会社日立システムズ | Data classification device, data classification method, and data classification program |
JP2016143237A (en) * | 2015-02-02 | 2016-08-08 | 株式会社イースト | Information processor |
JP6031165B1 (en) * | 2015-07-27 | 2016-11-24 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | Promising customer prediction apparatus, promising customer prediction method, and promising customer prediction program |
-
2003
- 2003-10-30 JP JP2003370808A patent/JP2005135167A/en not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007114957A (en) * | 2005-10-19 | 2007-05-10 | Toshiba Tec Corp | Merchandise information display system |
JP2010205077A (en) * | 2009-03-04 | 2010-09-16 | Mitsubishi Electric Corp | Device, and program for data integration and recording medium |
JP2015114807A (en) * | 2013-12-11 | 2015-06-22 | 株式会社日立システムズ | Data classification device, data classification method, and data classification program |
JP2016143237A (en) * | 2015-02-02 | 2016-08-08 | 株式会社イースト | Information processor |
JP6031165B1 (en) * | 2015-07-27 | 2016-11-24 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | Promising customer prediction apparatus, promising customer prediction method, and promising customer prediction program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0877010A (en) | Method and device for data analysis | |
Wang et al. | Database submission—market dynamics and user-generated content about tablet computers | |
KR20020014655A (en) | A search method in a used car search support system | |
JPWO2005024689A1 (en) | Method and apparatus for analyzing consumer purchasing behavior | |
CN112200601A (en) | Item recommendation method and device and readable storage medium | |
KR102307598B1 (en) | Product price comparison methods and systems using deep learning | |
KR101026544B1 (en) | Method and Apparatus for ranking analysis based on artificial intelligence, and Recording medium thereof | |
JPH06119309A (en) | Purchase prospect degree predicting method and customer management system | |
US20080097976A1 (en) | Method of providing product database | |
JP2005135167A (en) | Device, method, and program for data analysis | |
Wu et al. | [Retracted] Using the Mathematical Model on Precision Marketing with Online Transaction Data Computing | |
CN108345600B (en) | Management of search application, data search method and device thereof | |
JP6960553B2 (en) | Brand dictionary creation device, product evaluation device, brand dictionary creation method and program | |
CN114266594A (en) | Big data analysis method based on southeast Asia cross-border e-commerce platform | |
KR20010093522A (en) | Method for providing design report using internet and System of it | |
JP7488622B1 (en) | Information processing device and computer program | |
JP3452308B2 (en) | Data analyzer | |
JP7245967B1 (en) | Trademark support system | |
CN117035947B (en) | Agricultural product data analysis method and cloud platform based on big data processing | |
KR102588300B1 (en) | Shopping mall product exposure information provision system and method | |
JP2005092721A (en) | Device, system, and method for analyzing market information, and program | |
JP7245968B1 (en) | Trademark support system | |
JP4706688B2 (en) | Data processing apparatus, computer program thereof, and data processing method | |
KR102696245B1 (en) | System for automated product trading based on artificial intelligence | |
OgrajenSek | Use of customer data analysis in continuous quality improvement of service processes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070109 |