JP2006260052A - Keyword analysis system - Google Patents

Keyword analysis system Download PDF

Info

Publication number
JP2006260052A
JP2006260052A JP2005075505A JP2005075505A JP2006260052A JP 2006260052 A JP2006260052 A JP 2006260052A JP 2005075505 A JP2005075505 A JP 2005075505A JP 2005075505 A JP2005075505 A JP 2005075505A JP 2006260052 A JP2006260052 A JP 2006260052A
Authority
JP
Japan
Prior art keywords
input
keyword
day
period
stable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005075505A
Other languages
Japanese (ja)
Other versions
JP4504849B2 (en
Inventor
Osamu Futamura
修 二村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2005075505A priority Critical patent/JP4504849B2/en
Publication of JP2006260052A publication Critical patent/JP2006260052A/en
Application granted granted Critical
Publication of JP4504849B2 publication Critical patent/JP4504849B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a keyword analysis system correcting input data when loss is generated in input data showing a keyword inputted by a consumer and an input frequency of the keyword. <P>SOLUTION: The input data showing the inputted keyword and the input frequency of the keyword are acquired (step S10), and are stored. The keyword having small fluctuation of the input frequency is set to a stable word from the stored input data (step S11), the input frequency of the stable word is compared (step S13), and it is decided whether a loss decision target day is a loss day or not (step S14). When it is decided that it is the loss day (step S15), a total value of the input frequency of the keyword in each day of four weeks including a week wherein the loss day is present is calculated (step S16), and a correction coefficient is calculated by use of the calculated total value (step S17). By multiplying the input frequency of each the keyword in the loss day by the correction coefficient, the input frequency is corrected (step S18). <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

この発明は、消費者によりネットワーク上の検索エンジンサイト等に入力されたキーワードを分析することによって、マーケティング支援のための情報を得るキーワード分析システムに関するものである。   The present invention relates to a keyword analysis system that obtains information for marketing support by analyzing a keyword input to a search engine site on a network by a consumer.

情報通信機器の普及により、消費者はインターネット等のネットワークを利用して商品やサービスについてのデータを入手している。例えば、インターネットの検索エンジンサイトにおいて商品名等を入力することによって、その商品に関する詳細なデータを入手している。従って、日々大量の検索用のキーワードが検索エンジンサイトに入力されている。この消費者により入力された検索用のキーワード及びそのキーワードの入力回数を示すデータは、消費者の関心や潜在的な顧客ニーズ等が反映されている貴重なデータである。   With the spread of information communication equipment, consumers obtain data on products and services using a network such as the Internet. For example, by inputting a product name or the like on a search engine site on the Internet, detailed data regarding the product is obtained. Therefore, a large amount of search keywords are input to the search engine site every day. The search keyword input by the consumer and the data indicating the input frequency of the keyword are valuable data reflecting the consumer's interest, potential customer needs, and the like.

なお、消費者により入力されたキーワードを分析することにより、マーケティング支援のための情報を得るキーワード分析システムが本願の出願人により出願されている(特許文献1参照)。特許文献1記載のキーワード分析システムによれば、キーワードの入力回数の変動に基づいて、キーワードが消費者の高い関心を急激に集めている急騰キーワードであるか否かを判定することによって、マーケティング支援のための情報を得ている。   A keyword analysis system that obtains information for marketing support by analyzing a keyword input by a consumer has been filed by the applicant of the present application (see Patent Document 1). According to the keyword analysis system described in Patent Literature 1, marketing support is performed by determining whether or not the keyword is a rapidly increasing keyword that is rapidly attracting high consumer interest based on fluctuations in the number of keyword inputs. I'm getting information for.

特開2003−196301号公報Japanese Patent Laid-Open No. 2003-196301

ところで、検索用のキーワードを分析することによってマーケティング支援のための情報を得ている場合、検索をするために入力されたキーワードの正確な入力回数を示すデータが必要になる。即ち、正確な入力回数に基づいてキーワードの分析を行わなければ、分析対象となっているデータそのものに誤りが存在することになり、正確なキーワード分析を行うことができず有用なマーケティング支援のための情報を得ることができない。   By the way, when information for marketing support is obtained by analyzing a keyword for search, data indicating the exact number of times the keyword has been input for searching is required. In other words, if the keyword is not analyzed based on the exact number of inputs, there will be an error in the data being analyzed, and accurate keyword analysis cannot be performed for useful marketing support. Can't get the information.

しかし、検索エンジンサイトにおける検索件数等を示すログデータを記憶する件数ログ蓄積用等のサーバで発生したシステム障害等により、検索用のキーワード及び該キーワードの入力回数を示すデータ(入力データ)に欠損が生じる場合がある。即ち、サーバにおいては、システム障害、例えば、サーバの処理能力を超える多量のデータが入力され、サーバの機能が一時的に停止した場合や、サーバを構成するハード機器の故障等によるサーバの機能停止等が発生する場合がある。このような場合には、例えば、サーバが機能停止状態に陥っている間に入力されたキーワードは、入力回数がカウントされない状態になり、サーバにおいて入力データが正確に記憶されず、入力データの欠損が発生する。サーバにシステム障害が発生していた間の入力データは、障害発生時に消費者等により入力されたデータであり、後において再度取得する等の処理を行うことが不可能なデータである。その一方、例えば、1日毎の入力データを蓄積している等の場合には、システム障害の発生により入力データの欠損が生じた日(欠損日)が存在してしまい、入力データの連続性が阻害され、連続性を有する入力データを用いたキーワード分析を正確には行うことができないという問題がある。   However, the search keyword and the data (input data) indicating the number of input of the keyword are missing due to a system failure that occurred in the server for storing the log data indicating the number of search data etc. in the search engine site. May occur. In other words, in the server, when a large amount of data exceeding the server's processing capacity is input, for example, when the server's function is temporarily stopped, or when the server's function is stopped due to a failure of the hardware equipment that constitutes the server. Etc. may occur. In such a case, for example, a keyword input while the server is in a function stop state is in a state where the input count is not counted, the input data is not accurately stored in the server, and the input data is lost. Occurs. The input data during the occurrence of the system failure in the server is data input by a consumer or the like when the failure occurs, and cannot be processed again such as later acquisition. On the other hand, for example, when the input data for each day is accumulated, there is a day (missing day) when the input data is lost due to the occurrence of the system failure, and the continuity of the input data is increased. There is a problem that the keyword analysis using the input data that is obstructed and has continuity cannot be performed accurately.

この発明の課題は、消費者により入力されたキーワード及び該キーワードの入力回数を示すデータに欠損が生じた場合であっても、的確なキーワード分析を行うことができるように入力データを補正するキーワード分析システムを提供することである。   The subject of this invention is the keyword which correct | amends input data so that an exact keyword analysis can be performed even if it is a case where the defect | deletion arises in the data which show the keyword inputted by the consumer, and the input frequency of this keyword. To provide an analysis system.

請求項1記載のキーワード分析システムは、入力されたキーワード及び第1の所定期間毎における前記キーワードの入力回数を記憶する入力データ記憶手段と、前記入力データ記憶手段に記憶されているキーワードの中から、所定のキーワードを安定ワードとして設定する安定ワード設定手段と、前記第1の所定期間を含む第2の所定期間内における、該第1の所定期間毎の前記安定ワードの入力回数を比較する入力回数比較手段と、前記入力回数比較手段により入力回数を比較した結果、前記安定ワードの入力回数が、前記第2の所定期間に含まれる他の前記第1の所定期間内における入力回数と比較して、所定割合以上減少している前記第1の所定期間を、入力欠損期間と判定する入力欠損期間判定手段と、前記入力欠損期間を含む第3の所定期間内における、前記第1の所定期間毎の前記各キーワードの入力回数の合計値を算出する合計値算出手段と、前記合計値算出手段により算出された前記第1の所定期間毎の前記合計値を用いて、前記入力欠損期間における入力回数の補正係数を算出する補正係数算出手段と、前記入力欠損期間に入力された各キーワードの入力回数と、前記補正係数算出手段により算出された前記補正係数とを用いて、該入力欠損期間における各キーワードの入力回数を補正する補正手段とを備えることを特徴とする。   The keyword analysis system according to claim 1 includes: an input data storage unit that stores an input keyword and the number of times the keyword is input every first predetermined period; and a keyword stored in the input data storage unit. The stable word setting means for setting a predetermined keyword as a stable word and an input for comparing the number of times the stable word is input for each first predetermined period within a second predetermined period including the first predetermined period. As a result of comparing the number of times of input by the number of times comparison means and the number of times of input comparison, the number of times of input of the stable word is compared with the number of times of input in the other first predetermined period included in the second predetermined period. Input missing period determining means for determining the first predetermined period, which has decreased by a predetermined percentage or more, as an input missing period, and a third including the input missing period Total value calculation means for calculating a total value of the number of times each keyword is input for each first predetermined period within a predetermined period, and the total for each first predetermined period calculated by the total value calculation means Correction coefficient calculation means for calculating a correction coefficient for the number of times of input in the input deficiency period using the value, the number of times of input of each keyword input in the input deficiency period, and the correction calculated by the correction coefficient calculation means Correction means for correcting the number of input times of each keyword in the input deficient period using a coefficient.

この請求項1記載のキーワード分析システムによれば、所定のキーワードを安定ワードとして、即ち、経験的に入力回数の変動が少なく、入力回数が安定していることが知られているキーワード、例えば、インターネット等のネットワーク利用者に馴染みが深い言葉等を安定ワードとして設定する。次に、任意の第1の所定期間、例えば、任意の1日(欠損判定対象日)における安定ワードの入力回数と、欠損判定対象日を含む第2の所定期間に含まれる他の日、例えば、欠損判定対象日を含む3日間において、欠損判定対象日の前後の日における安定ワードの入力回数とを比較する。次に、欠損判定対象日における安定ワードの入力回数が、欠損判定対象日の前後の日における安定ワードの入力回数と比べて所定割合以上減少している場合には、欠損判定対象日を入力欠損期間(欠損日)と判定し、入力欠損期間を含む第3の所定期間、例えば、欠損日を含む4週間内における1日毎のキーワードの入力回数の合計値を算出する。そして、算出された合計値を用いて入力欠損期間におけるキーワードの入力回数を補正する際に用いる補正係数を算出し、算出された補正係数及び入力欠損期間におけるキーワードの入力回数を用いて各キーワードの入力回数を補正する。従って、入力欠損期間におけるキーワードの入力回数を、入力欠損期間の周辺日、例えば、欠損日が存在する週を含む4週間の各日におけるキーワードの入力回数の合計値を用いて適切に補正することができるため、サーバにおけるシステム障害の発生等により、入力データに欠損が生じていた場合であっても、正確なキーワード分析を行うことができる。   According to the keyword analysis system of claim 1, a predetermined keyword is a stable word, that is, a keyword that is empirically known to have a small variation in the number of inputs and that the number of inputs is stable, for example, Set words that are familiar to network users such as the Internet as stable words. Next, other days included in the second predetermined period including the number of times of input of the stable word in any first predetermined period, for example, any one day (missing determination target day) and the missing determination target day, for example, In the three days including the defect determination target date, the number of times the stable word is input on the days before and after the defect determination target date is compared. Next, if the number of stable word inputs on the missing date is less than a predetermined percentage compared to the number of stable words entered on the days before and after the missing date, enter the missing date as the missing date. It is determined as a period (missing date), and a total value of the number of keyword inputs per day within a third predetermined period including the missing input period, for example, four weeks including the missing date is calculated. Then, using the calculated total value, a correction coefficient used when correcting the number of keyword inputs in the input deficit period is calculated, and using the calculated correction coefficient and the number of keyword inputs in the input deficit period, Correct the number of inputs. Accordingly, the number of keyword inputs in the input deficit period is appropriately corrected using the total value of the keyword input counts for each day of the four weeks including the week in which the missing date exists, for example, the days around the input deficit period. Therefore, accurate keyword analysis can be performed even when the input data is deficient due to a system failure or the like in the server.

また、請求項2記載のキーワード分析システムは、前記安定ワード設定手段が、前記入力データ記憶手段に記憶されている前記第1の所定期間毎の前記キーワードの入力回数に基づいて、第4の所定期間毎の前記入力回数の移動平均を計算する移動平均算出手段と、前記移動平均算出手段により算出された前記移動平均を記憶する移動平均記憶手段とを備え、前記移動平均記憶手段に記憶された前記移動平均の変動が所定割合以下であるキーワードを、前記安定ワードとして設定することを特徴とする。   The keyword analysis system according to claim 2, wherein the stable word setting unit is configured to perform a fourth predetermined determination based on the number of times the keyword is input every first predetermined period stored in the input data storage unit. A moving average calculating means for calculating a moving average of the number of times of input for each period; and a moving average storing means for storing the moving average calculated by the moving average calculating means, and stored in the moving average storing means A keyword having a moving average variation equal to or less than a predetermined ratio is set as the stable word.

この請求項2記載のキーワード分析システムによれば、キーワードの移動平均の変動が所定割合以下であるキーワードを安定ワードとして設定している。即ち、曜日による入力回数の変動を排除すべく第4の所定期間毎、例えば、7日間毎の移動平均を算出し、算出された移動平均の変動が所定割合以下であるキーワードを安定ワードとして設定することができる。従って、例えば、過去の入力データが充分に蓄積されている場合には、過去の入力データを用いて適切なキーワードを安定ワードとして設定し、欠損判定対象日が入力欠損期間か否かの判定を適切に行うことができる。   According to the keyword analysis system of the second aspect, keywords whose moving average fluctuations are not more than a predetermined ratio are set as stable words. In other words, a moving average is calculated every fourth predetermined period, for example, every seven days, to eliminate fluctuations in the number of times of input depending on the day of the week, and keywords whose fluctuations in the calculated moving average are less than a predetermined ratio are set as stable words. can do. Therefore, for example, when past input data is sufficiently accumulated, an appropriate keyword is set as a stable word using the past input data, and it is determined whether or not the deficiency determination target date is an input deficiency period. Can be done appropriately.

また、請求項3記載のキーワード分析システムは、前記入力欠損期間判定手段が、前記安定ワード設定手段により複数の前記安定ワードが設定された場合に、少なくとも2つ以上の前記安定ワードの入力回数が所定割合以上減少している第1の所定期間を、前記入力欠損期間として判定することを特徴とする。   The keyword analysis system according to claim 3, wherein when the plurality of stable words are set by the stable word setting unit, the input missing period determination unit has at least two input times of the stable word. A first predetermined period that decreases by a predetermined ratio or more is determined as the input deficient period.

この請求項3記載のキーワード分析システムによれば、少なくとも2つ以上の安定ワードの入力回数が所定割合以上減少している第1の所定期間を入力欠損期間として判定している。即ち、マスコミ等の報道により、あるキーワードの入力回数が急激に増加する場合は多いが、入力回数が安定しているキーワード(安定ワード)の入力回数が急激に減少することは殆どない。更に、複数の安定ワードの入力回数が急激に減少することは、サーバが正常に機能している状態では殆ど発生し得ない状況である。従って、複数の安定ワードの入力回数が同時に所定割合以上減少しているか否かに基づいて入力欠損期間を判定することにより、高い精度で入力欠損期間か否かの判定を行うことができる。   According to the keyword analysis system of the third aspect, the first predetermined period in which the number of times of input of at least two or more stable words is decreased by a predetermined ratio or more is determined as the input missing period. That is, there are many cases where the number of times of input of a certain keyword increases abruptly due to media reports or the like, but the number of times of input of a keyword (stable word) in which the number of input is stable rarely decreases rapidly. Furthermore, a sudden decrease in the number of inputs of a plurality of stable words is a situation that can hardly occur when the server is functioning normally. Therefore, by determining the input missing period based on whether or not the number of times of inputting a plurality of stable words is simultaneously decreased by a predetermined ratio or more, it is possible to determine whether or not the input missing period is highly accurate.

また、請求項4記載のキーワード分析システムは、前記合計値算出手段が、前記入力データ記憶手段に記憶されている前記第1の所定期間内に入力されたキーワードの内、前記入力回数の合計値を算出する際に除外するキーワードを判定する閾値を設定する閾値設定手段を備え、前記閾値設定手段により設定された前記閾値に基づいて除外すると判定されたキーワードを除く、前記入力データ記憶手段に記憶されている前記第1の所定期間内に入力された前記各キーワードの入力回数を合算して前記合計値を算出することを特徴とする。   The keyword analysis system according to claim 4, wherein the total value calculation means includes a total value of the number of times of input among the keywords input within the first predetermined period stored in the input data storage means. Threshold value setting means for setting a threshold value for determining a keyword to be excluded when calculating the threshold value is stored in the input data storage means except for the keyword determined to be excluded based on the threshold value set by the threshold value setting means. The total value is calculated by adding together the number of times of input of each of the keywords input within the first predetermined period.

この請求項4記載のキーワード分析システムによれば、設定された閾値に基づいて除外されたキーワード以外のキーワードを用いて、入力回数の合計値を算出している。例えば、入力データとして、第1の所定期間(例えば、1日)に入力されたキーワード及び各キーワードの入力回数が、入力回数が多い順に上位1万位まで記憶されているとする。この場合に、閾値として101が設定されている場合には、上位1位〜100位までのキーワードを除外して入力回数の合計値が算出される。即ち、上位1位〜100位までのキーワードは、マスコミ等の報道やイベントの発生等により急激に入力回数が増加するキーワードであり、一時的に注目されているキーワードである可能性が高い。そのため、マスコミ等の報道により一時的に注目されているキーワードを除外して合計値を算出すべく、閾値として設定された順位以下の順位のキーワードを用いて入力回数の合計値を算出している。従って、一時的に注目されているキーワードによる入力回数の合計値の変動を排除して入力回数の合計値を算出し、高い精度で補正係数を算出することができるため、高い精度で入力欠損期間における入力回数の補正を行うことができる。   According to the keyword analysis system of the fourth aspect, the total number of times of input is calculated using keywords other than the excluded keywords based on the set threshold value. For example, as input data, it is assumed that keywords input during a first predetermined period (for example, one day) and the number of input times of each keyword are stored up to the top 10,000 in descending order of input times. In this case, if 101 is set as the threshold value, the total number of times of input is calculated by excluding the top 1 to 100 keywords. In other words, the top 1 to 100 keywords are keywords whose number of inputs increases rapidly due to media reports or the occurrence of events, and are likely to be temporarily focused keywords. Therefore, in order to calculate the total value by excluding keywords that are temporarily attracted by media reports, etc., the total value of the number of times of input is calculated using keywords that are ranked below the threshold set as the threshold. . Therefore, it is possible to calculate the correction coefficient with high accuracy by calculating the total value of the input frequency by eliminating the fluctuation of the total value of the input frequency due to the keyword that is temporarily attracting attention. The number of inputs can be corrected.

また、請求項5記載のキーワード分析システムは、前記キーワード及び該キーワードの入力回数が、消費者によって電子的手段を介してサーバに入力され該サーバに記憶されているデータであって、前記サーバから、前記第1の所定期間毎に前記キーワード及び該キーワードの入力回数を取得する入力データ取得手段を更に備えることを特徴とする。   The keyword analysis system according to claim 5, wherein the keyword and the number of times the keyword is input are data that is input to a server by a consumer via electronic means and stored in the server. The method further comprises input data acquisition means for acquiring the keyword and the number of times the keyword is input every first predetermined period.

この請求項5記載のキーワード分析システムによれば、所定期間毎に、消費者によってサーバに入力されたキーワード及び該キーワードの入力回数を取得しているため、消費者の関心やニーズ等を的確に反映したデータを得ることができると共に、取得された入力データに欠損が生じている場合には、キーワードの入力回数を補正しているため、正確なデータを用いて適切なキーワード分析を行うことができる。   According to the keyword analysis system of the fifth aspect, since the keyword input to the server by the consumer and the number of times the keyword is input are acquired every predetermined period, the consumer's interests and needs are accurately determined. The reflected data can be obtained, and if the acquired input data is deficient, the keyword input count is corrected, so appropriate keyword analysis can be performed using accurate data. it can.

この発明に係るキーワード分析システムによれば、サーバにおけるシステム障害の発生等により、入力データに欠損が生じた場合であっても、キーワードの入力回数を適切に補正しているため、正確なキーワード分析を行うことができる。従って、適切に補正された入力データを用いて正確なキーワード分析を行うことにより、消費者のニーズや消費者の関心を分析し、例えば、商品の販売戦略や、販売開始時期、商品の仕入れ量等を決定する等、マーケティング支援のために有用な情報を得ることができる。   According to the keyword analysis system of the present invention, even if the input data is deficient due to the occurrence of a system failure or the like in the server, the keyword input count is appropriately corrected. It can be performed. Therefore, by performing accurate keyword analysis using appropriately corrected input data, we analyze consumer needs and consumer interests, for example, product sales strategy, sales start time, product purchases, etc. It is possible to obtain useful information for marketing support, such as determining the etc.

以下、図面を参照してこの発明の実施の形態に係るキーワード分析システムについて説明する。なお、以下においては、インターネット上に開設されている検索エンジンサイトにおいて、消費者により入力された検索用のキーワード及び該キーワードの入力回数を処理対象とする場合を例として説明する。   Hereinafter, a keyword analysis system according to an embodiment of the present invention will be described with reference to the drawings. In the following, an example will be described in which a search keyword input by a consumer and the number of times the keyword is input are processed in a search engine site established on the Internet.

図1は、実施の形態に係るキーワード分析システムを含むシステム全体のブロック構成図である。キーワード分析システム2は、ネットワーク4を介してネットワーク上に検索エンジンサイトを開設している企業のWebサーバ6と接続されており、Webサーバ6は、ネットワーク4を介して個々の消費者が有する消費者システム(パーソナルコンピュータ、携帯端末、携帯電話等のネットワーク上の検索エンジンサイトにアクセス可能な端末)8a、8b、8cと接続されている。   FIG. 1 is a block diagram of the entire system including the keyword analysis system according to the embodiment. The keyword analysis system 2 is connected to a Web server 6 of a company that has established a search engine site on the network via the network 4, and the Web server 6 is consumed by each consumer via the network 4. Connected to a search engine site on a network such as a personal computer, a mobile terminal, or a mobile phone 8a, 8b, 8c.

キーワード分析システム2は、図1に示すように、キーワード分析システム2における処理を制御するデータ制御部20を備え、データ制御部20には、Webサーバ6から取得されたキーワード及び該キーワードの入力回数を記憶する入力データ記憶部22が接続されている。また、データ制御部20には、Webサーバ6との間の通信を制御する通信制御部24、キーワードの分析結果等を表示する表示部26及びキーワードの分析結果等を記憶するデータ記憶部28が接続されている。   As shown in FIG. 1, the keyword analysis system 2 includes a data control unit 20 that controls processing in the keyword analysis system 2, and the data control unit 20 includes a keyword acquired from the Web server 6 and the number of times the keyword is input. Is connected to the input data storage unit 22. The data control unit 20 includes a communication control unit 24 that controls communication with the Web server 6, a display unit 26 that displays keyword analysis results and the like, and a data storage unit 28 that stores keyword analysis results and the like. It is connected.

入力データ記憶部22には、入力データ、即ち、キーワード及び該キーワードの入力回数を示すデータが記憶されている。この入力データは、通信制御部24を介してWebサーバ6から所定期間(第1の所定期間)毎、例えば、1日毎に取得されるデータであり、各キーワード及び該キーワードの入力回数は、キーワードが入力された日付に対応させて記憶されている。例えば、図2に示すように、2004年11月16日における「台風情報」の入力回数「168,260」、「台風」の入力回数「121,013」、「気象庁」の入力回数「85,881」等である。なお、図2における「ワードA」〜「ワードI」は、固有名詞等を示すキーワードである。   The input data storage unit 22 stores input data, that is, data indicating a keyword and the number of times the keyword is input. The input data is data acquired from the Web server 6 via the communication control unit 24 every predetermined period (first predetermined period), for example, every day. Each keyword and the number of times the keyword is input are Is stored in correspondence with the input date. For example, as shown in FIG. 2, “typhoon information” input times “168, 260”, “typhoon” input times “121,013”, and “meteorological agency” input times “85, 881 "and the like. Note that “word A” to “word I” in FIG. 2 are keywords indicating proper nouns and the like.

図2に示す「安定ワード」は、任意の日が入力データの欠損が生じた日であるか否か、即ち、任意の日(欠損判定対象日)が欠損日(入力欠損期間)であるか否かを判定する際に用いられるキーワードである。この「安定ワード」は、過去の入力データから入力回数の変動が少ないことが経験的に知られている等のキーワードであり、一般的には、インターネット等のネットワーク利用者に馴染みが深い言葉、例えば、特定のWebサイトの名称、特定の検索エンジンの名称、交通機関の名称等が該当する。なお、欠損日とは、サーバ6において発生したシステム障害等により、消費者により入力されたキーワード及び該キーワードの入力回数が正常に記録されていない日を示す。   The “stable word” shown in FIG. 2 indicates whether or not an arbitrary date is a date on which a loss of input data has occurred, that is, whether an arbitrary day (a date for determining a loss) is a lost date (an input loss period). It is a keyword used when determining whether or not. This “stable word” is a keyword that is empirically known from the past input data that the number of input changes is small, and is generally a word familiar to network users such as the Internet, For example, the name of a specific Web site, the name of a specific search engine, the name of a transportation facility, and the like are applicable. The missing date indicates a date when the keyword input by the consumer and the number of times the keyword is input are not normally recorded due to a system failure or the like occurring in the server 6.

次に、図3のフローチャートを参照して、欠損日か否かを判定し、欠損日であると判定された場合には、欠損日に入力されたキーワードの入力回数を補正する処理について説明する。なお、キーワードの入力は、サーバ6により管理されている検索エンジンサイトを利用している消費者により行われる。即ち、消費者が、消費者システム8a、8b、8cを用いて、ネットワーク4を介して検索エンジンサイトにアクセスし、検索用のキーワードを入力した場合、この入力された検索用のキーワードがWebサーバ6に記憶される。即ち、この消費者により入力された検索用のキーワードは、1回入力されると入力回数1回としてカウントされ、キーワードと各キーワードの入力回数が入力データとしてWebサーバ6に記憶される。   Next, with reference to the flowchart of FIG. 3, it is determined whether or not the date is a missing date, and when it is determined that the date is a missing date, a process for correcting the number of times the keyword entered on the missing date will be described. . The keyword is input by a consumer who uses a search engine site managed by the server 6. That is, when a consumer accesses a search engine site through the network 4 using the consumer systems 8a, 8b, and 8c and inputs a search keyword, the input search keyword is stored in the Web server. 6 is stored. That is, when the keyword for search input by the consumer is input once, it is counted as the number of times of input, and the keyword and the number of times of input of each keyword are stored in the Web server 6 as input data.

キーワード分析システム2においては、Webサーバ6に記憶されている入力データを、通信制御部24を介して1日毎(第1の所定期間毎)に取得する(ステップS10、図3参照)。即ち、Webサーバ6に記憶されている入力データのうち、1日の入力回数が多い順番に上位10万位までの入力データが1日に1回、Webサーバ6からキーワード分析システム2に対して送信されることによって、キーワードと各キーワードの入力回数がキーワード分析システム2において取得される。なお、取得されたキーワードと各キーワードの入力回数は、入力データとして入力データ記憶部22に記憶される(図2参照)。   In the keyword analysis system 2, the input data stored in the Web server 6 is acquired every day (every first predetermined period) via the communication control unit 24 (see step S10, FIG. 3). That is, among the input data stored in the Web server 6, the input data up to the top 100,000 are input from the Web server 6 to the keyword analysis system 2 once a day in the descending order of the number of inputs per day. By transmitting the keyword, the keyword analysis system 2 acquires the keyword and the input count of each keyword. The acquired keywords and the number of times each keyword is input are stored as input data in the input data storage unit 22 (see FIG. 2).

次に、入力データ記憶部22に記憶されている入力データに基づいて、安定ワードを設定する(ステップS11)。以下、図面を参照して安定ワードを設定する処理について説明する。なお、以下においては、入力データ記憶部22に2001年9月1日〜2005年2月1日の1日毎の入力データが記憶されている場合を例として、安定ワードを設定する処理について説明する。   Next, a stable word is set based on the input data stored in the input data storage unit 22 (step S11). Hereinafter, processing for setting a stable word will be described with reference to the drawings. In the following, a process for setting a stable word will be described by taking as an example a case in which input data for each day from September 1, 2001 to February 1, 2005 is stored in the input data storage unit 22. .

まず、入力データ記憶部22に記憶されている入力データの中から、安定ワードの候補となるキーワード(安定ワード候補)を抽出する(ステップS20、図4参照)。この安定ワード候補は、例えば、1年以上の期間において常に上位100位以内の順位を示すキーワードであること等の条件を設定することによって抽出される。なお、以下においては、安定ワード候補として、「ワード1」、「ワード2」、「ワード3」及び「ワード4」の4つのキーワードが抽出された場合を例として説明する。   First, keywords (stable word candidates) that are candidates for stable words are extracted from the input data stored in the input data storage unit 22 (see step S20, FIG. 4). This stable word candidate is extracted by setting a condition such as being a keyword that always shows a rank within the top 100 in a period of one year or more. In the following, a case where four keywords “word 1”, “word 2”, “word 3”, and “word 4” are extracted as stable word candidates will be described as an example.

次に、ステップS20において抽出された安定ワード候補の第4の所定期間、例えば、7日間毎の日々移動平均を算出する(ステップS21)。即ち、消費者により入力されるキーワードと、その入力回数は、一般的に、曜日により変動することが知られているため、曜日毎の周期的な変動を排除すべく、各安定ワード候補について7日間毎の日々移動平均(7日間日々移動平均)を算出する。例えば、2001年9月25日〜10月1日の7日間における入力回数の合計値を算出し、算出された合計値を7で除算することにより、2001年10月1日における7日間日々移動平均を算出する。同様に、2001年9月26日〜10月2日の7日間における入力回数を用いて2001年10月2日における7日間日々移動平均を、2001年9月27日〜10月3日の7日間における入力回数を用いて2001年10月3日における7日間日々移動平均を算出し、2001年10月1日〜2005年2月1日の期間における各安定ワード候補の7日間日々移動平均を算出する。なお、算出された各安定ワード候補の7日間日々移動平均の値は、日付(7日目の日付)に対応させてデータ記憶部28に記憶される。   Next, a daily moving average is calculated for a fourth predetermined period of stable word candidates extracted in step S20, for example, every 7 days (step S21). That is, since it is known that the keyword inputted by the consumer and the number of times of the input are generally changed depending on the day of the week, in order to eliminate the periodic fluctuation for each day of the week, 7 for each stable word candidate. The daily moving average for each day (7-day daily moving average) is calculated. For example, by calculating the total number of inputs for 7 days from September 25th to October 1st, 2001, and dividing the calculated total value by 7, the daily movement for 7 days on October 1, 2001 Calculate the average. Similarly, the 7-day daily moving average on October 2, 2001, using the number of inputs for the seven days from September 26, 2001 to October 2, 2001, is set to 7 on September 27, 2001 to October 3, 2001. Calculate the 7-day daily moving average on October 3, 2001 using the number of inputs in the day, and calculate the 7-day daily moving average of each stable word candidate for the period from October 1, 2001 to February 1, 2005. calculate. Note that the calculated 7-day daily moving average value of each stable word candidate is stored in the data storage unit 28 in association with the date (the date of the seventh day).

次に、ステップS21において算出された7日間日々移動平均の値を用い、所定の日から1年間遡った期間における7日間日々移動平均の最低値を求める(ステップS22)。即ち、所定の日を2002年10月1日とした場合には、2001年10月2日〜2002年10月1日の期間における7日間日々移動平均の最低値を求める。同様に、所定の日を2002年10月2日とした場合、所定の日を2002年10月3日とした場合というように、2002年10月1日〜2005年2月1日までの各日からそれぞれ1年間遡った期間における7日間日々移動平均の最低値を各安定ワード候補について求める。なお、求められた各安定ワード候補の7日間日々移動平均の最低値は、安定ワード候補毎に所定の日の日付に対応させて、例えば、2002年10月1日から1年間遡った期間における最低値は、2002年10月1日に対応させてデータ記憶部28に記憶される。   Next, using the value of the 7-day daily moving average calculated in step S21, the minimum value of the 7-day daily moving average in a period that goes back one year from a predetermined date is obtained (step S22). That is, when the predetermined date is October 1, 2002, the minimum value of the 7-day daily moving average in the period from October 2, 2001 to October 1, 2002 is obtained. Similarly, when the predetermined date is October 2, 2002, the predetermined date is October 3, 2002, and so on, from October 1, 2002 to February 1, 2005. For each stable word candidate, the lowest value of the 7-day daily moving average in a period that goes back one year from the date is obtained. Note that the minimum value of the 7-day daily moving average of each stable word candidate obtained is associated with the date of a predetermined day for each stable word candidate, for example, in a period that goes back one year from October 1, 2002. The minimum value is stored in the data storage unit 28 in correspondence with October 1, 2002.

次に、ステップS21において算出された7日間日々移動平均の値を用い、所定の日から1年間遡った期間における7日間日々移動平均の最高値を求める(ステップS23)。即ち、上述のステップS22における処理と同様の処理により、2002年10月1日〜2005年2月1日の各日からそれぞれ1年間遡った期間における7日間日々移動平均の最高値を各安定ワード候補について求める。なお、求められた各安定ワード候補の7日間日々移動平均の最高値は、最低値と共に安定ワード候補毎に所定の日の日付に対応させてデータ記憶部28に記憶される。   Next, using the value of the 7-day daily moving average calculated in step S21, the highest value of the 7-day daily moving average in a period that goes back one year from the predetermined date is obtained (step S23). That is, by performing the same process as the process in step S22 described above, the maximum value of the 7-day daily moving average is obtained for each stable word in the period that goes back one year from each day from October 1, 2002 to February 1, 2005. Ask for candidates. The maximum value of the 7-day daily moving average of each stable word candidate obtained is stored in the data storage unit 28 in association with the date of a predetermined day for each stable word candidate together with the minimum value.

次に、ステップS22において算出された7日間日々移動平均の最低値と、ステップS23において算出された7日間日々移動平均の最高値とを用いて安定ワード判定指数を算出する(ステップS24)。即ち、データ記憶部28において、安定ワード候補毎に同一の日付に対応させて記憶されている7日間日々移動平均の最高値を最低値で除算することにより、それぞれの日における各安定ワード候補の安定ワード判定指数を算出する。なお、算出された各安定ワード候補の安定ワード判定指数は日付に対応させてデータ記憶部28に記憶される。   Next, a stable word determination index is calculated using the lowest value of the 7-day daily moving average calculated in step S22 and the highest value of the 7-day daily moving average calculated in step S23 (step S24). That is, in the data storage unit 28, by dividing the highest value of the moving average for 7 days stored corresponding to the same date for each stable word candidate by the lowest value, each stable word candidate for each day is divided. A stable word determination index is calculated. The calculated stable word determination index of each stable word candidate is stored in the data storage unit 28 in association with the date.

次に、ステップS24において算出された安定ワード判定指数に基づいて、安定ワード候補が安定ワードに適しているか否かについての判定を行う(ステップS25)。即ち、データ記憶部28に記憶されている安定ワード判定指数の変動が所定の範囲内か否かに基づいて判定を行う。   Next, based on the stable word determination index calculated in step S24, it is determined whether the stable word candidate is suitable for the stable word (step S25). That is, the determination is made based on whether or not the fluctuation of the stable word determination index stored in the data storage unit 28 is within a predetermined range.

図5は、安定ワード判定指数の変動を示すグラフの一例を示す図である。図5においては、「ワード1」〜「ワード4」の4つの安定ワード候補の安定ワード判定指数の変動を示すグラフが示されている。ここで、安定ワード判定指数の値が大きければ大きいほど、7日間日々移動平均の最低値と最高値との差が大きいことになり、入力回数の変動が大きいことを示している。従って、安定ワード判定指数の値が小さければ小さい程、7日間日々移動平均の最低値と最高値との差が小さく、入力回数の変動が小さく安定していることを示している。そのため、図5に示すグラフから、例えば、安定ワード判定指数の値が予め閾値として設定された所定の値、例えば、「2」より小さい値を所定期間以上保持しているか否かにより、何れの安定ワード候補が安定ワードに適しているか否かが判定される。   FIG. 5 is a diagram illustrating an example of a graph showing fluctuations in the stable word determination index. FIG. 5 shows a graph showing fluctuations in the stable word determination indexes of the four stable word candidates “word 1” to “word 4”. Here, the larger the value of the stable word determination index, the larger the difference between the minimum value and the maximum value of the moving average for 7 days, indicating that the fluctuation of the number of inputs is large. Therefore, the smaller the value of the stable word determination index, the smaller the difference between the minimum value and the maximum value of the moving average for 7 days, indicating that the fluctuation in the number of inputs is small and stable. Therefore, from the graph shown in FIG. 5, for example, depending on whether or not the value of the stable word determination index is held in advance as a threshold, for example, a value smaller than “2” is held for a predetermined period or more, It is determined whether the stable word candidate is suitable for the stable word.

例えば、「ワード1」の安定ワード判定指数の値は、2002年10月1日〜2005年2月1日の期間を通じて閾値「2」よりも小さくなっており、入力回数の変動が少なく安定ワードに適していると判定される。また、「ワード2」の安定ワード判定指数の値も、2002年10月1日〜2005年2月1日の期間を通じて閾値「2」よりも小さな値を示しており、「ワード1」と同様に入力回数の変動が少なく安定ワードに適していると判定される。一方、「ワード3」の安定ワード判定指数の値は、2002年10月1日〜2003年7月頃までは閾値「2」よりも小さな値を示しているものの、2003年7月以降、2004年7月頃までの間は閾値「2」以上の値を示し、その後、2004年7月以降、2005年2月1日までの間は再び閾値「2」よりも小さな値を示している。従って、「ワード3」は、2003年7月以降、2004年7月頃までの間は入力回数の変動が大きく安定ワードに適していなかったが、少なくとも2004年7月以降は入力回数の変動が少なくなっており、安定ワードとして用いることが可能なキーワードであると判定される。同様に、「ワード4」の安定ワード判定指数の値は、2002年10月1日〜2003年2月頃までは閾値「2」以上の値を、2003年2月以降、2004年6月頃までの間は閾値「2」よりも小さな値を、2004年6月以降、2005年2月1日までの間は再び閾値「2」以上の値をそれぞれ示している。従って、「ワード4」は、2003年2月以降、2004年6月頃までの間は入力回数の変動が小さかったが、それ以前及びその後は入力回数の変動が大きくなっており、安定ワードには適していないと判定される。   For example, the value of the stable word determination index of “word 1” is smaller than the threshold value “2” throughout the period from October 1, 2002 to February 1, 2005. Is determined to be suitable. Also, the value of the stable word determination index of “Word 2” is smaller than the threshold value “2” throughout the period from October 1, 2002 to February 1, 2005, and is the same as “Word 1”. Therefore, it is determined that the number of times of input is small and suitable for a stable word. On the other hand, the stable word determination index value of “Word 3” is smaller than the threshold value “2” from October 1, 2002 to around July 2003, but since July 2003, 2004 The value up to about July is a value equal to or higher than the threshold value “2”, and thereafter, from July 2004 to February 1, 2005, the value is again smaller than the threshold value “2”. Therefore, “word 3” was not suitable for a stable word since July 2003 and until around July 2004, and was not suitable for a stable word. However, at least after July 2004, the fluctuation of the number of inputs was small. It is determined that the keyword can be used as a stable word. Similarly, the value of the stable word determination index of “Word 4” is a threshold value “2” or more from October 1, 2002 to around February 2003, and from February 2003 to around June 2004. The interval is a value smaller than the threshold “2”, and from June 2004 to February 1, 2005, the value is again greater than the threshold “2”. Therefore, “word 4” had a small variation in the number of inputs from February 2003 to around June 2004, but before and after that, the variation in the number of inputs was large. It is determined that it is not suitable.

次に、ステップS25における判定結果に基づいて、安定ワード候補の中の何れかのキーワードを安定ワードとして設定する(ステップS26)。例えば、閾値として「2」が設定されている場合には、ステップS25における判定結果より、安定ワード判定指数の値が閾値「2」よりも小さな値を常に示している「ワード1」及び「ワード2」が安定ワードとしてデータ記憶部28に記憶され安定ワードが設定される。   Next, based on the determination result in step S25, any keyword in the stable word candidates is set as a stable word (step S26). For example, when “2” is set as the threshold value, “word 1” and “word” in which the value of the stable word determination index always indicates a value smaller than the threshold value “2” based on the determination result in step S25. 2 ”is stored in the data storage unit 28 as a stable word, and the stable word is set.

次に、ステップS11(図4に示すフローチャートのステップS20〜ステップS26)において設定された安定ワードを、入力データ記憶部22に記憶されている入力データの中から抽出する(ステップS12、図3参照)。   Next, the stable word set in step S11 (steps S20 to S26 in the flowchart shown in FIG. 4) is extracted from the input data stored in the input data storage unit 22 (see step S12 and FIG. 3). ).

次に、欠損日か否かの判定対象である欠損判定対象日を含む所定期間(第2の所定期間)、例えば、欠損判定対象日と、該欠損判定対象日の前後の日とを含む3日間のそれぞれの日における安定ワードの入力回数を比較する(ステップS13)。例えば、欠損判定対象日が2004年11月17日である場合には、欠損判定対象日の前日(2004年11月16日、以下「16日」とする。)における安定ワードの入力回数、欠損判定対象日(2004年11月17日、以下「17日」とする。)における安定ワードの入力回数、欠損判定対象日の次の日(2004年11月18日、以下「18日」とする。)における安定ワードの入力回数をそれぞれ比較する。以下、図2を参照して入力回数の比較処理について説明する。   Next, a predetermined period (second predetermined period) including a defect determination target date that is a determination target of whether or not it is a defect date, for example, a defect determination target day and days before and after the defect determination target date 3 The number of times the stable word is input on each day of the day is compared (step S13). For example, when the defect determination target date is November 17, 2004, the number of stable word inputs on the day before the defect determination target date (November 16, 2004, hereinafter referred to as “16 days”), The number of times the stable word is input on the determination target date (November 17, 2004, hereinafter referred to as “17th”), and the next day (November 18, 2004, hereinafter referred to as “18th”). .) Are compared with the number of times the stable word is input. Hereinafter, the input count comparison process will be described with reference to FIG.

図2は、2004年11月16日〜18日のそれぞれの日における入力データ、即ち、消費者により入力されたキーワード及び該キーワードの入力回数の一例を示す図である。図2においては、それぞれの日において入力回数が多い順に、上位15位までのキーワード及び該キーワードの入力回数を一覧形式で示している。ここで、16日〜18日の3日間全ての日において上位15位に入っている安定ワードは、図2に示すように「安定ワード1」と、「安定ワード2」の2つである。従って、この場合には、16日における「安定ワード1」の入力回数、17日における「安定ワード1」の入力回数、18日における「安定ワード1」の入力回数をそれぞれ比較する。同様に、「安定ワード2」についても、16日における入力回数、17日における入力回数、18日における入力回数のそれぞれについての比較を行う。   FIG. 2 is a diagram illustrating an example of input data on each day from November 16 to 18, 2004, that is, an example of a keyword input by a consumer and an input count of the keyword. In FIG. 2, the top 15 keywords and the number of input times of the keywords are shown in a list format in descending order of the number of input times on each day. Here, there are two stable words, “Stable word 1” and “Stable word 2”, which are in the top 15 in all three days from the 16th to the 18th, as shown in FIG. Therefore, in this case, the number of inputs of “Stable Word 1” on the 16th, the number of inputs of “Stable Word 1” on the 17th, and the number of inputs of “Stable Word 1” on the 18th are respectively compared. Similarly, for “stable word 2”, the number of inputs on the 16th, the number of inputs on the 17th, and the number of inputs on the 18th are compared.

ここで、図2に示すように、「安定ワード1」の16日における入力回数は「105,500」、17日における入力回数は「28,380」、18日における入力回数は「85,353」となっており、16日における入力回数を100%とした場合、17日における入力回数は約27%であり、18日における入力回数は約81%である。また、「安定ワード2」の16日における入力回数は「49,732」、17日における入力回数は「14,968」、18日における入力回数は「49,890」となっており、16日における入力回数を100%とした場合、17日における入力回数は約30%であり、18日における入力回数は約100%である。従って、16日及び18日における「安定ワード1」及び「安定ワード2」の入力回数に対して、17日における「安定ワード1」及び「安定ワード2」の入力回数が急激に減少していることが比較結果として示される。   Here, as shown in FIG. 2, the number of inputs of “Stable Word 1” on the 16th is “105,500”, the number of inputs on the 17th is “28,380”, and the number of inputs on the 18th is “85,353”. When the number of inputs on the 16th is 100%, the number of inputs on the 17th is about 27% and the number of inputs on the 18th is about 81%. In addition, the number of inputs of “Stable Word 2” on the 16th is “49,732”, the number of inputs on the 17th is “14,968”, and the number of inputs on the 18th is “49,890”, which is 16 days. Assuming that the number of inputs in 100 is 100%, the number of inputs on 17th is about 30%, and the number of inputs on 18th is about 100%. Therefore, the number of times of inputting “stable word 1” and “stable word 2” on the 17th is drastically reduced compared to the number of times of inputting “stable word 1” and “stable word 2” on the 16th and 18th. This is shown as a comparison result.

次に、ステップS13における安定ワードの入力回数の比較結果に基づいて、欠損判定対象日が欠損日であるか否かを判定する(ステップS14)。即ち、欠損判定対象日における安定ワードの入力回数が欠損判定対象日の周辺日(例えば、前後の日)に比べて所定割合以上、例えば、1割以上、急激に減少しているか否か、又は、複数の安定ワードの入力回数が欠損判定対象日において同時に急激に減少しているか否か等に基づいて欠損判定対象日が欠損日であるか否かを判定する。例えば、図2に示すように、欠損判定対象日(17日)における「安定ワード1」及び「安定ワード2」の入力回数は、欠損判定対象日の前後の日(16日及び18日)における入力回数と比較して著しく減少している。従って、欠損判定対象日である17日は、入力データに欠損が生じている欠損日であると判定される。   Next, based on the comparison result of the number of stable word inputs in step S13, it is determined whether or not the missing determination target date is a missing date (step S14). That is, whether or not the number of times the stable word is input on the deficiency determination target day is rapidly decreased by a predetermined rate or more, for example, 10% or more, compared to the surrounding days (for example, the days before and after the deficiency determination target day), or Then, it is determined whether or not the deficiency determination target date is a deficiency date based on whether or not the number of times of input of a plurality of stable words is rapidly decreasing simultaneously on the deficiency determination date. For example, as shown in FIG. 2, the number of times “stable word 1” and “stable word 2” are input on the missing determination target date (17th) is the days before and after the defect determination target date (16th and 18th). Compared to the number of inputs, it is significantly reduced. Accordingly, it is determined that the 17th, which is the date for determination of deficiency, is a deficit date in which deficiency has occurred in the input data.

欠損判定対象日が欠損日ではないと判定された場合には(ステップS15)、入力回数の補正を行う必要がないため、キーワード分析システム2における入力回数の補正処理を終了する。   If it is determined that the missing date is not a missing date (step S15), it is not necessary to correct the number of times of input, and thus the processing for correcting the number of times of input in the keyword analysis system 2 is terminated.

一方、欠損判定対象日が欠損日であると判定された場合には(ステップS15)、欠損日におけるキーワードの入力回数を補正すべく、欠損日を含む所定期間(第3の所定期間)内における1日毎のキーワードの入力回数の合計値を算出する(ステップS16)。即ち、欠損日を含む所定期間、例えば、欠損日と判定された2004年11月17日が存在する週を含む4週間の1日毎、具体的には、2004年11月1日〜2004年11月28日の1日毎の入力回数の合計値を算出する。この合計値は、入力データ記憶部22に記憶されている入力データに基づいて、1日に入力された各キーワードの入力回数を合算することにより算出される。   On the other hand, when it is determined that the missing date is a missing date (step S15), in order to correct the number of keywords input on the missing date, within a predetermined period (third predetermined period) including the missing date. The total value of the number of keyword inputs per day is calculated (step S16). That is, for a predetermined period including the missing date, for example, every day of four weeks including the week in which November 17, 2004 determined as the missing date exists, specifically, from November 1, 2004 to November 2004. The total value of the number of inputs per day on month 28 is calculated. This total value is calculated by adding the number of times of input of each keyword input on the basis of the input data stored in the input data storage unit 22.

ここで、例えば、入力データ記憶部22に、サーバ6に入力されたキーワードの内、入力回数が多い順に上位10万位までのキーワード及び該キーワードの入力回数が入力データとして記憶されているとする。この場合、入力回数の合計値は、入力データ記憶部22に記憶されている入力データの内、上位1位〜100位までのキーワードを除外し、残されたキーワード、即ち、101位〜10万位の各キーワードの入力回数を合算することにより算出される。   Here, for example, in the input data storage unit 22, it is assumed that the keywords up to the top 100,000 and the number of input times of the keywords are stored as input data in the descending order of the number of input times of the keywords input to the server 6. . In this case, the total number of times of input is determined by excluding the top 1 to 100 keywords from the input data stored in the input data storage unit 22, and the remaining keywords, that is, 101 to 100,000. It is calculated by adding the number of times each keyword is input.

上位1位〜100位までのキーワードを除外するのは、誤差の発生を防止するためである。即ち、上位1位〜100位までのキーワードは、何らかの要因、例えば、マスコミ等の報道により消費者が急激に興味を抱いた物や人物に関するものや、意図的に多量に入力されたものであるか、クリスマスやバレンタイン等のイベントによる変動(季節変動)を示すものである可能性が高い。従って、上位1位〜100位までのキーワードの入力回数を除外して入力回数の合計値を算出することにより、マスコミ報道や季節変動等による入力回数の変動を排除して合計値を算出することができる。   The reason why the top 1 to 100th keywords are excluded is to prevent the occurrence of errors. In other words, the top 1 to 100 keywords are those related to things or people that the consumer has suddenly become interested in due to some reason, such as media reports, or those that are intentionally input in large quantities. Or, there is a high possibility that it shows a change (seasonal change) due to an event such as Christmas or Valentine. Accordingly, by calculating the total number of input times by excluding the number of times of inputting the keywords from the top 1 to the 100th, it is possible to calculate the total value by eliminating variations in the number of times of input due to media reports or seasonal fluctuations. Can do.

なお、除外するキーワードは、例えば、除外するキーワードの順位を予め閾値として設定することにより決定できる。ここで、閾値は、例えば、キーワード分析システム2において、任意の日における入力データを分析することにより設定できる。即ち、合計値の算出対象となっている期間(第3の所定期間)内の任意の1日におけるキーワードの入力回数を、図6に示すように、縦軸を入力回数、横軸を順位としてグラフ化する。そして、順位が10下がった(10増えた)場合に、入力回数の減少が1000以下となっている順位、即ち、図6に示すグラフの勾配が所定の値以下となる点に対応する順位を閾値として設定することができる。   Note that keywords to be excluded can be determined by, for example, setting the ranking of keywords to be excluded as a threshold value in advance. Here, the threshold value can be set, for example, by analyzing input data on an arbitrary day in the keyword analysis system 2. That is, as shown in FIG. 6, the number of input times of a keyword in an arbitrary day within the period (the third predetermined period) for which the total value is calculated is as follows. Graph. Then, when the rank is lowered by 10 (increased by 10), the rank corresponding to the point where the decrease in the number of inputs is 1000 or less, that is, the point where the slope of the graph shown in FIG. It can be set as a threshold.

次に、ステップS16において算出された入力回数の合計値を用い、欠損日におけるキーワードの入力回数を補正する際に用いられる補正係数を算出する(ステップS17)。まず、任意の日、例えば、2004年10月1日における入力回数の合計値を「1」として、2004年11月1日〜28日の1日毎の入力回数を、指数化する(図7参照)。即ち、2004年10月1日における入力回数の合計値で、2004年11月1日〜28日の各日における入力回数の合計値を除算することによって、入力回数の合計値を指数化する。   Next, using the total value of the number of times of input calculated in step S16, a correction coefficient used when correcting the number of times of keyword input on the missing date is calculated (step S17). First, the total number of input times on an arbitrary day, for example, October 1, 2004, is set to “1”, and the number of input times per day from November 1 to 28, 2004 is indexed (see FIG. 7). ). That is, the total value of the number of inputs is indexed by dividing the total value of the number of inputs on each day from November 1st to 28th, 2004 by the total value of the number of inputs on October 1, 2004.

次に、図7に示す各週、即ち、2004年11月1日〜7日の週(第1週)、11月8日〜14日の週(第2週)、11月15日〜21日の週(第3週)及び11月22日〜28日の週(第4週)における指数化された入力回数(入力回数指数)の平均値(7日間平均)を算出する。即ち、図7に示す入力回数指数を用い、第1週の7日間平均「1.016」、第2週の7日間平均「0.971」、第3週の7日間平均「0.899」、第4週の7日間平均「0.974」を算出する。   Next, each week shown in FIG. 7, that is, the week of November 1 to 7, 2004 (first week), the week of November 8 to 14 (second week), and the days of November 15 to 21 The average value (7-day average) of the indexed input count (input count index) in the week (third week) and the week of November 22 to 28 (fourth week) is calculated. That is, using the input frequency index shown in FIG. 7, the 7-day average “1.016” in the first week, the 7-day average “0.971” in the second week, and the seven-day average “0.899” in the third week Then, an average of “0.974” for 7 days in the fourth week is calculated.

次に、欠損日と、欠損日と同一曜日の日を除いて、各週の6日間における入力回数指数の平均値(6日間平均)を算出する。即ち、欠損日が17日の場合、17日は水曜日であるため(図7参照)、水曜日を除外した月、火、木〜日の入力回数指数を用いて各週における6日間平均を算出する。従って、図7に示す入力回数指数より、第1週の6日間平均「1.008」、第2週の6日間平均「0.960」、第3週の6日間平均「0.993」、第4週の6日間平均「0.968」が算出される。   Next, the average value (6 day average) of the number of times of input for 6 days in each week is calculated except for the missing day and the day of the same day of the week as the missing day. That is, when the missing date is 17, since 17th is Wednesday (see FIG. 7), the average of 6 days in each week is calculated using the input number index of the month, Tuesday, and Thursday to Sunday excluding Wednesday. Accordingly, from the input frequency index shown in FIG. 7, the average of 6 days in the first week “1.008”, the average of 6 days in the second week “0.960”, the average of 6 days in the third week “0.993”, An average of “0.968” for the 6th day of the fourth week is calculated.

次に、欠損日を含む週(第3週)以外の各週について、7日間平均と6日間平均との差分を算出し、差分の平均値(差分平均)を算出する。即ち、第1週の差分「0.007」、第2週の差分「0.011」及び第4週の差分「0.006」を算出し、算出された差分の平均値、即ち、欠損日の曜日である水曜日と、水曜日以外の他の曜日との差を示す差分平均「0.008」を算出する。次に、第3週の6日間平均に差分平均を加算することにより、第3週における7日間平均のあるべき値「1.001」を算出する。   Next, for each week other than the week including the missing day (third week), the difference between the 7-day average and the 6-day average is calculated, and the average value of the differences (difference average) is calculated. That is, the difference “0.007” in the first week, the difference “0.011” in the second week, and the difference “0.006” in the fourth week are calculated, and the average value of the calculated differences, that is, the missing date The difference average “0.008” indicating the difference between Wednesday, which is the day of the week, and other days other than Wednesday is calculated. Next, the difference value is added to the 6-day average of the third week to calculate a desired value “1.001” of the 7-day average in the third week.

そして、数式「7日間平均のあるべき値×7−当該週の6日間平均×6」に、第3週における7日間平均のあるべき値「1.001」及び第3週の6日間平均「0.993」を代入することにより、欠損日の入力回数指数としてあるべき値「1.029」が算出される。従って、算出された欠損日のあるべき入力回数指数「1.029」を欠損日の実際の入力回数指数「0.33」で除算することにより、補正係数「3.12」が算出される。なお、算出された補正係数は、データ記憶部28に記憶される。   Then, the value “1.001” for the 7-day average in the third week and the 6-day average for the third week “7” By substituting “0.993”, the value “1.029” that should be the index of the number of times of missing day input is calculated. Therefore, the correction coefficient “3.12” is calculated by dividing the calculated number-of-inputs index “1.029” that should be the missing date by the actual number-of-inputs index “0.33” of the missing day. The calculated correction coefficient is stored in the data storage unit 28.

次に、算出された補正係数を用いて、欠損日におけるキーワードの入力回数が補正される(ステップS18)。即ち、欠損日における各キーワードの入力回数に、ステップS17において算出された補正係数を乗算することにより、欠損日における入力回数を補正する。例えば、図2に示す2004年11月17日に入力されたキーワード、「台風情報」の入力回数「54,495」に補正係数「3.12」を乗算し、2004年11月17日における「台風情報」の入力回数を「170,024」に補正する。同様にして、2004年11月17日に入力された他のキーワードの入力回数を補正する。そして、補正後の入力データを用いて、例えば、急激に入力回数が増加したキーワードや、入力回数が減少傾向を示しているキーワードを特定する等のキーワード分析処理が行われる。   Next, using the calculated correction coefficient, the number of keyword inputs on the missing date is corrected (step S18). That is, the number of inputs on the missing date is corrected by multiplying the number of input times of each keyword on the missing date by the correction coefficient calculated in step S17. For example, the keyword “Typhoon information” input number “54,495” input on November 17, 2004 shown in FIG. 2 is multiplied by the correction coefficient “3.12”, and “ The number of input of “typhoon information” is corrected to “170,024”. Similarly, the number of input times of other keywords input on November 17, 2004 is corrected. Then, using the corrected input data, for example, a keyword analysis process is performed such as specifying a keyword whose number of inputs has suddenly increased or a keyword whose number of inputs has been decreasing.

この実施の形態に係るキーワード分析システムによれば、入力回数の変動が少ない安定ワードの入力回数の減少度合いに基づいて、欠損判定対象日が欠損日か否かを判定し、欠損日と判定された日におけるキーワードの入力回数を補正している。即ち、キーワードの入力回数は、マスコミ等の報道により急激に増加することはあっても、急激に減少するということは殆どないことが経験的に知られている。そのため、欠損判定対象日における安定ワードの入力回数が、欠損判定対象日の周辺日(例えば、欠損判定対象日の前後の日)における入力回数に対して所定割合以上減少しているか否かにより、入力データ、即ち、キーワードの入力回数に欠損が生じているか否かを高い精度で的確に判定し、欠損日と判定された場合には、欠損日におけるキーワードの入力回数を補正している。従って、システム障害等が発生して入力データに欠損が生じた場合であっても、補正された入力回数を用いてキーワード分析を行うことができ、消費者の関心についての動向等を高い精度で分析し、マーケティング支援のために適切、かつ、有益な情報を得ることができる。   According to the keyword analysis system according to this embodiment, it is determined whether or not the missing date is a missing date based on the degree of decrease in the number of times of input of a stable word with a small variation in the number of times, and is determined as a missing date. The number of keyword inputs on a given day is corrected. In other words, it has been empirically known that the number of times the keyword is input increases rapidly due to media reports or the like, but rarely decreases rapidly. Therefore, whether or not the number of times of input of the stable word on the deficiency determination target day is reduced by a predetermined ratio or more with respect to the number of inputs on the peripheral determination day (for example, days before and after the deficiency determination target date), Whether or not there is a deficiency in the input data, that is, the number of keyword inputs, is accurately determined with high accuracy. If it is determined as a deficient date, the number of keyword inputs on the deficient date is corrected. Therefore, even if a system failure or the like occurs and the input data is lost, keyword analysis can be performed using the corrected number of inputs, and trends in consumer interests can be accurately analyzed. Analyze and obtain useful and useful information for marketing support.

また、この実施の形態に係るキーワード分析システムによれば、欠損日を含む所定期間内の1日毎に入力された各キーワードの入力回数の合計値を用いて補正係数を算出し、算出された補正係数を用いて入力回数を補正している。即ち、欠損日が存在する週を含む4週間の1日毎におけるキーワードの入力回数の合計値を用い、1日毎の入力回数を指数化することによって入力回数指数を算出する。次に、欠損日を含む1週間における入力回数指数の平均値(7日間平均)と、欠損日又は欠損日と同一曜日の日を除く6日間における入力回数指数の平均値(6日間平均)とを算出することによって、欠損日において示されるべき入力回数指数の値を算出し、算出された値を欠損日における実際の入力回数指数で除算することにより補正係数を算出する。そして、算出された補正係数を用いて欠損日における入力回数の補正を行っている。従って、欠損日の曜日における特性(曜日特性)を加味して高い精度で算出された補正係数を用いることによって、高い精度で入力回数の補正を行うことができる。そのため、正確なキーワード分析を行うことができ、例えば、商品等の販売開始時期、販売期間、仕入れ期間や仕入れ量等を的確に見極める等、適切な販売戦略を立案する際に有用な情報を得ることができる。   Further, according to the keyword analysis system according to this embodiment, the correction coefficient is calculated using the total value of the number of input times of each keyword input every day within a predetermined period including the missing date, and the calculated correction The number of inputs is corrected using a coefficient. In other words, the input number index is calculated by indexing the number of input times per day using the total value of the number of keyword inputs per day for four weeks including the week in which the missing date exists. Next, the average value of the input frequency index for one week including the missing date (7-day average) and the average value of the input frequency index for 6 days excluding the missing day or the day of the same day of the week (average for 6 days) Is calculated to calculate the correction coefficient by dividing the calculated value by the actual input frequency index on the missing date. Then, the number of inputs on the missing date is corrected using the calculated correction coefficient. Therefore, the number of times of input can be corrected with high accuracy by using the correction coefficient calculated with high accuracy in consideration of the characteristics (day-of-week characteristics) of the missing day of the week. Therefore, accurate keyword analysis can be performed. For example, information useful for planning appropriate sales strategies, such as accurately determining the sales start time, sales period, purchase period, purchase amount, etc. of products, etc. is obtained. be able to.

なお、上述のキーワード分析システムにおいては、過去の入力回数の変動が所定範囲内のキーワードを安定ワードとして設定しているが、予め所定のキーワードを安定ワードとして設定しておいてもよい。即ち、過去の入力データが充分に蓄積されていない等の場合には、経験的に入力回数の変動が少なく、インターネット等のネットワーク利用者に馴染みが深いことが知られているキーワードを、安定ワードとして予め設定するようにしてもよい。   In the keyword analysis system described above, keywords whose fluctuations in the past number of inputs are within a predetermined range are set as stable words, but predetermined keywords may be set as stable words in advance. In other words, when past input data is not sufficiently stored, keywords that are known to have little variation in the number of inputs and that are familiar to users of the network such as the Internet are identified as stable words. May be set in advance.

また、上述のキーワード分析システムにおいては、安定ワードを設定する際に7日間日々移動平均を算出しているが、日々移動平均は7日間に限定されるものではない。即ち、曜日毎の周期的な変動を排除すべく7日間日々移動平均を算出しているため、曜日毎の周期的な変動が排除できれば、14日毎や21日毎等の日々移動平均を算出するようにしてもよい。   In the keyword analysis system described above, the moving average is calculated every day for 7 days when setting the stable word, but the daily moving average is not limited to 7 days. That is, since the daily moving average is calculated for 7 days so as to eliminate the periodic fluctuations for each day of the week, if the periodic fluctuations for each day of the week can be eliminated, the daily moving averages such as every 14 days or every 21 days are calculated. It may be.

また、上述のキーワード分析システムにおいては、安定ワードを設定する際に、任意の日から遡った1年間における7日間日々移動平均の最低値及び最高値を求めているが、最低値及び最高値を求める基準とする期間は、1年間に限定されるものではない。即ち、3ヶ月や半年等の期間を基準として最低値及び最高値を求めるようにしてもよい。また、閾値の値を「2」としているが、閾値の値は「2」に限定されるものではなく、任意に設定することができる。   Moreover, in the above keyword analysis system, when setting a stable word, the minimum and maximum values of the 7-day daily moving average for one year that goes back from an arbitrary day are obtained. The required period is not limited to one year. That is, the minimum value and the maximum value may be obtained based on a period such as three months or half a year. Further, although the threshold value is “2”, the threshold value is not limited to “2” and can be arbitrarily set.

また、上述のキーワード分析システムにおいては、閾値よりも小さい値を常に示す安定ワード候補を安定ワードとして設定しているが、所定期間、例えば、1年以上閾値未満の値を示している場合には、安定ワードに適しているキーワードであると判定するようにしてもよい。即ち、安定ワードか否かを判定する際の条件を、任意に設定することができるようにしてもよい。   In the keyword analysis system described above, a stable word candidate that always shows a value smaller than the threshold is set as the stable word. However, when the value is less than the threshold for a predetermined period, for example, one year or more, It may be determined that the keyword is suitable for a stable word. That is, the condition for determining whether or not the word is a stable word may be arbitrarily set.

また、閾値未満の値を所定期間示す安定ワード候補が多数存在する場合には、閾値を調整するようにしてもよい。即ち、閾値「2」よりも小さい値を所定期間以上維持している安定ワード候補が多数存在する場合には、適切な数の安定ワードが設定されるように閾値の値や所定期間の長さ等を調整するようにしてもよい。   Further, when there are many stable word candidates that show a value less than the threshold value for a predetermined period, the threshold value may be adjusted. That is, when there are many stable word candidates that maintain a value smaller than the threshold “2” for a predetermined period or longer, the threshold value and the length of the predetermined period are set so that an appropriate number of stable words are set. Etc. may be adjusted.

また、上述のキーワード分析システムにおいては、欠損判定対象日が欠損日か否かを判定する際に、欠損日の前後の日における安定ワードの入力回数との比較結果を用いているが、比較対照は前後の日における安定ワードの入力回数に限定されるものではない。例えば、週毎の周期性を鑑みて前週・次週の同曜日における安定ワードの入力回数との比較結果や、年間周期性を鑑みて前年同時期における安定ワードの入力回数との比較結果等を用いて欠損日か否かを判定するようにしてもよい。   Further, in the above keyword analysis system, when determining whether or not the deficiency determination target date is a deficient date, the comparison result with the number of times of inputting stable words on the days before and after the deficient date is used. Is not limited to the number of times stable words are input on the preceding and following days. For example, using the comparison result with the stable word input count on the same day of the previous week and the next week considering the periodicity of each week, or the comparison result with the stable word input count in the same period of the previous year considering the annual periodicity, etc. It may be determined whether it is a missing date.

また、上述のキーワード分析システムにおいては、補正係数を算出する際に、祝日や祭日が存在する場合を考慮していないが、祝日や祭日が存在する場合を考慮して補正係数を算出するようにしてもよい。即ち、欠損日が存在する週を含む4週間において、祝日や祭日が存在する場合には、該祝祭日を除外して計算を行うようにしてもよい。また、該祝祭日が存在する週の7日間平均の値や6日間平均の値を補正し、補正された7日間平均及び補正された6日間平均を用いて補正係数を算出するようにしてもよい。   In the keyword analysis system described above, when calculating the correction coefficient, the case where a holiday or a holiday exists is not considered, but the correction coefficient is calculated considering the case where a holiday or holiday exists. May be. In other words, if there are holidays or holidays in the four weeks including the week in which the missing date exists, the calculation may be performed without the holidays. Further, the 7-day average value or the 6-day average value of the week in which the holiday exists may be corrected, and the correction coefficient may be calculated using the corrected 7-day average and the corrected 6-day average. .

この発明の実施の形態に係るキーワード分析システムを含むシステム全体のブロック構成図である。It is a block block diagram of the whole system containing the keyword analysis system which concerns on embodiment of this invention. この発明の実施の形態に係る入力データの一例を示す図である。It is a figure which shows an example of the input data which concerns on embodiment of this invention. この発明の実施の形態に係るキーワード分析システムにおける入力回数の補正処理を説明するためのフローチャートである。It is a flowchart for demonstrating the correction process of the frequency | count of input in the keyword analysis system which concerns on embodiment of this invention. この発明の実施の形態に係るキーワード分析システムにおける安定ワードの設定処理を説明するためのフローチャートである。It is a flowchart for demonstrating the setting process of the stable word in the keyword analysis system which concerns on embodiment of this invention. この発明の実施の形態に係る安定ワードの設定処理を説明するための図である。It is a figure for demonstrating the setting process of the stable word which concerns on embodiment of this invention. この発明の実施の形態に係る入力回数の合計値を算出する際に、除外するキーワードの閾値について説明するための図である。It is a figure for demonstrating the threshold value of the keyword excluded when calculating the total value of the frequency | count of input which concerns on embodiment of this invention. この発明の実施の形態に係る入力回数指数の一例を示す図である。It is a figure which shows an example of the input frequency index | exponent which concerns on embodiment of this invention.

符号の説明Explanation of symbols

2・・・キーワード分析システム、4・・・ネットワーク、6・・・Webサーバ、8a、8b、8c・・・消費者システム、20・・・データ制御部、22・・・入力データ記憶部、24・・・通信制御部、26・・・表示部、28・・・データ記憶部。   2 ... Keyword analysis system, 4 ... Network, 6 ... Web server, 8a, 8b, 8c ... Consumer system, 20 ... Data control unit, 22 ... Input data storage unit, 24... Communication control unit, 26... Display unit, 28.

Claims (5)

入力されたキーワード及び第1の所定期間毎における前記キーワードの入力回数を記憶する入力データ記憶手段と、
前記入力データ記憶手段に記憶されているキーワードの中から、所定のキーワードを安定ワードとして設定する安定ワード設定手段と、
前記第1の所定期間を含む第2の所定期間内における、該第1の所定期間毎の前記安定ワードの入力回数を比較する入力回数比較手段と、
前記入力回数比較手段により入力回数を比較した結果、前記安定ワードの入力回数が、前記第2の所定期間に含まれる他の前記第1の所定期間内における入力回数と比較して、所定割合以上減少している前記第1の所定期間を、入力欠損期間と判定する入力欠損期間判定手段と、
前記入力欠損期間を含む第3の所定期間内における、前記第1の所定期間毎の前記各キーワードの入力回数の合計値を算出する合計値算出手段と、
前記合計値算出手段により算出された前記第1の所定期間毎の前記合計値を用いて、前記入力欠損期間における入力回数の補正係数を算出する補正係数算出手段と、
前記入力欠損期間に入力された各キーワードの入力回数と、前記補正係数算出手段により算出された前記補正係数とを用いて、該入力欠損期間における各キーワードの入力回数を補正する補正手段と
を備えることを特徴とするキーワード分析システム。
Input data storage means for storing the input keyword and the number of input times of the keyword for each first predetermined period;
Among the keywords stored in the input data storage means, stable word setting means for setting a predetermined keyword as a stable word;
An input frequency comparison means for comparing the input frequency of the stable word for each first predetermined period within a second predetermined period including the first predetermined period;
As a result of comparing the number of inputs by the number-of-inputs comparison means, the number of times of input of the stable word is equal to or greater than a predetermined ratio compared to the number of times of input in the other first predetermined period included in the second predetermined period. An input deficiency period determination means for determining the first predetermined period that is decreasing as an input deficiency period;
A total value calculating means for calculating a total value of the number of times of input of each keyword for each of the first predetermined periods within a third predetermined period including the input loss period;
Correction coefficient calculation means for calculating a correction coefficient of the number of times of input in the input deficient period using the total value for each of the first predetermined periods calculated by the total value calculation means;
Correction means for correcting the number of input times of each keyword in the input deficiency period using the number of input times of each keyword input in the input loss period and the correction coefficient calculated by the correction coefficient calculation means. A keyword analysis system characterized by that.
前記安定ワード設定手段は、
前記入力データ記憶手段に記憶されている前記第1の所定期間毎の前記キーワードの入力回数に基づいて、第4の所定期間毎の前記入力回数の移動平均を計算する移動平均算出手段と、
前記移動平均算出手段により算出された前記移動平均を記憶する移動平均記憶手段と
を備え、
前記移動平均記憶手段に記憶された前記移動平均の変動が所定割合以下であるキーワードを、前記安定ワードとして設定することを特徴とする請求項1記載のキーワード分析システム。
The stable word setting means includes
A moving average calculating means for calculating a moving average of the number of times of input for each fourth predetermined period based on the number of times of input of the keyword for each of the first predetermined periods stored in the input data storage means;
Moving average storage means for storing the moving average calculated by the moving average calculation means,
The keyword analysis system according to claim 1, wherein a keyword whose fluctuation in the moving average stored in the moving average storage means is a predetermined ratio or less is set as the stable word.
前記入力欠損期間判定手段は、
前記安定ワード設定手段により複数の前記安定ワードが設定された場合に、少なくとも2つ以上の前記安定ワードの入力回数が所定割合以上減少している第1の所定期間を、前記入力欠損期間として判定することを特徴とする請求項1又は請求項2記載のキーワード分析システム。
The input deficiency period determining means includes
When a plurality of the stable words are set by the stable word setting means, a first predetermined period in which the number of inputs of at least two or more stable words is decreased by a predetermined ratio or more is determined as the input missing period. The keyword analysis system according to claim 1 or 2, wherein
前記合計値算出手段は、
前記入力データ記憶手段に記憶されている前記第1の所定期間内に入力されたキーワードの内、前記入力回数の合計値を算出する際に除外するキーワードを判定する閾値を設定する閾値設定手段を備え、
前記閾値設定手段により設定された前記閾値に基づいて除外すると判定されたキーワードを除く、前記入力データ記憶手段に記憶されている前記第1の所定期間内に入力された前記各キーワードの入力回数を合算して前記合計値を算出することを特徴とする請求項1〜請求項3の何れか一項に記載のキーワード分析システム。
The total value calculating means includes
Threshold setting means for setting a threshold value for determining a keyword to be excluded when calculating the total value of the number of times of input among the keywords input within the first predetermined period stored in the input data storage means. Prepared,
The number of input times of each keyword input within the first predetermined period stored in the input data storage means, excluding keywords determined to be excluded based on the threshold value set by the threshold value setting means. The keyword analysis system according to claim 1, wherein the total value is calculated by adding together.
前記キーワード及び該キーワードの入力回数は、消費者によって電子的手段を介してサーバに入力され該サーバに記憶されているデータであって、
前記サーバから、前記第1の所定期間毎に前記キーワード及び該キーワードの入力回数を取得する入力データ取得手段を更に備えることを特徴とする請求項1〜請求4の何れか一項に記載のキーワード分析システム。
The keyword and the number of times the keyword has been input are data that are input to the server via electronic means by a consumer and stored in the server,
The keyword according to any one of claims 1 to 4, further comprising input data acquisition means for acquiring the keyword and the number of times the keyword has been input from the server for each of the first predetermined periods. Analysis system.
JP2005075505A 2005-03-16 2005-03-16 Keyword analysis system Expired - Fee Related JP4504849B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005075505A JP4504849B2 (en) 2005-03-16 2005-03-16 Keyword analysis system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005075505A JP4504849B2 (en) 2005-03-16 2005-03-16 Keyword analysis system

Publications (2)

Publication Number Publication Date
JP2006260052A true JP2006260052A (en) 2006-09-28
JP4504849B2 JP4504849B2 (en) 2010-07-14

Family

ID=37099248

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005075505A Expired - Fee Related JP4504849B2 (en) 2005-03-16 2005-03-16 Keyword analysis system

Country Status (1)

Country Link
JP (1) JP4504849B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011141660A (en) * 2010-01-06 2011-07-21 Fujifilm Corp File retrieval system, file server, operation control method, and operation program
CN109815501A (en) * 2019-01-29 2019-05-28 四川无声信息技术有限公司 A kind of method and device obtaining group chat text classification dictionary

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003132075A (en) * 2001-10-19 2003-05-09 Nri & Ncc Co Ltd Abnormal input detecting device
JP2003196301A (en) * 2001-12-28 2003-07-11 Nri & Ncc Co Ltd Keyword analysis system
JP2004145414A (en) * 2002-10-22 2004-05-20 Nri & Ncc Co Ltd Abnormal input detection device
JP2004185220A (en) * 2002-12-02 2004-07-02 Nri & Ncc Co Ltd Keyword extraction system
JP2004287759A (en) * 2003-03-20 2004-10-14 Nri & Ncc Co Ltd Keyword meaning discriminating system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003132075A (en) * 2001-10-19 2003-05-09 Nri & Ncc Co Ltd Abnormal input detecting device
JP2003196301A (en) * 2001-12-28 2003-07-11 Nri & Ncc Co Ltd Keyword analysis system
JP2004145414A (en) * 2002-10-22 2004-05-20 Nri & Ncc Co Ltd Abnormal input detection device
JP2004185220A (en) * 2002-12-02 2004-07-02 Nri & Ncc Co Ltd Keyword extraction system
JP2004287759A (en) * 2003-03-20 2004-10-14 Nri & Ncc Co Ltd Keyword meaning discriminating system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011141660A (en) * 2010-01-06 2011-07-21 Fujifilm Corp File retrieval system, file server, operation control method, and operation program
CN109815501A (en) * 2019-01-29 2019-05-28 四川无声信息技术有限公司 A kind of method and device obtaining group chat text classification dictionary

Also Published As

Publication number Publication date
JP4504849B2 (en) 2010-07-14

Similar Documents

Publication Publication Date Title
EP2778872B1 (en) Industrial asset event chronology
US10592811B1 (en) Analytics scripting systems and methods
US7739708B2 (en) System and method for revenue based advertisement placement
Eo et al. Why has the US economy stagnated since the Great Recession?
US20110076663A1 (en) Systems and methods for selecting survey questions and available responses
US20080103892A1 (en) System and method for generating optimized bids for advertisement keywords
US20180107987A1 (en) Meeting service with meeting time and location optimization
US20120143651A1 (en) Data mining of user activity data to identify sequential item acquisition patterns
EP2757516A1 (en) System and method for serving electronic content
US9449049B2 (en) Returning estimated value of search keywords of entire account
AU2011204804B2 (en) Providing a result with a requested accuracy using individuals previously acting with a concensus
US7644098B2 (en) System and method for identifying advertisements responsive to historical user queries
JP2008176662A (en) Sales prediction system, method, and computer program
Weller et al. Push or pull: Changes in the relative risk and growth of entrepreneurship among older households
US8452630B1 (en) Method and system for scheduling workers
US20160210341A1 (en) Capacity planning for database replication latency
Jin Do futures prices help forecast the spot price?
JP4504849B2 (en) Keyword analysis system
US9942117B1 (en) Metric anomaly detection in a digital medium environment
De Waal et al. Calibrated hot deck imputation for numerical data under edit restrictions
US20090240643A1 (en) System and method for detecting human judgment drift and variation control
CN116414953A (en) Search recommendation word generation method, device, computer equipment and storage medium
Yung Passivity on the Board of Directors
JP2003196301A (en) Keyword analysis system
CN110809778A (en) Stock price prediction support system and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070919

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100420

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100423

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130430

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130430

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140430

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees