JP4283522B2 - 異常入力検出装置 - Google Patents

異常入力検出装置 Download PDF

Info

Publication number
JP4283522B2
JP4283522B2 JP2002306553A JP2002306553A JP4283522B2 JP 4283522 B2 JP4283522 B2 JP 4283522B2 JP 2002306553 A JP2002306553 A JP 2002306553A JP 2002306553 A JP2002306553 A JP 2002306553A JP 4283522 B2 JP4283522 B2 JP 4283522B2
Authority
JP
Japan
Prior art keywords
input
keyword
predetermined period
specific
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002306553A
Other languages
English (en)
Other versions
JP2004145414A (ja
Inventor
修 二村
達之輔 矢島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2002306553A priority Critical patent/JP4283522B2/ja
Publication of JP2004145414A publication Critical patent/JP2004145414A/ja
Application granted granted Critical
Publication of JP4283522B2 publication Critical patent/JP4283522B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、入力されたキーワードデータの中から、意図的に情報を歪ませようとする異常な入力を検出する異常入力検出装置に関するものである。
【0002】
【従来の技術】
近年、情報技術の発達により、インターネット上の検索エンジンサイト等において、消費者等のインターネット利用者が日々大量にデータの入力を行っている。例えば、検索エンジンサイトにおいては、知りたい情報にアクセスすべく検索キーワード等の入力を行っている。
【0003】
この消費者等によりネットワークを介して直接入力されたデータ(キーワードデータ)は、消費者等の声を直接反映したデータであり、潜在的な顧客ニーズが示されている貴重なデータである。そのため、このキーワードデータを用いて顧客のニーズや消費者の動向を探り出すためのデータ分析を行うデータマイニングが行われるようになっている。
【0004】
データマイニングにおいては、消費者により入力された生のキーワードデータを用いなければ、精度の高い分析結果を得ることができない。即ち、仮に何者かが意図的に情報を歪ませようとして偏ったデータを大量に入力した場合、消費者により入力された生のキーワードデータに異常な入力データが含まれてしまい、データマイニングの分析精度が低下してしまう。従って、精度の高いデータマイニングを行うためには、意図的に歪められたデータを排除したキーワードデータを取得することが重要になる。
【0005】
なお、この出願の出願人は、消費者により入力されたキーワードデータの中から、意図的に情報を歪ませようとする異常な入力を、キーワードデータの入力回数の相関に基づいて検出する装置について出願を行っている(特願2001−321868号)。
【0006】
【発明が解決しようとする課題】
ところで、キーワードデータの異常入力をキーワードデータの入力回数の相関に基づいて検出する場合には、キーワードデータ毎に、入力回数について相関関係を有する他のキーワードデータを見つけておく必要がある。従って、入力回数について相関関係を有するキーワードデータを発見するために膨大なデータ処理を必要としていた。
【0007】
この発明の課題は、消費者により入力されたキーワードデータの中から意図的に情報を歪ませようとする異常な入力を容易に検出する異常入力検出装置を提供することである。
【0008】
【課題を解決するための手段】
請求項1記載の異常入力検出装置は、入力されたキーワード及び所定期間毎における前記キーワードの入力回数を記憶するキーワードデータ記憶手段と、前記キーワードデータ記憶手段に記憶されている特定の所定期間の前記キーワードの入力回数と、該特定の所定期間の直前の所定期間の前記キーワードの入力回数とを比較する第1の入力回数比較手段と、前記第1の入力回数比較手段により比較した結果、前記特定の所定期間の前記キーワードの入力回数が前記直前の所定期間の前記キーワードの入力回数よりも所定の割合以上増加している場合に、前記特定の所定期間の前記キーワードの入力回数と、該特定の所定期間の直後の所定期間の前記キーワードの入力回数とを比較する第2の入力回数比較手段と、前記第2の入力回数比較手段により比較した結果、前記直後の所定期間の前記キーワードの入力回数が前記特定の所定期間の前記キーワードの入力回数に対して所定の割合以下の場合に、前記特定の所定期間の前記キーワードの入力が異常であることを検出する異常入力検出手段と、前記異常入力検出手段により異常であることを検出した場合に、前記特定の所定期間の前記キーワードの入力が異常であるとして警告を行う警告手段とを備えることを特徴とする。
【0009】
この請求項1記載の異常入力検出装置によれば、特定の所定期間(例えば、特定の日)のキーワードの入力回数が直前の所定期間(例えば、特定の日の前日)のキーワードの入力回数より所定の割合以上増加している場合に、特定の所定期間の直後の所定期間(例えば、特定の日の翌日)のキーワードの入力回数と、特定の所定期間のキーワードの入力回数とを比較し、特定の所定期間のキーワードの入力が異常であることの検出を行っている。即ち、特定の所定期間において入力回数が増加したキーワードについて、特定の所定期間の後におけるそのキーワードの入力回数の変動のみに基づいて、容易に特定の所定期間のそのキーワードの入力が異常であることを検出できる。
【0010】
また、請求項2記載の異常入力検出装置は、前記キーワードデータが消費者によって電子的手段を介してサーバに入力され該サーバに記憶されているデータであって、前記サーバから、前記所定期間毎に前記キーワードデータを取得するキーワードデータ取得手段を更に備えることを特徴とする。
【0011】
この請求項2記載の異常入力検出装置によれば、所定期間毎に、消費者によってサーバに入力されたキーワードデータを取得してキーワードの入力が異常であることの検出を行っている。即ち、所定期間毎にキーワードデータを取得し、常に最新のキーワードデータにより特定の所定期間のキーワードの入力が異常であることをの検出を行うことができる。
【0012】
また、請求項3記載の異常入力検出装置は、前記キーワードデータ記憶手段に記憶されている前記特定の所定期間の前記キーワードの入力回数と、過去の同一曜日の所定期間の前記キーワードの入力回数とを比較する曜日入力回数比較手段を更に備え、前記第2の入力回数比較手段は、前記曜日入力回数比較手段により比較した結果、前記特定の所定期間の前記キーワードの入力回数が、前記過去の同一曜日の所定期間の前記キーワードの入力回数に対して所定の割合以上増加している場合に、前記特定の所定期間の前記キーワードの入力回数と前記直後の所定期間の前記キーワードの入力回数とを比較することを特徴とする。
【0013】
この請求項3記載の異常入力検出装置によれば、特定の所定期間(例えば、特定の日)のキーワードの入力回数が、直前の所定期間(例えば、特定の日の前日)の入力回数よりも所定の割合以上増加しており、かつ、過去の同一曜日の所定期間における入力回数よりも所定の割合以上増加している場合に、特定の所定期間のキーワードの入力回数と直後の所定期間のキーワードの入力回数とを比較している。従って、キーワードの入力回数の曜日による変動を排除して、特定の所定期間のキーワードの入力が異常であることの検出を行うことができる。
【0014】
また、請求項4記載の異常入力検出装置は、入力されたキーワード及び第1の所定期間毎における前記キーワードの入力回数を記憶するキーワードデータ記憶手段と、前記キーワードデータ記憶手段に記憶されている特定の第1の所定期間の前記キーワードの入力回数と、該特定の第1の所定期間の直前の第1の所定期間の前記キーワードの入力回数とを比較する第1の入力回数比較手段と、前記第1の入力回数比較手段により比較した結果、前記特定の第1の所定期間の前記キーワードの入力回数が前記直前の第1の所定期間の前記キーワードの入力回数よりも所定の割合以上増加している場合に、前記キーワードデータ記憶手段に記憶されている前記第1の所定期間毎の前記キーワードの入力回数のうち、前記特定の第1の所定期間の直前の第2の所定期間内における前記第1の所定期間毎の前記キーワードの入力回数の平均を平均入力回数として算出する平均入力回数算出手段と、前記平均入力回数と前記特定の第1の所定期間の直後の第3の所定期間内における前記第1の所定期間毎の前記キーワードの入力回数とを比較する第3の入力回数比較手段と、前記第3の入力回数比較手段により比較した結果、前記直後の第3の所定期間内における前記第1の所定期間毎の前記キーワードの入力回数の前記平均入力回数に対する増加数の絶対値が、所定の範囲内の場合に、前記特定の第1の所定期間の前記キーワードの入力が異常であることを検出する異常入力検出手段と、前記異常入力検出手段により異常であることを検出した場合に、前記特定の第1の所定期間の前記キーワードの入力が異常であるとして警告を行う警告手段とを備えることを特徴とする。
【0015】
この請求項4記載の異常入力検出装置によれば、特定の第1の所定期間(例えば、特定の日)のキーワードの入力回数が直前の第1の所定期間(例えば、特定の日の前日)のキーワードの入力回数より所定の割合以上増加している場合に、特定の第1の所定期間の直後の第3の所定期間(例えば、特定の日後の1週間)の各日毎のキーワードの入力回数が、所定の範囲内において変動している場合に、特定の第1の所定期間のキーワードの入力が異常であることを検出している。即ち、特定の第1の所定期間において入力回数が増加したキーワードについて、特定の第1の所定期間の後のそのキーワードの入力回数の変動のみに基づいて、特定の第1の所定期間のそのキーワードの入力が異常であることを容易に検出できる。
【0016】
また、請求項5記載の異常入力検出装置は、前記キーワードデータ記憶手段に記憶されている前記特定の第1の所定期間の前記キーワードの入力回数と、過去の同一曜日の所定期間の前記キーワードの入力回数とを比較する曜日入力回数比較手段を更に備え、前記平均入力回数算出手段は、前記曜日入力回数比較手段により比較した結果、前記特定の第1の所定期間の前記キーワードの入力回数が、前記過去の同一曜日の第1の所定期間の前記キーワードの入力回数に対して所定の割合以上増加している場合に、前記平均入力回数を算出することを特徴とする。
【0017】
この請求項5記載の異常入力検出装置によれば、特定の第1の所定期間(例えば、特定の日)のキーワードの入力回数が、直前の第1の所定期間(例えば、特定の日の前日)のキーワードの入力回数よりも所定の割合以上増加しており、かつ、過去の同一曜日の第1の所定期間のキーワードの入力回数よりも所定の割合以上増加している場合に、平均入力回数を算出している。従って、キーワードの入力回数の曜日による変動を排除して、特定の第1の所定期間のキーワードの入力が異常であることの検出を行うことができる。
【0018】
また、請求項6記載の異常入力検出装置は、入力されたキーワード及び第1の所定期間毎における前記キーワードの入力回数を記憶するキーワードデータ記憶手段と、前記キーワードデータ記憶手段に記憶されている特定の第1の所定期間の前記キーワードの入力回数と、該特定の第1の所定期間の直前の第1の所定期間の前記キーワードの入力回数とを比較する入力回数比較手段と、前記入力回数比較手段により比較した結果、前記特定の第1の所定期間の前記キーワードの入力回数が、前記直前の第1の所定期間の前記キーワードの入力回数よりも所定の割合以上増加している場合に、前記キーワードデータ記憶手段に記憶されている前記第1の所定期間毎の前記キーワードの入力回数のうち、前記特定の第1の所定期間の直後の第2の所定期間内における前記第1の所定期間毎の前記キーワードの入力回数が、所定の値以下となっている前記第1の所定期間が所定の数以上存在する場合に、前記特定の第1の所定期間の前記キーワードの入力が異常であることを検出する異常入力検出手段と、前記異常入力検出手段により異常であることを検出した場合に、前記特定の第1の所定期間の前記キーワードの入力が異常であるとして警告を行う警告手段とを備えることを特徴とする。
【0019】
この請求項6記載の異常入力検出装置によれば、特定の第1の所定期間(例えば、特定の日)のキーワードの入力回数が直前の第1の所定期間(例えば、特定の日の前日)のキーワードの入力回数より所定の割合以上増加している場合に、特定の第1の所定期間の直後の第2の所定期間(例えば、特定の日後の1週間)の各日毎のキーワードの入力回数が、所定の値(基準値)以下となっている日が所定の数以上存在する場合に、特定の第1の所定期間のキーワードの入力が異常であることを検出している。即ち、特定の第1の所定期間において入力回数が増加したキーワードについて、特定の第1の所定期間の後のそのキーワードの入力回数についての適切な基準値を設定することにより、特定の第1の所定期間のそのキーワードの入力が異常であることを容易に検出することができる。
【0020】
また、請求項7記載の異常入力検出装置は、前記キーワードデータ記憶手段に記憶されている前記特定の第1の所定期間の前記キーワードの入力回数と、過去の同一曜日の第1の所定期間の前記キーワードの入力回数とを比較する曜日入力回数比較手段を更に備え、前記異常入力検出手段は、前記曜日入力回数比較手段により比較した結果、前記特定の第1の所定期間の前記キーワードの入力回数が、前記過去の同一曜日の第1の所定期間の前記キーワードの入力回数に対して所定の割合以上増加している場合に、前記特定の第1の所定期間の前記キーワードの入力が異常であることの検出を行うことを特徴とする。
【0021】
この請求項7記載の異常入力検出装置によれば、特定の第1の所定期間(例えば、特定の日)のキーワードの入力回数が、直前の第1の所定期間(例えば、特定の日の前日)のキーワードの入力回数よりも所定の割合以上増加しており、かつ、過去の同一曜日の第1の所定期間のキーワードの入力回数よりも所定の割合以上増加している場合に、特定の第1の所定期間のキーワードの入力の異常を検出している。従って、キーワードの入力回数の曜日による変動を排除して、特定の第1の所定期間のキーワードの入力が異常であることの検出を行うことができる。
【0022】
また、請求項8記載の異常入力検出装置は、入力されたキーワード及び第1の所定期間毎における前記キーワードの入力回数を記憶するキーワードデータ記憶手段と、前記キーワードデータ記憶手段に記憶されている特定の第1の所定期間の前記キーワードの入力回数と、該特定の第1の所定期間の直前の第1の所定期間の前記キーワードの入力回数とを比較する入力回数比較手段と、前記入力回数比較手段により比較した結果、前記特定の第1の所定期間の前記キーワードの入力回数が前記直前の第1の所定期間の前記キーワードの入力回数よりも所定の割合以上増加している場合に、前記キーワードデータ記憶手段に記憶されている前記第1の所定期間毎の前記キーワードの入力回数のうち、前記特定の第1の所定期間の直前の第2の所定期間内における前記第1の所定期間毎の前記キーワードの入力回数の平均を直前平均入力回数として算出する直前平均入力回数算出手段と、前記キーワードデータ記憶手段に記憶されている前記第1の所定期間毎の前記キーワードの入力回数のうち、前記特定の第1の所定期間の直後の第2の所定期間内における前記第1の所定期間毎の前記キーワードの入力回数の平均を直後平均入力回数として算出する直後平均入力回数算出手段と、前記直前平均入力回数と、前記直後平均入力回数とを比較する平均入力回数比較手段と、前記平均入力回数比較手段により比較した結果、前記直後平均入力回数が前記直前平均入力回数に対して所定の倍数以下である場合に、前記特定の第1の所定期間の前記キーワードの入力が異常であることを検出する異常入力検出手段と、前記異常入力検出手段により異常であることを検出した場合に、前記特定の第1の所定期間の前記キーワードの入力が異常であるとして警告を行う警告手段とを備えることを特徴とする。
【0023】
この請求項8記載の異常入力検出装置によれば、特定の第1の所定期間(例えば、特定の日)のキーワードの入力回数が直前の第1の所定期間(例えば、特定の日の前日)のキーワードの入力回数より所定の割合以上増加している場合に、特定の第1の所定期間の直後の第2の所定期間(例えば、特定の日後の1週間)のキーワードの平均入力回数が、例えば、特定の日前の1週間のキーワードの平均入力回数に対して所定の倍数以下である場合に、特定の第1の所定期間のキーワードの入力が異常であることを検出している。即ち、特定の第1の所定期間において入力回数が増加したキーワードについて、曜日の特性によるキーワードの入力回数の変動を排除し、そのキーワードの入力回数の変動のみに基づいて、特定の第1の所定期間のそのキーワードの入力が異常であることを容易に検出できる。
【0024】
また、請求項9記載の異常入力検出装置は、前記キーワードデータ記憶手段に記憶されている前記特定の第1の所定期間の前記キーワードの入力回数と、過去の同一曜日の第1の所定期間の前記キーワードの入力回数とを比較する曜日入力回数比較手段を更に備え、前記直前平均入力回数算出手段は、前記曜日入力回数比較手段により比較した結果、前記特定の第1の所定期間の前記キーワードの入力回数が、前記過去の同一曜日の第1の所定期間の前記キーワードの入力回数に対して所定の割合以上増加している場合に、前記直前平均入力回数を算出することを特徴とする。
【0025】
この請求項9記載の異常入力検出装置によれば、特定の第1の所定期間(例えば、特定の日)のキーワードの入力回数が、直前の第1の所定期間(例えば、特定の日の前日)のキーワードの入力回数よりも所定の割合以上増加しており、かつ、過去の同一曜日の第1の所定期間のキーワードの入力回数よりも所定の割合以上増加している場合に、直前平均入力回数を算出している。従って、キーワードの入力回数の曜日による変動を排除して、特定の所定期間のキーワードの入力が異常であることの検出を行うことができる。
【0026】
また、請求項10記載の異常入力検出装置は、前記キーワードデータが消費者によって電子的手段を介してサーバに入力され該サーバに記憶されているデータであって、前記サーバから、前記第1の所定期間毎に前記キーワードデータを取得するキーワードデータ取得手段を更に備えることを特徴とする。
【0027】
この請求項10記載の異常入力検出装置によれば、第1の所定期間毎に、消費者によってサーバに入力されたキーワードデータを取得してキーワードの入力が異常であることの検出を行っている。従って、常に最新のキーワードデータを取得して、特定の第1の所定期間のキーワードの入力が異常であることの検出を行うことができる。
【0028】
【発明の実施の形態】
以下、図面を参照して、この発明の実施の形態に係る異常入力検出装置について説明する。なお、以下においては、インターネット上に開設されている検索エンジンサイト上で消費者により入力された検索用のキーワード及びその入力回数をキーワードデータとし、このキーワードデータに基づいてキーワードの入力が異常であることの検出を行う場合を例として説明する。
【0029】
図1は、実施の形態に係る異常入力検出装置を含むシステム全体のブロック構成図である。異常入力検出装置2は、ネットワーク4を介してネットワーク上に検索エンジンサイトを開設している企業のWebサーバ6と接続されており、Webサーバ6は、ネットワーク4を介して個々の消費者が有する消費者システム(パーソナルコンピュータ、携帯端末、携帯電話等のネットワーク上の検索エンジンサイトにアクセス可能な端末)8a、8b、8cと接続されている。
【0030】
異常入力検出装置2は、キーワードデータの入力が異常であることの検出等の処理を行うデータ処理部20を備え、このデータ処理部20には、入力されたキーワード及び各キーワードの入力回数をキーワードデータとして記憶するキーワードデータ記憶部22が接続されている。また、データ処理部20には、Webサーバ6との間の通信を制御する通信制御部24及びキーワードの入力が異常であることが検出された際の警告等を表示する表示部26が接続されている。
【0031】
キーワードデータ記憶部22には、キーワードデータ、即ち、通信制御部24を介してWebサーバ6から所定期間毎、例えば、1日毎に取得されたキーワード及び各キーワードの入力回数のデータが記憶される。また、取得された各キーワードの入力回数は、それぞれキーワードに対応させて記憶される。例えば、図2に示すように、6月3日における「ブロッコリー」の入力回数「38」、「トマト」の入力回数「32」、「トウガン」の入力回数「10」、「モロヘイヤ」の入力回数「12」、「ムラサキイモ」の入力回数「10」等である。
【0032】
また、キーワードの入力が異常とは、実際には消費者の関心を集めていないキーワードであるにも拘わらず、キーワードに対する消費者の関心が高まっているかのように見せかけようと、意図的にそのキーワードの入力回数を増加させていることを意味する。即ち、例えば、テレビ番組で取り上げられる等して急激に入力回数が増加した場合、通常は、急激に入力回数が増加した日(急騰日)以後の日においても数日間、例えば、1週間程度は一定回数以上の入力が行われる傾向が強い。そのため、急騰日のキーワードの入力回数に比較して、急騰日以後のキーワードの入力回数が急激に減少した場合に入力が異常と判断できる。
【0033】
次に、図3〜図7のフローチャートを参照して、異常入力検出装置2において行われるキーワードの入力異常の検出処理について説明する。
【0034】
まず、図3のフローチャートを参照して、入力されたキーワードが急激に入力回数が増加したキーワード(急騰キーワード)か否かを判定する処理について説明する。
【0035】
消費者が、消費者システム8a、8b、8cを用いて、ネットワーク4を介して検索エンジンサイトにアクセスし、検索用のキーワードを入力した場合、この入力されたキーワードがWebサーバ6に記憶される。即ち、この消費者により入力されたキーワードは、1回入力されると入力回数1回としてカウントされ、キーワードと各キーワードの入力回数がキーワードデータとしてWebサーバ6に記憶される。
【0036】
異常入力検出装置2においては、Webサーバ6に記憶されているキーワードデータを、通信制御部24を介してデータ処理部20において取得する(ステップS10)。即ち、Webサーバ6に記憶されているキーワードデータのうち、1日の入力回数が多い順番に上位1万位までのキーワードデータが、1日に1回、Webサーバ6からキーワード分析システム2に対して送信されることによって、キーワードと各キーワードの入力回数がデータ処理部20に取得される。なお、取得されたキーワードと各キーワードの入力回数はキーワードデータとしてキーワードデータ記憶部22に記憶される(図2参照)。
【0037】
次に、取得されたキーワードデータの中に欠損値が生じているか否かを確認する(ステップS11)。即ち、Webサーバ6から送信されるキーワードデータは、消費者により入力された全てのキーワード及びその入力回数ではなく、その日の入力回数が多い順番に上位1万位までのキーワードと各キーワードの入力回数である。そのため、キーワードデータ記憶部22には記憶されているが、その日に取得されたキーワードには含まれていないキーワードが存在する場合がある。そのようなキーワードは、その日の入力回数が「0」となり、欠損値が生じてしまう。従って、その日に取得されたキーワードとキーワードデータ記憶部22に記憶されているキーワードとを照合し、欠損値を生じているキーワードが存在するか否かを確認する。
【0038】
キーワードデータの中に欠損値が生じている場合には(ステップS11)、欠損値の補正を行う(ステップS12)。即ち、欠損値を生じているキーワードであっても、前日までは一定の入力回数があったことから、その日も一定の回数は入力されていると推測される。従って、欠損値を生じているキーワードの入力回数を「10」として、欠損値の補正を行う。なお、欠損値を生じているキーワードが存在しない場合には(ステップS11)、欠損値の補正を行う必要がないため、そのままステップS13へ進む。
【0039】
次に、ステップS10において取得された日の各キーワードの入力回数と、前日における各キーワードの入力回数とを比較する(ステップS13)。例えば、6月10日に取得された「ブロッコリー」の入力回数と、6月10日の前日、即ち、6月9日の「ブロッコリー」の入力回数とを比較する。
【0040】
次に、入力回数が所定の値以上乖離、即ち、取得された日のキーワードの入力回数が取得された日の前日の入力回数に対して所定の割合以上増加しているか否かを判断する(ステップS14)。例えば、6月10日の「ブロッコリー」の入力回数が前日6月9日の「ブロッコリー」入力回数に対して、3倍以上増加しているか否かを判断する。
【0041】
入力回数が所定の値以上乖離しているキーワードが存在する場合には(ステップS14)、取得した日の入力回数と取得した日と同じ曜日の過去の入力回数とを比較する(ステップS15)。即ち、入力回数が所定の値以上乖離している各キーワードについて、取得した日の入力回数と1週間前の同じ曜日の入力回数、例えば、「ブロッコリー」について6月10日(月)における入力回数と6月3日(月)における入力回数とを比較する。一方、入力回数が所定の値以上乖離しているキーワードが存在しない場合には(ステップS14)、急騰キーワードが存在しないため処理を終了する。
【0042】
次に、取得された日の入力回数と過去の同一曜日の入力回数とが所定の割合以上乖離、即ち、取得された日の入力回数が過去の同一曜日の入力回数に対して所定の割合以上増加しているか否かを判断する(ステップS16)。例えば、6月10日(月)における入力回数が6月3日(月)における入力回数に対して所定の割合以上、例えば、3倍以上増加しているか否かを判断する。
【0043】
取得された日の入力回数が過去の同一曜日の入力回数に対して所定の割合以上増加しているキーワードが存在する場合には(ステップS16)、そのキーワードは急騰キーワードであると判定される(ステップS17)。即ち、取得された日の入力回数が前日の入力回数に対して所定の割合以上増加しており、かつ、取得された日の入力回数が過去の同一曜日の入力回数に対して所定の割合以上増加している場合に、そのキーワードは急騰キーワードと判定される。一方、取得された日の入力回数が過去の同一曜日の入力回数に対して所定の割合以上増加していない場合には(ステップS16)、急騰キーワードが存在しないため処理を終了する。
【0044】
なお、特定の日のキーワードの入力回数が、前日の入力回数に対して3倍以上となっている場合に急騰キーワードと判定しているが、3倍以上でない場合にも急騰キーワードと判定してもよい。例えば、特定の日のキーワードの入力回数が、前日の入力回数に対して1.5倍又は2倍以上となっている場合に急騰キーワードと判定してもよい。
【0045】
次に、図4〜図7のフローチャートを参照して、急騰キーワードと判定されたキーワードについて、異常入力検出装置2において行われる入力異常の検出処理について説明する。なお、以下においては、特定の日(所定期間)のキーワードの入力異常、例えば、6月10日(図2参照)のキーワードの入力異常の検出処理を行う場合について説明する。
【0046】
まず、図4のフローチャートを参照して、実施の形態に係る異常入力検出装置において行われるキーワードの入力異常の第1の検出処理について説明する。
【0047】
まず、急騰キーワードと判定されたキーワードの急騰日の入力回数と、そのキーワードの急騰日の翌日の入力回数とを比較する(ステップS20)。例えば、6月10日の「ブロッコリー」の入力回数と、6月11日の「ブロッコリー」の入力回数とを比較する。
【0048】
次に、急騰日の翌日における入力回数が、急騰日の入力回数に対して所定の割合以下となっているか否かを判断する(ステップS21)。即ち、急激に消費者の関心を集めたキーワードは急騰日以降においても一定回数は入力されるため、急騰日の翌日の入力回数が急騰日の入力回数に対して所定の割合以下の場合に、急騰日のキーワードの入力が異常と判断される。例えば、図2に示すように、6月11日の「ブロッコリー」の入力回数が6月10日における「ブロッコリー」の入力回数「2936」の5%以下、即ち、「147(端数繰上げ。以下同様)」以下となっているか否かについて判断する。ここで、「ブロッコリー」の6月11日における入力回数は「2016」であり、「147」を上回っているため、「ブロッコリー」の6月10日における入力は異常でないと判断される。一方、「モロヘイヤ」の6月10日における入力回数は「17393」であり、この5%は「870」である。「モロヘイヤ」の6月11日における入力回数は「27」であり、「870」を下回っているため、「モロヘイヤ」の6月10日における入力は異常であると判断される。
【0049】
急騰日の翌日の入力回数が、急騰日の入力回数に対して所定の割合以下となっている場合には(ステップS21)、急騰日のキーワードの入力が異常として、そのキーワードと急騰日を警告表示として表示部26に表示する(ステップS22)。一方、急騰日の翌日のキーワードの入力回数が、急騰日のキーワードの入力回数に対して所定の割合以上となっている場合には(ステップS21)、急騰日のキーワードの入力は異常でないため処理を終了する。
【0050】
なお、この第1の検出処理により急騰日のキーワードの入力が異常であるか否かを検出する実施の形態に係る異常入力検出装置においては、急騰日の翌日のキーワードの入力回数が、急騰日のキーワードの入力回数に対して5%以下となっている場合に入力が異常として検出しているが、5%以上の場合にも入力が異常として検出してもよい。例えば、急騰日のキーワードの入力回数に対して10%以下、15%以下等の場合に急騰日のキーワードの入力が異常として検出してもよい。
【0051】
次に、図5のフローチャートを参照して、実施の形態に係る異常入力検出装置において行われるキーワードの入力異常の第2の検出処理について説明する。
【0052】
まず、キーワードデータ記憶部22に記憶されているキーワードデータに基づいて、急騰日前の1週間における1日当りの平均入力回数を算出する(ステップS30)。例えば、6月10日に急騰した「ブロッコリー」について、6月10日前の1週間、即ち、6月3日〜6月9日における1日当りの平均入力回数を算出する。
【0053】
次に、算出された平均入力回数と急騰日後の1週間における各日毎の入力回数とを比較する(ステップS31)。例えば、ステップS30において算出された「ブロッコリー」の平均入力回数「33」と、急騰日後の1週間、即ち、6月11日〜6月17日の各日毎の入力回数とを比較する。
【0054】
次に、急騰日後の1週間における各日毎の入力回数の、急騰日前1週間の平均入力回数に対する増加数の絶対値が所定の範囲内か否かを判断する(ステップS32)。即ち、急騰日後の1週間における各日毎の入力回数の、急騰日前1週間の平均入力回数に対する増加数の絶対値が、例えば、急騰日の入力回数の1%の範囲となっているか否かを判断する。
【0055】
例えば、6月11日における「ブロッコリー」の入力回数は「2016」であり、平均入力回数「33」に対する増加数は「1983」となる。この「1983」は、6月10日の入力回数「2936」の1%である「30」よりも大きくなっている。また、6月12日の入力回数は「753」、平均入力回数「33」に対する増加数は「720」であり、6月13日の入力回数は「354」、平均入力回数に対する増加数は「321」であり、共に「30」よりも大きくなっている。同様に、6月14日〜6月17日の入力回数の平均入力回数「33」に対する増加数も「30」より大きくなっている。従って、「ブロッコリー」の6月10日の入力は異常でないと判断される。
【0056】
一方、「モロヘイヤ」の6月3日〜6月9日における1日当りの平均入力回数は「13」であり、6月11日の入力回数は「27」である。この「27」の平均入力回数に対する増加数は「14」であり、6月10日の入力回数「17393」の1%「174」よりも小さくなっている。また、6月12日の入力回数は「10」であり、平均入力回数に対する増加数「−3」の絶対値「3」は、「174」よりも小さくなっている。また、6月13日〜6月17日の各日の入力回数の平均入力回数に対する増加数の絶対値も「174」より小さく、全ての日において「174」よりも小さくなっている。従って、「モロヘイヤ」6月10日おける入力は異常であると判断される。
【0057】
ここで、増加数の絶対値を求めているのは、曜日特性を考慮しているためである。即ち、キーワードの入力回数は、一般的に平日(月〜金)と週末(土、日)によって大きく異なる傾向が強いが、平均入力回数は1週間の入力回数に基づいて算出される。従って、曜日によっては入力回数が平均入力回数を下回っており、増加数がマイナスとなる可能性がある。そのため、増加数がマイナスとなっている場合であっても、増加数が所定の範囲内となっているか否かを判断するため、増加数の絶対値を求めている。
【0058】
次に、急騰日後の1週間における各日毎の入力回数の平均入力回数に対する増加数の絶対値が、全ての日において所定の範囲内となっている場合には(ステップS32)、急騰日のキーワードの入力が異常であるとして、そのキーワードと急騰日とを警告表示として表示部26に表示する(ステップS33)。一方、急騰日後の1週間における各日毎の入力回数の平均入力回数に対する増加数の絶対値が、所定の範囲内となっていない日が存在する場合には(ステップS32)、急騰日のキーワードの入力は異常でないため処理を終了する。
【0059】
なお、この第2の検出処理により急騰日のキーワードの入力が異常であるか否かを検出する実施の形態に係る異常入力検出装置においては、急騰日後の1週間の各日毎の入力回数の増加数の絶対値の全てが、急騰日の入力回数の1%の範囲内となっている場合に入力が異常として検出しているが、その他の範囲内となっている場合に入力が異常として検出するようにしてもよい。例えば、急騰日の入力回数の5%、10%等の範囲内となっている場合に入力が異常として検出するようにしてもよい。
【0060】
また、急騰日後の1週間の各日毎の入力回数の増加数の絶対値の全てが、急騰日の入力回数の1%の範囲内となっている場合に入力が異常として検出しているが、その他の場合にも入力を異常として検出するようにしてもよい。例えば、急騰日後の1週間の各日毎の入力回数の増加数の絶対値の全てが、急騰日と平均入力回数の差の1%の範囲内となっている場合に入力を異常として検出するようにしてもよい。
【0061】
また、急騰日後の1週間における全ての日の入力回数の平均入力回数に対する増加数の絶対値が所定の範囲内となっている場合以外にも、急騰日のキーワードの入力が異常として検出するようにしてもよい。例えば、急騰日後の1週間のうち、5日以上の日の入力回数について、平均入力回数に対する増加数の絶対値が所定の範囲内となっている場合に、急騰日のキーワードの入力が異常として検出してもよい。
【0062】
また、急騰日後の1週間における各日毎の入力回数と平均入力回数とを比較しているが、急騰日後の5日間、10日間又は2週間における各日毎の入力回数と平均入力回数とを比較するようにしてもよい。
【0063】
次に、図6のフローチャートを参照して、実施の形態に係る異常入力検出装置において行われるキーワードの入力異常の第3の検出処理について説明する。
【0064】
まず、急騰日後の1週間における各日毎の入力回数が所定の値(基準値)以下となっている日を検出する(ステップS40)。例えば、6月10日後の1週間、6月11日〜6月17日の中で入力回数が基準値以下、例えば、入力回数が「10」以下となっている日を検出する。
【0065】
次に、ステップS40において入力回数が基準値以下になっているとして検出された日が、急騰日後の1週間の中で所定の数以上存在するか否かを判断する(ステップS41)。例えば、「ブロッコリー」について、6月11日〜6月17日の1週間内に入力回数が「10」以下となっている日が5日以上存在するか否かを判断する。「ブロッコリー」については、6月11日〜6月17日の1週間内に入力回数が「10」以下となっている日が存在しないため、「ブロッコリー」の6月10日の入力は異常でないと判断される。一方、「モロヘイヤ」については6月11日〜6月17日の1週間内に6月12日〜6月14日、16日、17日の5日の入力回数が「10」以下となっている。従って、「モロヘイヤ」の6月10日における入力は異常と判断される。
【0066】
急騰日後の1週間の中で入力回数が基準値以下となっている日が、所定の数以上存在する場合には(ステップS41)、急騰日のキーワードの入力が異常であるとして、そのキーワードと急騰日を警告表示として表示部26に表示する(ステップS42)。一方、入力回数が基準値以下となっている日が、急騰日後の1週間の中で所定の数以上存在していない場合には(ステップS42)、急騰日のキーワードの入力が異常ではないため処理を終了する。
【0067】
なお、この第3の検出処理により急騰日のキーワードの入力が異常であることを検出する実施の形態に係る異常入力検出装置においては、基準値を「10」としているが、基準値を「10」以外の値にしてもよい。また、基準値以下の入力回数の日が5日以上存在する場合に入力が異常であると検出しているが、5日以下の場合にも異常であるとして検出してもよい。例えば、基準値を「15」、「20」、又は、「25」等とし、基準値以下の入力回数となっている日が、3日又は4日以上存在する場合に急騰日のキーワードの入力が異常として検出してもよい。
【0068】
次に、図7のフローチャートを参照して、実施の形態に係る異常入力検出装置において行われるキーワードの入力異常の第4の検出処理について説明する。
【0069】
まず、急騰日前の1週間における1日当りの平均入力回数(直前平均入力回数)を算出する(ステップS50)。例えば、「ブロッコリー」の6月10日前の1週間、即ち、6月3日〜6月9日の1週間における1日当りの平均入力回数を直前平均入力回数として算出する。
【0070】
次に、急騰日後の1週間における1日当りの平均入力回数(直後平均入力回数)を算出する(ステップS51)。例えば、「ブロッコリー」の6月10日後の1週間、即ち、6月11日〜6月17日の1週間における1日当りの平均入力回数を直後平均入力回数として算出する。
【0071】
次に、ステップS50において算出された直前平均入力回数とステップS51において算出された直後平均入力回数とを比較する(ステップS52)。例えば、「ブロッコリー」の6月3日〜6月9日の1週間における1日当たりの平均入力回数「33」と、6月11日〜6月17日の1週間における1日当りの平均入力回数「582」とを比較する。
【0072】
次に、直後平均入力回数が直前平均入力回数に対して所定の倍数以下となっているか否かを判断する(ステップS53)。例えば、直後平均入力回数が直前平均入力回数に対して1.2倍以下か否かを判断し、1.2倍以下である場合には、急騰日の入力が異常であると判断する。例えば、「ブロッコリー」の直後平均入力回数「582」は直前平均入力回数「33」に対して1.2倍以上となっているため、「ブロッコリー」の6月10日の入力は異常でないと判断される。一方、「モロヘイヤ」の直前平均入力回数は「13」、直後平均入力回数は「13」であるため、直後平均入力回数が直前平均入力回数の1.2倍以下となっている。従って、「モロヘイヤ」の6月10日の入力は異常であると判断される。
【0073】
直後平均入力回数が直前平均入力回数に対して所定の倍数以下となっている場合には(ステップS53)、急騰日のキーワードの入力が異常であるとして、そのキーワードと急騰日を警告表示として表示部26に表示する(ステップS54)。一方、直後平均入力回数が直前平均入力回数に対して所定の倍数以下となっていない場合には(ステップS53)、急騰日のキーワードの入力は異常でないため処理を終了する。
【0074】
なお、この第4の検出処理により急騰日のキーワードの入力が異常であるか否かを検出する実施の形態に係る異常入力検出装置においては、直後平均入力回数が直前平均入力回数の1.2倍以下となっている場合に入力が異常であると検出しているが、1.2倍以下となっていない場合にも入力が異常であると検出してもよい。例えば、直後平均入力回数が直前平均入力回数に対して1.3倍、1.4倍又は1.5倍以下となっている場合に急騰日のキーワードの入力が異常であると検出してもよい。
【0075】
この実施の形態に係る異常入力検出装置によれば、特定の日のキーワードの入力回数がその前日のキーワードの入力回数に対して所定の割合以上増加しており、かつ、過去の同一曜日のキーワードの入力回数に対しても所定の割合以上増加している場合に、そのキーワードを急騰キーワードであると判定している。そして、急騰キーワードと判定されたキーワードについて、急騰日の翌日以降のキーワードの入力回数に基づいて、急騰日のキーワードの入力が意図的に行われた異常な入力であることを検出している。従って、キーワードの入力回数が急激に増加した場合、増加した日(急騰日)以降のそのキーワードの入力回数の変動に基づいて容易に急騰日のキーワードの入力が異常であることの検出を行うことができる。
【0076】
また、確実に急騰日のキーワードの入力が異常であることの検出を行うことができるため、的確に消費者の関心が高まっている商品等を特定し、そのような商品の仕入量を決定する等のマーケティング支援のための情報を得ることができる。
【0077】
また、不特定多数の消費者によって入力されたキーワードデータの中から異常な入力を的確に検出することができるため、異常な入力を排除したキーワードデータを取得することができ、消費者の潜在的なニーズや消費者の関心等を的確に分析するデータマイニングを行うことができる。
【0078】
なお、上述の実施の形態に係る異常入力検出装置においては、異常入力の第1〜第4のそれぞれの検出処理により急騰日のキーワードの入力が異常か否かの検出を行っているが、第1〜第4の何れか2つ以上を組み合わせて急騰日のキーワードの入力が異常か否かの検出を行うようにしてもよい。例えば、第1〜第4の検出処理を組み合わせ、何れか3つ以上において入力が異常と判断された場合に、急騰日のキーワードの入力が異常とし、何れか2つ以上において入力が異常と判断された場合には、急騰日のキーワードの入力は異常の可能性があるとしてもよい。この場合には、複数の検出処理を組み合わせることにより、高い精度で急騰日のキーワードの入力が異常であることの検出を行うことができる。
【0079】
また、上述の実施の形態に係る異常入力検出装置においては、入力が異常であることを検出した場合に、所定の警告を警告表示として表示しているが、警告表示を表示する代わりに、検出された異常な入力を自動的に除外するようにしてもよい。
【0080】
【発明の効果】
この発明によれば、特定の所定期間(例えば、特定の日)のキーワードの入力回数が直前の所定期間(例えば、特定の日の前日)のキーワードの入力回数より所定の割合以上増加している場合に、特定の所定期間の直後の所定期間(例えば、特定の日の翌日)のキーワードの入力回数と、特定の所定期間のキーワードの入力回数とを比較し、特定の所定期間のキーワードの入力が異常であることを検出している。即ち、特定の所定期間において入力回数が増加したキーワードについて、特定の所定期間の後のそのキーワードの入力回数のみに基づいて、特定の所定期間のそのキーワードの入力が異常であることの検出を容易に行うことができる。
【0081】
また、キーワードの入力回数の変動に基づいて、容易に特定の所定期間のキーワードの入力が異常であることの検出を行うことができるため、意図的に入力回数を増加させた異常な入力を排除した適切なキーワードデータを取得することができる。従って、異常な入力を排除した適切なキーワードデータに基づいて、消費者の潜在的なニーズや消費者の関心等を的確に分析するデータマイニングを行うことができる。
【図面の簡単な説明】
【図1】この発明の実施の形態に係る異常入力検出装置を含むシステム全体のブロック構成図である。
【図2】この発明の実施の形態に係るキーワードデータ記憶部に記憶されるキーワードデータの一例を示す図である。
【図3】この発明の実施の形態に係る急騰キーワードを判定する処理を説明するためのフローチャートである。
【図4】この発明の実施の形態に係る異常入力の第1の検出処理を説明するためのフローチャートである。
【図5】この発明の実施の形態に係る異常入力の第2の検出処理を説明するためのフローチャートである。
【図6】この発明の実施の形態に係る異常入力の第3の検出処理を説明するためのフローチャートである。
【図7】この発明の実施の形態に係る異常入力の第4の検出処理を説明するためのフローチャートである。
【符号の説明】
2…異常入力検出装置、4…ネットワーク、6…Webサーバ、8a、8b、8c…消費者システム、20…データ処理部、22…キーワードデータ記憶部、24…通信制御部、26…表示部。

Claims (10)

  1. 入力されたキーワード及び所定期間毎における前記キーワードの入力回数を記憶するキーワードデータ記憶手段と、
    前記キーワードデータ記憶手段に記憶されている特定の所定期間の前記キーワードの入力回数と、該特定の所定期間の直前の所定期間の前記キーワードの入力回数とを比較する第1の入力回数比較手段と、
    前記第1の入力回数比較手段により比較した結果、前記特定の所定期間の前記キーワードの入力回数が前記直前の所定期間の前記キーワードの入力回数よりも所定の割合以上増加している場合に、前記特定の所定期間の前記キーワードの入力回数と、該特定の所定期間の直後の所定期間の前記キーワードの入力回数とを比較する第2の入力回数比較手段と、
    前記第2の入力回数比較手段により比較した結果、前記直後の所定期間の前記キーワードの入力回数が前記特定の所定期間の前記キーワードの入力回数に対して所定の割合以下の場合に、前記特定の所定期間の前記キーワードの入力が異常であることを検出する異常入力検出手段と、
    前記異常入力検出手段により異常であることを検出した場合に、前記特定の所定期間の前記キーワードの入力が異常であるとして警告を行う警告手段と
    を備えることを特徴とする異常入力検出装置。
  2. 前記キーワードデータは、消費者によって電子的手段を介してサーバに入力され該サーバに記憶されているデータであって、
    前記サーバから、前記所定期間毎に前記キーワードデータを取得するキーワードデータ取得手段を更に備えることを特徴とする請求項1記載の異常入力検出装置。
  3. 前記キーワードデータ記憶手段に記憶されている前記特定の所定期間の前記キーワードの入力回数と、過去の同一曜日の所定期間の前記キーワードの入力回数とを比較する曜日入力回数比較手段を更に備え、
    前記第2の入力回数比較手段は、前記曜日入力回数比較手段により比較した結果、前記特定の所定期間の前記キーワードの入力回数が、前記過去の同一曜日の所定期間の前記キーワードの入力回数に対して所定の割合以上増加している場合に、前記特定の所定期間の前記キーワードの入力回数と前記直後の所定期間の前記キーワードの入力回数とを比較することを特徴とする請求項1又は請求項2記載の異常入力検出装置。
  4. 入力されたキーワード及び第1の所定期間毎における前記キーワードの入力回数を記憶するキーワードデータ記憶手段と、
    前記キーワードデータ記憶手段に記憶されている特定の第1の所定期間の前記キーワードの入力回数と、該特定の第1の所定期間の直前の第1の所定期間の前記キーワードの入力回数とを比較する第1の入力回数比較手段と、
    前記第1の入力回数比較手段により比較した結果、前記特定の第1の所定期間の前記キーワードの入力回数が前記直前の第1の所定期間の前記キーワードの入力回数よりも所定の割合以上増加している場合に、前記キーワードデータ記憶手段に記憶されている前記第1の所定期間毎の前記キーワードの入力回数のうち、前記特定の第1の所定期間の直前の第2の所定期間内における前記第1の所定期間毎の前記キーワードの入力回数の平均を平均入力回数として算出する平均入力回数算出手段と、
    前記平均入力回数と前記特定の第1の所定期間の直後の第3の所定期間内における前記第1の所定期間毎の前記キーワードの入力回数とを比較する第3の入力回数比較手段と、
    前記第3の入力回数比較手段により比較した結果、前記直後の第3の所定期間内における前記第1の所定期間毎の前記キーワードの入力回数の前記平均入力回数に対する増加数の絶対値が、所定の範囲内の場合に、前記特定の第1の所定期間の前記キーワードの入力が異常であることを検出する異常入力検出手段と、
    前記異常入力検出手段により異常であることを検出した場合に、前記特定の第1の所定期間の前記キーワードの入力が異常であるとして警告を行う警告手段と
    を備えることを特徴とする異常入力検出装置。
  5. 前記キーワードデータ記憶手段に記憶されている前記特定の第1の所定期間の前記キーワードの入力回数と、過去の同一曜日の所定期間の前記キーワードの入力回数とを比較する曜日入力回数比較手段を更に備え、
    前記平均入力回数算出手段は、前記曜日入力回数比較手段により比較した結果、前記特定の第1の所定期間の前記キーワードの入力回数が、前記過去の同一曜日の第1の所定期間の前記キーワードの入力回数に対して所定の割合以上増加している場合に、前記平均入力回数を算出することを特徴とする請求項4記載の異常入力検出装置。
  6. 入力されたキーワード及び第1の所定期間毎における前記キーワードの入力回数を記憶するキーワードデータ記憶手段と、
    前記キーワードデータ記憶手段に記憶されている特定の第1の所定期間の前記キーワードの入力回数と、該特定の第1の所定期間の直前の第1の所定期間の前記キーワードの入力回数とを比較する入力回数比較手段と、
    前記入力回数比較手段により比較した結果、前記特定の第1の所定期間の前記キーワードの入力回数が、前記直前の第1の所定期間の前記キーワードの入力回数よりも所定の割合以上増加している場合に、前記キーワードデータ記憶手段に記憶されている前記第1の所定期間毎の前記キーワードの入力回数のうち、前記特定の第1の所定期間の直後の第2の所定期間内における前記第1の所定期間毎の前記キーワードの入力回数が、所定の値以下となっている前記第1の所定期間が所定の数以上存在する場合に、前記特定の第1の所定期間の前記キーワードの入力が異常であることを検出する異常入力検出手段と、
    前記異常入力検出手段により異常であることを検出した場合に、前記特定の第1の所定期間の前記キーワードの入力が異常であるとして警告を行う警告手段と
    を備えることを特徴とする異常入力検出装置。
  7. 前記キーワードデータ記憶手段に記憶されている前記特定の第1の所定期間の前記キーワードの入力回数と、過去の同一曜日の第1の所定期間の前記キーワードの入力回数とを比較する曜日入力回数比較手段を更に備え、前記異常入力検出手段は、前記曜日入力回数比較手段により比較した結果、前記特定の第1の所定期間の前記キーワードの入力回数が、前記過去の同一曜日の第1の所定期間の前記キーワードの入力回数に対して所定の割合以上増加している場合に、前記特定の第1の所定期間の前記キーワードの入力が異常であることの検出を行うことを特徴とする請求項6記載の異常入力検出装置。
  8. 入力されたキーワード及び第1の所定期間毎における前記キーワードの入力回数を記憶するキーワードデータ記憶手段と、
    前記キーワードデータ記憶手段に記憶されている特定の第1の所定期間の前記キーワードの入力回数と、該特定の第1の所定期間の直前の第1の所定期間の前記キーワードの入力回数とを比較する入力回数比較手段と、
    前記入力回数比較手段により比較した結果、前記特定の第1の所定期間の前記キーワードの入力回数が前記直前の第1の所定期間の前記キーワードの入力回数よりも所定の割合以上増加している場合に、前記キーワードデータ記憶手段に記憶されている前記第1の所定期間毎の前記キーワードの入力回数のうち、前記特定の第1の所定期間の直前の第2の所定期間内における前記第1の所定期間毎の前記キーワードの入力回数の平均を直前平均入力回数として算出する直前平均入力回数算出手段と、
    前記キーワードデータ記憶手段に記憶されている前記第1の所定期間毎の前記キーワードの入力回数のうち、前記特定の第1の所定期間の直後の第2の所定期間内における前記第1の所定期間毎の前記キーワードの入力回数の平均を直後平均入力回数として算出する直後平均入力回数算出手段と、
    前記直前平均入力回数と、前記直後平均入力回数とを比較する平均入力回数比較手段と、
    前記平均入力回数比較手段により比較した結果、前記直後平均入力回数が前記直前平均入力回数に対して所定の倍数以下である場合に、前記特定の第1の所定期間の前記キーワードの入力が異常であることを検出する異常入力検出手段と、
    前記異常入力検出手段により異常であることを検出した場合に、前記特定の第1の所定期間の前記キーワードの入力が異常であるとして警告を行う警告手段と
    を備えることを特徴とする異常入力検出装置。
  9. 前記キーワードデータ記憶手段に記憶されている前記特定の第1の所定期間の前記キーワードの入力回数と、過去の同一曜日の第1の所定期間の前記キーワードの入力回数とを比較する曜日入力回数比較手段を更に備え、前記直前平均入力回数算出手段は、前記曜日入力回数比較手段により比較した結果、前記特定の第1の所定期間の前記キーワードの入力回数が、前記過去の同一曜日の第1の所定期間の前記キーワードの入力回数に対して所定の割合以上増加している場合に、前記直前平均入力回数を算出することを特徴とする請求項8記載の異常入力検出装置。
  10. 前記キーワードデータは、消費者によって電子的手段を介してサーバに入力され該サーバに記憶されているデータであって、
    前記サーバから、前記第1の所定期間毎に前記キーワードデータを取得するキーワードデータ取得手段を更に備えることを特徴とする請求項4〜請求項9の何れか一項に記載の異常入力検出装置。
JP2002306553A 2002-10-22 2002-10-22 異常入力検出装置 Expired - Fee Related JP4283522B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002306553A JP4283522B2 (ja) 2002-10-22 2002-10-22 異常入力検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002306553A JP4283522B2 (ja) 2002-10-22 2002-10-22 異常入力検出装置

Publications (2)

Publication Number Publication Date
JP2004145414A JP2004145414A (ja) 2004-05-20
JP4283522B2 true JP4283522B2 (ja) 2009-06-24

Family

ID=32453264

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002306553A Expired - Fee Related JP4283522B2 (ja) 2002-10-22 2002-10-22 異常入力検出装置

Country Status (1)

Country Link
JP (1) JP4283522B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106611023A (zh) * 2015-10-27 2017-05-03 北京国双科技有限公司 网站访问异常的检测方法及装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4504849B2 (ja) * 2005-03-16 2010-07-14 株式会社野村総合研究所 キーワード分析システム
JP5040718B2 (ja) * 2008-02-21 2012-10-03 日本電気株式会社 スパム・イベント検出装置及び方法並びにプログラム
JP6964367B1 (ja) 2021-01-05 2021-11-10 株式会社Rilarc 情報処理装置、情報処理方法及び情報処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106611023A (zh) * 2015-10-27 2017-05-03 北京国双科技有限公司 网站访问异常的检测方法及装置
CN106611023B (zh) * 2015-10-27 2020-11-24 北京国双科技有限公司 网站访问异常的检测方法及装置

Also Published As

Publication number Publication date
JP2004145414A (ja) 2004-05-20

Similar Documents

Publication Publication Date Title
CN109241461B (zh) 一种用户画像构建方法及装置
KR101708444B1 (ko) 키워드 및 자산 가격 관련성 평가 방법 및 그 장치
US9544382B2 (en) Providing content items based on user affinity in a social network environment
US7979544B2 (en) Computer program product and method for estimating internet traffic
US7890451B2 (en) Computer program product and method for refining an estimate of internet traffic
US20080189281A1 (en) Presenting web site analytics associated with search results
US20160364736A1 (en) Method and system for providing business intelligence based on user behavior
US7933984B1 (en) Systems and methods for detecting click spam
US9495442B2 (en) System and method for automatically publishing data items associated with an event
US20110225197A1 (en) User specific feed recommendations
CN112052394B (zh) 专业内容信息的推荐方法、系统、终端设备和存储介质
CN110992135B (zh) 一种风险识别方法、装置、电子设备及存储介质
WO2009064741A1 (en) Systems and methods for normalizing clickstream data
JP2011227721A (ja) 関心抽出装置、関心抽出方法、及び関心抽出プログラム
US9400843B2 (en) Adjusting stored query relevance data based on query term similarity
US9942117B1 (en) Metric anomaly detection in a digital medium environment
JP4283522B2 (ja) 異常入力検出装置
US8005775B2 (en) System and method for detecting human judgment drift and variation control
US20160371712A1 (en) Method and Score Management Node For Supporting Service Evaluation
JP3635260B2 (ja) キーワード分析システム
CN110443451B (zh) 事件定级方法、装置、计算机设备和存储介质
KR20140094892A (ko) 실사용 이력 기반 디지털 컨텐츠 추천 방법 및 그 장치
JP2019145987A (ja) 情報処理装置、情報処理方法及びプログラム
CN113822566A (zh) 业务考核处理方法、装置、计算机设备和存储介质
JP4504849B2 (ja) キーワード分析システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051021

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060207

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090317

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090319

R150 Certificate of patent or registration of utility model

Ref document number: 4283522

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120327

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130327

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130327

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140327

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees