JP5067556B2 - トレンド評価装置と、その方法及びプログラム - Google Patents

トレンド評価装置と、その方法及びプログラム Download PDF

Info

Publication number
JP5067556B2
JP5067556B2 JP2007539856A JP2007539856A JP5067556B2 JP 5067556 B2 JP5067556 B2 JP 5067556B2 JP 2007539856 A JP2007539856 A JP 2007539856A JP 2007539856 A JP2007539856 A JP 2007539856A JP 5067556 B2 JP5067556 B2 JP 5067556B2
Authority
JP
Japan
Prior art keywords
keyword
relative
trend
related word
occurrence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007539856A
Other languages
English (en)
Other versions
JPWO2007043322A1 (ja
Inventor
英紀 河合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007539856A priority Critical patent/JP5067556B2/ja
Publication of JPWO2007043322A1 publication Critical patent/JPWO2007043322A1/ja
Application granted granted Critical
Publication of JP5067556B2 publication Critical patent/JP5067556B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明はトレンド評価装置とその方法及びプログラムに関し、特に関連語の変化が著しいトレンド語を評価することができるトレンド評価装置とその方法及びプログラムに関する。
近年、EC(Electronic Commerce)の普及と共に、コンテンツプロバイダやオンラインショップなどの事業者は、膨大な量の製品や、コンテンツ・サービス(以下、製品、コンテンツ・サービスをまとめて単に商品と呼ぶ)を扱えるようになってきた。一方で、適切な商品を適切なタイミングで利用者に推薦したり、プロモーションしたりすることが困難になってきている。プロモーション方法の一つとして、世の中で話題性の高いトレンドや流行に、自社が扱う商品を関連付けて推薦する方法が考えられる。ところが、これを商品の推薦者(以下、プロモータと呼ぶ)が全て人手で行うのは、次の2つの理由から手間がかかる。
(1)何がトレンドであるのかを判断するのが大変(流行への敏感さは人によるため、プロモータによって品質が異なってしまう)
(2)トレンドにふさわしい関連商品を探すのが大変(トレンドに関連するキーワードの選定と検索とに時間がかかる)
話題性の高いトレンドや流行を自動的に検出する技術として、以下の特許文献が挙げられる。
特開平7−325832号公報
特許文献1の発明では、新聞などの時系列テキストから、ある単語の出現確率の時間変化(相対出現度)を算出することによって、プロモータは客観的にその単語のトレンド性を判断できるようになり、以下のような検索を行うことができる。
(1) 指定された分野・期間において、相対出現度が大きい単語を検索する。
(2) 指定された分野において、指定された単語の相対出現度が大きい期間を検索する。
(3) 指定された分野において、指定された単語の相対出現度が大きい期間に、同時に相対出現度が大きくなっている別の単語を検索する。
(4) 指定された単語の相対出現度が大きい分野・期間を検索する。
(5) 指定された単語の相対出現度が大きい分野・期間において、同時に相対出現度が大きくなっている別の単語を検索する。
特許文献1に記載されている従来のトレンド評価の問題点は、ある単語の相対出現度が高くならないと、その単語をトレンド語として検出できないということである。その理由は、ある単語のトレンド性の判定に相対出現度しか利用していないからである。
そこで、本発明は上記課題に鑑みて発明されたものであって、その目的は、相対出現度が高くならなくとも、関連語の変化が著しい単語をトレンド語として評価・検出することができるトレンド評価装置と、その方法及びプログラムを提供することにある。
上記課題を解決する第1の発明は、トレンド評価装置であって、キーワードと、このキーワードの関連語との共起確率の変化を示す指標である相対共起度を計算する相対共起度計算手段と、前記相対共起度計算手段で計算された相対共起度に基づいて、前記キーワードのトレンドを評価するトレンド評価手段とを有することを特徴とする。
上記課題を解決する第2の発明は、上記第1の発明において、前記相対共起度計算手段は、キーワードとこのキーワードの関連語との比較期間の共起確率に対する前記キーワードとこのキーワードの関連語との比較期間の共起確率の比から相対共起度を計算する手段であることを特徴とする。
上記課題を解決する第3の発明は、上記第1又は第2の発明において、前記トレンド評価手段は、最も大きい相対共起度のキーワードとこのキーワードの関連語との組み合わせをトレンドと評価する手段であることを特徴とする。
上記課題を解決する第4の発明は、上記第1又は第2の発明において、前記トレンド評価手段は、所定の閾値を超えた相対共起度のキーワードとこのキーワードの関連語との組み合わせをトレンドと評価する手段であることを特徴とする。
上記課題を解決する第5の発明は、上記第1又は第2の発明において、前記トレンド評価手段は、所定期間の相対共起度を蓄積して分散値を求め、所定の閾値を超えた前記分散値に対応するキーワードとこのキーワードの関連語との組み合わせをトレンドと評価する手段であることを特徴とする。
上記課題を解決する第6の発明は、トレンド評価装置であって、キーワードに関する話題の変化の度合いの指標である相対関連語類似度を計算する相対関連語類似度計算手段と、前記相対関連語類似度計算手段で計算された相対関連語類似度に基づいて、前記キーワードのトレンドを評価するトレンド評価手段とを有することを特徴とする。
上記課題を解決する第7の発明は、上記第6の発明において、前記相対関連語類似度計算手段は、比較期間におけるキーワードの関連語集合ベクトルと、対象期間における前記キーワードの関連語集合ベクトルとのコサイン類似度から相対関連語類似度を計算する手段であることを特徴とする。
上記課題を解決する第8の発明は、上記第6又は第7の発明において、前記トレンド評価手段は、最も小さい相対関連語類似度のキーワードをトレンドと評価する手段であることを特徴とする。
上記課題を解決する第9の発明は、上記第6又は第7の発明において、前記トレンド評価手段は、所定の閾値より小さい相対関連語類似度のキーワードをトレンドと評価する手段であることを特徴とする。
上記課題を解決する第10の発明は、上記第6又は第7の発明において、前記トレンド評価手段は、所定期間の相対関連語類似度を蓄積して分散値を求め、所定の閾値を超えた前記分散値に対応する相対関連語類似度をトレンドと評価する手段であることを特徴とする。
上記課題を解決する第11の発明は、トレンド評価装置であって、キーワードと、このキーワードの関連語との共起確率の変化を示す指標である相対共起度を計算する相対共起度計算手段と、前記キーワードに関する話題の変化の度合いの指標である相対関連語類似度を計算する相対関連語類似度計算手段と、前記相対共起度計算手段で計算された相対共起度と、前記相対関連語類似度計算手段で計算された相対関連語類似度とに基づいて、前記キーワードのトレンド性を数値化するトレンドスコアを計算するトレンドスコア計算手段とを有することを特徴とする。
上記課題を解決する第12の発明は、上記第11の発明において、前記トレンドスコアに基づいて、前記キーワードのトレンドを評価するトレンド評価手段を有することを特徴とする。
上記課題を解決する第13の発明は、上記第11又は第12の発明において、キーワードに対する注目度の上昇度合いを示す指標である相対出現度を計算する相対出現度計算手段を有し、前記トレンドスコア計算手段は、前記相対共起度計算手段で計算された相対共起度と、前記相対関連語類似度計算手段で計算された相対関連語類似度と、前記相対出現度計算手段で計算された相対出現度とに基づいて、前記キーワードのトレンド性を数値化するトレンドスコアを計算することを特徴とする。
上記課題を解決する第14の発明は、上記第1から第13のいずれかの発明において、前記相対出現度計算手段は、比較期間におけるキーワードの出現確率に対する、対象期間における前記キーワードの出現確率の比から相対出現度を計算する手段であることを特徴とする。
上記課題を解決する第15の発明は、上記第11から第14のいずれかの発明において、前記トレンドスコア計算手段は、前記相対共起度、前記相対関連語類似度又は、前記相対出現度に対して重み付けを行った後に、トレンドスコアを計算することを特徴とする。
上記課題を解決する第16の発明は、上記第11から第15のいずれかの発明において、前記相対共起度、前記相対関連語類似度又は前記相対出現度を図形化して表示するトレンド可視化手段を有することを特徴とする。
上記課題を解決する第17の発明は、上記第12から第16のいずれかの発明において、商品に関する情報が格納された商品情報記憶手段と、前記トレンド評価手段の結果に基づくキーワードに関連する商品を、前記商品情報記憶手段から検索して提示する商品推薦手段とを有することを特徴とする。
上記課題を解決する第18の発明は、上記第11から第17のいずれかの発明において、キーワードのトレンドスコアの周期性を判断し、周期性に対応してトレンドスコアを補正する周期性判定手段を有することを特徴とする。
上記課題を解決する第19の発明は、上記第12から第18のいずれかの発明において、商品に関する情報が格納された商品情報記憶手段と、顧客に関する顧客情報が格納された顧客情報記憶手段と、前記トレンド評価手段の結果に基づくキーワードに関連する商品を、前記商品情報記憶手段から検索し、この商品を推薦する顧客を前記顧客情報に基づいて前記顧客情報記憶手段から検索して提示する商品推薦手段とを有することを特徴とする。
上記課題を解決する第20の発明は、上記第19の発明において、販売実績に基づいて、前記顧客情報記憶手段の顧客情報を更新する更新手段を有することを特徴とする。
上記課題を解決する第21の発明は、トレンド評価方法であって、キーワードと、このキーワードの関連語との共起確率の変化を示す指標である相対共起度を計算し、前記相対共起度に基づいて、前記キーワードのトレンドを評価することを特徴とする。
上記課題を解決する第22の発明は、上記第21の発明において、前記相対共起度は、キーワードとこのキーワードの関連語との比較期間の共起確率に対する前記キーワードとこのキーワードの関連語との比較期間の共起確率の比であることを特徴とする。
上記課題を解決する第23の発明は、上記第21又は第22の発明において、複数のキーワードの中で、最も大きい相対共起度のキーワードとこのキーワードの関連語との組み合わせをトレンドと評価することを特徴とする。
上記課題を解決する第24の発明は、上記第21又は第22の発明において、複数のキーワードの中で、所定の閾値を超えた相対共起度のキーワードとこのキーワードの関連語との組み合わせをトレンドと評価することを特徴とする。
上記課題を解決する第25の発明は、上記第21又は第22の発明において、所定期間の相対共起度を蓄積して分散値を求め、所定の閾値を超えた前記分散値に対応するキーワードとこのキーワードの関連語との組み合わせをトレンドと評価することを特徴とする。
上記課題を解決する第26の発明は、トレンド評価方法であって、キーワードに関する話題の変化の度合いの指標である相対関連語類似度を計算し、前記相対関連語類似度に基づいて、前記キーワードのトレンドを評価することを特徴とする。
上記課題を解決する第27の発明は、上記第26の発明において、前記相対関連語類似度は、比較期間におけるキーワードの関連語集合ベクトルと、対象期間における前記キーワードの関連語集合ベクトルとのコサイン類似度であることを特徴とする。
上記課題を解決する第28の発明は、上記第26又は第27の発明において、複数のキーワードの中で、最も小さい相対関連語類似度のキーワードをトレンドと評価することを特徴とする。
上記課題を解決する第29の発明は、上記第26又は第27の発明において、複数のキーワードの中で、所定の閾値より小さい相対関連語類似度のキーワードをトレンドと評価することを特徴とする。
上記課題を解決する第30の発明は、上記第26又は第27の発明において、複数のキーワードの中で、所定期間の相対関連語類似度を蓄積して分散値を求め、所定の閾値を超えた前記分散値に対応する相対関連語類似度をトレンドと評価することを特徴とする。
上記課題を解決する第31の発明は、トレンド評価方法であって、キーワードと、このキーワードの関連語との共起確率の変化を示す指標である相対共起度を計算し、前記キーワードに関する話題の変化の度合いの指標である相対関連語類似度を計算し、前記相対共起度と前記相対関連語類似度とに基づいて、前記キーワードのトレンド性を数値化するトレンドスコアを計算することを特徴とする。
上記課題を解決する第32の発明は、上記第31の発明において、前記トレンドスコアに基づいて、前記キーワードのトレンドを評価することを特徴とする。
上記課題を解決する第33の発明は、上記第31又は第32の発明において、キーワードに対する注目度の上昇度合いを示す指標である相対出現度を計算し、前記相対出現度と、前記相対共起度と、前記相対関連語類似度とに基づいて、前記キーワードのトレンド性を数値化するトレンドスコアを計算することを特徴とする。
上記課題を解決する第34の発明は、上記第31から第32のいずれかの発明において、前記相対出現度は、比較期間におけるキーワードの出現確率に対する、対象期間における前記キーワードの出現確率の比であることを特徴とする。
上記課題を解決する第35の発明は、上記第31から第34のいずれかの発明において、前記相対共起度、前記相対関連語類似度又は、前記相対出現度に対して重み付けを行った後に、トレンドスコアを計算することを特徴とする。
上記課題を解決する第36の発明は、上記第31から第35のいずれかの発明において、前記相対共起度、前記相対関連語類似度又は前記相対出現度を図形化して表示することを特徴とする。
上記課題を解決する第37の発明は、上記第31から第36のいずれかの発明において、商品に関する情報から、トレンドが評価されたキーワードに関連する商品を検索して提示することを特徴とする。
上記課題を解決する第38の発明は、上記第31から第37のいずれかの発明において、キーワードのトレンドスコアの周期性を判断し、周期性に対応してトレンドスコアを補正することを特徴とする。
上記課題を解決する第39の発明は、上記第32から第32のいずれかの発明において、商品に関する情報から、トレンドが評価されたキーワードに関連する商品を検索し、この商品を推薦する顧客を、顧客情報に基づいて検索することを特徴とする。
上記課題を解決する第40の発明は、上記第39の発明において、販売実績に基づいて、前記顧客情報を更新することを特徴とする。
上記課題を解決する第41発明は、トレンドの評価を情報処理装置に実行させるプログラムであって、前記プログラムは情報処理装置に、キーワードと、このキーワードの関連語との共起確率の変化を示す指標である相対共起度を計算する相対共起度計算処理と、前記計算された相対共起度に基づいて、前記キーワードのトレンドを評価するトレンド評価処理とを実行させることを特徴とする。
上記課題を解決する第42の発明は、上記第41の発明において、前記相対共起度計算処理は、キーワードとこのキーワードの関連語との比較期間の共起確率に対する前記キーワードとこのキーワードの関連語との比較期間の共起確率の比から相対共起度を計算することを特徴とする。
上記課題を解決する第43の発明は、上記第41又は第42の発明において、前記トレンド評価処理は、最も大きい相対共起度のキーワードとこのキーワードの関連語との組み合わせをトレンドと評価することを特徴とする。
上記課題を解決する第44の発明は、上記第41又は第42の発明において、前記トレンド評価処理は、所定の閾値を超えた相対共起度のキーワードとこのキーワードの関連語との組み合わせをトレンドと評価することを特徴とする。
上記課題を解決する第45の発明は、上記第41又は第42の発明において、前記トレンド評価処理は、所定期間の相対共起度を蓄積して分散値を求め、所定の閾値を超えた前記分散値に対応するキーワードとこのキーワードの関連語との組み合わせをトレンドと評価することを特徴とする。
上記課題を解決する第46の発明は、トレンドの評価を情報処理装置に実行させるプログラムであって、前記プログラムは情報処理装置に、キーワードに関する話題の変化の度合いの指標である相対関連語類似度を計算する相対関連語類似度計算処理と、前記計算された相対関連語類似度に基づいて、前記キーワードのトレンドを評価するトレンド評価処理とを実行させることを特徴とする。
上記課題を解決する第47の発明は、上記第46の発明において、前記相対関連語類似度計算処理は、比較期間におけるキーワードの関連語集合ベクトルと、対象期間における前記キーワードの関連語集合ベクトルとのコサイン類似度から相対関連語類似度を計算することを特徴とする。
上記課題を解決する第48の発明は、上記第46又は第47の発明において、前記トレンド評価処理は、最も小さい相対関連語類似度のキーワードをトレンドと評価することを特徴とする。
上記課題を解決する第49の発明は、上記第46又は第47の発明において、前記トレンド評価処理は、所定の閾値より小さい相対関連語類似度のキーワードをトレンドと評価することを特徴とする。
上記課題を解決する第50の発明は、上記第46又は第47の発明において、前記トレンド評価処理は、所定期間の相対関連語類似度を蓄積して分散値を求め、所定の閾値を超えた前記分散値に対応する相対関連語類似度をトレンドと評価することを特徴とする。
上記課題を解決する第51の発明は、トレンドの評価を情報処理装置に実行させるプログラムであって、前記プログラムは情報処理装置に、キーワードと、このキーワードの関連語との共起確率の変化を示す指標である相対共起度を計算する相対共起度計算処理と、前記キーワードに関する話題の変化の度合いの指標である相対関連語類似度を計算する相対関連語類似度計算処理と、前記計算された相対共起度と、前記計算された相対関連語類似度とに基づいて、前記キーワードのトレンド性を数値化するトレンドスコアを計算するトレンドスコア計算処理とを実行させることを特徴とする。
上記課題を解決する第52の発明は、上記第51の発明において、前記トレンドスコアに基づいて、前記キーワードのトレンドを評価するトレンド評価処理を有することを特徴とする。
上記課題を解決する第53の発明は、上記第51又は第52の発明において、前記プログラムは情報処理装置に、キーワードに対する注目度の上昇度合いを示す指標である相対出現度を計算する相対出現度計算処理を実行させ、前記トレンドスコア計算処理は、前記計算された相対共起度と、前記相対関連語類似度と、前記計算された相対出現度とに基づいて、前記キーワードのトレンド性を数値化するトレンドスコアを計算することを特徴とする。
上記課題を解決する第54の発明は、上記第51から第53のいずれかの発明において、前記相対出現度計算処理は、比較期間におけるキーワードの出現確率に対する、対象期間における前記キーワードの出現確率の比から相対出現度を計算することを特徴とする。
上記課題を解決する第55の発明は、上記第51から第54のいずれかの発明において、前記トレンドスコア計算処理は、前記相対共起度、前記相対関連語類似度又は、前記相対出現度に対して重み付けを行った後に、トレンドスコアを計算することを特徴とする。
上記課題を解決する第56の発明は、上記第51から第55のいずれかの発明において、前記プログラムは情報処理装置に、前記相対共起度、前記相対関連語類似度又は前記相対出現度を図形化して表示するトレンド可視化処理を実行させることを特徴とする。
上記課題を解決する第57の発明は、上記第51から第56のいずれかの発明において、前記プログラムは情報処理装置に、前記トレンド評価処理の結果に基づくキーワードに関連する商品を、商品に関する情報が格納された商品情報記憶手段から検索して提示する商品推薦処理を実行させることを特徴とする。
上記課題を解決する第58の発明は、上記第51から第57のいずれかの発明において、前記プログラムは情報処理装置に、キーワードのトレンドスコアの周期性を判断し、周期性に対応してトレンドスコアを補正する周期性判定処理を実行させることを特徴とする。
上記課題を解決する第59の発明は、上記第52から第58のいずれかの発明において、前記プログラムは情報処理装置に、前記トレンド評価処理の結果に基づくキーワードに関連する商品を、商品に関する情報が格納された商品情報記憶手段から検索し、この商品を推薦する顧客を前記顧客情報に基づいて顧客に関する顧客情報が格納された顧客情報記憶手段から検索して提示する商品推薦処理を実行させることを特徴とする。
上記課題を解決する第60の発明は、上記第59の発明において、前記プログラムは情報処理装置に、販売実績に基づいて、前記顧客情報記憶手段の顧客情報を更新する更新処理を実行させることを特徴とする。
本発明は、キーワードと関連語との共起確率の変化を計算する相対共起確率計算手段と、キーワードに関する話題の変化の度合いを計算する相対関連語類似度計算手段との少なくとも一方を有し、これらの手段によって求められた相対共起度、相対関連語類似度のうち1つまたは複数の組合せを考慮してトレンドスコアを計算するトレンド評価手段を有する。このような構成を採用することによって、キーワードに対する注目度自体には変化が無く、むしろ低下傾向であっても、特定のサブトピックへの注目度が高まったキーワードや、話題全体に変化があったキーワードをトレンドとして検出することが可能となる。
本発明の第1の効果は、キーワードに対する注目度の高さによらず、話題が大きく変化したキーワードをトレンドとして検出することが可能であることである。その理由は、特定のキーワードとの共起確率の変化である相対共起度や、キーワードに関する話題の変化の度合いである相対関連語類似度を考慮してトレンド性を判定するからである。
また、本発明の第2の効果は、キーワードに関連するトピックがどのように変化しているのかを簡単に把握することが可能なことである。その理由は、キーワードに関連する文書一覧や、相対出現度、相対共起度、相対関連度類似度に関するグラフを表示できるからである。
また、本発明の第3の効果は、(1)何がトレンドであるのかを判断し、(2)トレンドにふさわしい関連商品を探す作業が自動化され、商品のプロモーション方法の検討作業を効率化できることである。その理由は、トレンドとして検出されたキーワードの関連文書や関連語とともに、関連商品を検索して提示できるからである。
また、本発明の第4の効果は、分析の対象期間ではまだトレンドとして検出されるほど大きな変化が現れていなくても、周期的にトレンドになるキーワードであれば、早めのタイミングでトレンドとして検出が可能なことである。その理由は、過去のトレンド検出のデータから、キーワードのトレンドスコアが周期的に高くなる期間を集計し、分析対象期間でのトレンドスコアに対して補正を行うからである。
また、本発明の第5の効果は、トレンドに関連した商品を誰に対して推薦すべきかを判断することが可能なことである。その理由は、トレンドに関連するキーワードを使って、トレンドに関心の高い顧客を検索するからである。
また、本発明の第6の効果は、実際の販売実績に即して、より適切な顧客に対してトレンド関連商品の推薦が可能なことである。その理由は、実際の販売実績を元に顧客情報を修正して商品を推薦すべき顧客を検索するからである。
本発明の第1の実施の形態の構成を示すブロック図である。 本発明の第1の実施の形態における時系列テキスト記憶部に格納されるデータの例である。 本発明の第1の実施の形態における関連語記憶部に格納されるデータの例である。 本発明の第1の実施の形態におけるトレンド語記憶部に格納されるデータの例である。 本発明の第1の実施の形態の動作を示す流れ図である。 本発明の第1の実施の形態におけるトレンド検出初期画面の例である。 本発明の第1の実施の形態におけるトレンド検出結果画面の例である。 本発明の第2の実施の形態の構成を示すブロック図である。 本発明の第2の実施の形態における商品情報記憶部に格納される商品データの例である。 本発明の第2の実施の形態における商品情報記憶部に格納される番組データの例である。 本発明の第2の実施の形態の動作を示す流れ図である。 本発明の第2の実施の形態における商品推薦画面で商品を推薦する例である。 本発明の第2の実施の形態における商品推薦画面で番組を推薦する例である。 本発明の第3の実施の形態の構成を示すブロック図である。 本発明の第3の実施の形態の動作を示す流れ図である。 本発明の第3の実施の形態において周期性判定手段が集計する周期データの例である。 本発明の第4の実施の形態の構成を示すブロック図である。 本発明の第4の実施の形態において顧客情報記憶部に格納されるデータの例である。 本発明の第4の実施の形態の動作を示す流れ図である。 本発明の第4の実施の形態における商品推薦画面の例である。 本発明の第5の実施の形態の構成を示すブロック図である。 本発明の第5の実施の形態において販売実績記憶部に格納されるデータの例である。 本発明の第5の実施の形態の動作を示す流れ図である。 本発明の第6〜10の実施の形態の構成を示すブロック図である。 本発明の第1の実施の形態におけるトレンド評価装置500のブロック図である。 本発明の第1の実施の形態における時刻情報が付与された文書データの例である。 本発明の第1の実施の形態における共起確率の例である。 本発明の第1の実施の形態における相対共起度の例である。 本発明の第2の実施の形態におけるトレンド評価装置600のブロック図である。
符号の説明
101〜105 トレンド評価装置
201 入力装置
301 出力装置
11 時系列テキスト記憶部
12 関連語記憶部
13 トレンド語記憶部
14 商品情報記憶部
15 顧客情報記憶部
16 販売実績記憶部
21 関連語抽出手段
22 相対出現度計算手段
23 相対共起度計算手段
24 相対関連語類似度計算手段
25 トレンド評価手段
26 トレンド可視化手段
27 商品推薦手段
28 周期性判定手段
29 第2の商品推薦手段
30 第3の商品推薦手段
本発明の第1の実施の形態を説明する。
図25は本発明の第1の実施の形態におけるトレンド評価装置500のブロック図である。
トレンド評価装置500は、特定のキーワードとこのキーワードの関連語との共起確率の変化を示す相対共起度を計算する相対共起度計算手段501と、計算された相対共起度に基づいてトレンドの評価を行うトレンド評価手段502とから構成される。
相対共起度計算手段501には、特定キーワードとこのキーワードの関連語との比較期間の共起確率と、特定キーワードとこのキーワードの関連語との対象期間の共起確率が入力され、これらに基づいて相対共起度が計算される。
ここで、相対共起度計算手段501に入力される共起確率について説明する。
まず、共起確率が計算される前提として、キーワードの抽出が行われる。キーワードの抽出は、図26に示されるような時刻情報が付与された文書データから、形態素解析システムを用いてキーワードが抽出される。例えば、入力文が「首都圏で震度5強の強い地震」の場合、形態素解析システムを用いると、「首都/圏/で/震度/5/強/の/強い/地震」と形態素に分割される。この例では、文を形態素に分割する例であるが、形態素解析システムの多くには、品詞情報も付与する機能を有するものもあり、品詞情報が付与された場合、出力は、「首都(名詞)/圏(名詞)/で(助詞)/震度(名詞)/5(未知語)/強(名詞)/の(助詞)/強い(形容詞)/地震(名詞)」のようになる。このようにして分割された用語から所定のキーワードを抽出し、抽出された所定のキーワードと、このキーワードと関連のある関連語とが共に出現する割合が共起確率である。すなわち、キーワードKに対する関連語Jの共起確率とは、キーワードKが出現した文書数に占めるキーワードKと関連語Jとが両方とも出現した文書数の割合、または、(Webページであれば)キーワードKが出現したサイト数に占めるキーワードKと関連語Jとが両方出現したサイト数の割合などである。例えば、サイト数ベースの共起確率を用いることにした場合、「地震」が出現したサイト数が120件であるのに対し、「地震」「震度」が両方出現したサイト数が72件だとすると、「地震」に対する「震度」の共起確率は72/120=60%となる。このように計算された共起確率が相対共起度計算手段501に入力される。
続いて、本発明の特徴である相対共起度の計算について説明する。相対共起度は、特定のキーワードとこのキーワードの関連語との共起確率の変化を示す指標である。すなわち、キーワードKと関連語Jとの相対共起度は、キーワードKのサブトピック(関連語)に関する注目度の上昇度合いを表す指標である。具体的には、比較期間におけるキーワードKと関連語Jとの共起確率Pb(J|K)に対する対象期間におけるキーワードKと関連語Jの共起確率Pt(J|K)の比Pt(J|K)/Pb(J|k)として計算できる。例えば、キーワード「地震」と関連語「震度」の比較期間2005年6月1日〜2005年6月30日における共起確率Pb(震度|地震)が50%、対象期間2005年7月21日〜2005年7月27日における共起確率Pt(震度|地震)が60%であったとすると、「地震」と「震度」の相対共起度はPt(J|K)/Pb(J|k)=60/50=1.2となる。相対共起度の値が大きいほど、対象期間でキーワードとその関連語との結びつきが強くなっているということを意味している。
トレンド評価手段502は、計算された相対共起度から対象期間のトレンドを評価する。評価方法であるが、最も簡単な方法として、特定キーワードと、この特定キーワードの中で相対共起度の最も大きい関連語との組み合わせをトレンドと評価する方法がある。例えば、対象期間において、キーワード「サッカー」の相対共起度の中で、関連語「女子」の相対共起度が最も大きい場合、「女子サッカー」に注目が集まっていると評価する方法である。他の方法としては、所定の閾値を設け、この閾値を超えたものについては注目が集まっていると評価する方法である。更に、特定キーワードとその関連語との相対共起度を所定の期間蓄積しておき、その分散を計算し、分散値がある一定の閾値を超えた場合、注目が集まっていると評価する方法もある。
更に、他のトレンド評価の方法として、上述した比較期間における共起確率を1日単位で計算し、その平均値Psと分散Vを求め、同様に対象期間における共起確率を1日単位で計算し、その平均値Pxを求め、平均値の比H=(Px-Ps)/Psと分散の逆数G=1/Vの積F=H×Gを求め、この積Fを相対共起度として用いる。この場合、積Fが大きければ大きいほど、対象期間でキーワードとその関連語との結びつきが強くなっており、また、対象期間でキーワードとその関連語との結びつきの強さが大きく変化していることを示しており、相対共起度が普段に比べてどれだけ激しく変化したかがわかる。従って、通常の変化と思われる所定の閾値を設定しておき、この閾値を超えた積F(相対共起度)に対応する特定キーワードや、その関連語がトレンドと評価することができる。
次に、このように構成されたトレンド評価装置500の具体的な動作を説明する。
まず、トレンド評価装置500の相対共起度計算手段501には、図27に示されるような、期間2005年6月1日〜2005年6月30日の共起確率と、期間2005年7月21日〜2005年7月27日の共起確率とが入力される。
ここで、相対共起度計算手段501は、対象期間が2005年7月21日〜2005年7月27日、比較期間が2005年6月1日〜2005年6月30日の相対共起度を計算するものとする。
すると、キーワード「地震」の関連語「震度」の相対共起度は、60/50=1.2となる。キーワード「地震」の関連語「震災」の相対共起度は、30/37.5=0.8となる。キーワード「地震」の関連語「津波」の相対共起度は、10/5=2となる。同様に、キーワード「サッカー」の関連語「Jリーグ」の相対共起度は、50/83=0.6となる。キーワード「サッカー」の関連語「セリエA」の相対共起度は、30/37.5=0.8となる。キーワード「サッカー」の関連語「女子」の相対共起度は、20/1.3=15.8となる。同様に、キーワード「京都」の関連語「祇園祭り」の相対共起度は、40/20=2となる。キーワード「京都」の関連語「宵山」の相対共起度は、30/2.6=11.5となる。キーワード「京都」の関連語「山鉾巡行」の相対共起度は、30/1.2=25.9となる。このような相対共起度の結果を示したのが、図28である。
トレンド評価手段502は、図28に示されるような計算された相対共起度を入力とし、トレンドの評価を行う。ここでは、各キーワードの相対共起度の最も大きいものを選択することによって、各キーワードにおける最も注目が集まっているキーワードを評価するものとする。このような評価において、キーワード「地震」では、関連語「津波」の相対共起度が2であるので最も大きく、「地震」と関連して「津波」に注目が集まっていると評価できる。また、キーワード「サッカー」では、関連語「女子」の相対共起度が15.8であるので最も大きく、「サッカー」の中でも「女子サッカー」に注目が集まっていると評価できる。キーワード「京都」では、関連語「山鉾巡行」の相対共起度が25.9であるので最も大きく、「京都」の中でも「山鉾巡行」に注目が集まっていると評価できる。
このように、特定キーワードとこのキーワードの関連語との共起確率の変化である相対共起度に基づいて、トレンドを評価するようにしたので、キーワードに対して今どのようなものがトレンドであるのかを評価することが可能である。
本発明の第2の実施の形態を説明する。
図29は本発明の第2の実施の形態におけるトレンド評価装置600のブロック図である。
トレンド評価装置600は、キーワードに関する話題の変化の度合いの指標である相対関連語類似度を計算する相対関連語類似度計算手段601と、計算された相対関連語類似度に基づいてトレンドの評価を行うトレンド評価手段602とから構成される。
相対関連語類似度計算手段601には、特定キーワードとこのキーワードの関連語とが入力され、これらに基づいて相対関連語類似度が計算される。
ここで、相対関連語類似度計算手段601に入力される特定キーワードとこのキーワードの関連語について説明する。
まず、第1の実施の形態で述べたと同様に、形態素解析システム等を用いて文書データからキーワードを抽出していき、このキーワードと共に出現した用語を関連語とする。但し、キーワードと共に出現した用語を全て関連語とすると、本来関連しない助詞等も含まれてしまうので、名詞に限定するとか、上述した共起確率が一定以上の用語に限定するようにしても良い。このようにして、対象期間及び比較期間における特定のキーワードとこのキーワードと関連のある関連語とが相対関連語類似度計算手段601に入力される。
続いて、本発明の特徴である相対関連語類似度の計算について説明する。相対関連語類似度は、キーワードに関する話題の変化の度合いの指標である。具体的には、比較期間におけるキーワードKの関連語集合ベクトルVbと、対象期間におけるキーワードKの関連語集合ベクトルVtとのコサイン類似度{Vb・Vt}/{|Vb|×|Vt|}として計算できる。この時、ベクトルVb、Vtの各要素は、各関連語が含まれるか否かを0または1で表現したものである。例えば、キーワード「地震」の比較期間2005年6月1日〜2005年6月30日における関連語集合が「震度」「震災」「災害」、対象期間2005年7月21日〜2005年7月27日における関連語集合が「震度」「震災」「津波」であった場合、(震度,震災,災害,津波)の順にベクトルの要素を対応付けると、相対関連語類似度は{(1,1,1,0)・(1,1,0,1)}/{|(1,1,1,0)|×|(1,1,0,1)|}={1+1+0+0}/3=0.67である。相対関連語類似度は、その値の逆数が大きいほど、比較期間でのキーワードの関連語と、対象期間でのキーワードの関連語とが著しく変化しているということを意味している。
尚、ここでは、相対関連語類似度としてコサイン類似度として説明したが、ベクトルの内積やベクトル間の距離を用いてもよく、本実施の形態の記載に限定されない。また、ベクトルVb、Vtの各要素として、各関連語が含まれるか否かを0または1で表現したものとして説明したが、キーワードと各関連語の共起確率を用いても良く、本実施の形態の記載に限定されない。さらに、ベクトルVbとVtをそれぞれ長さが1になるように正規化して用いても良く、本実施の形態の記載に限定されない。
トレンド評価手段602は、計算された相対関連語類似度から対象期間のトレンドを評価する。評価方法であるが、最も簡単な方法として、相対関連語類似度が最も小さい(相対関連語類似度の逆数が大きいほど)ものを、対象期間でのキーワードの関連語が著しく変化しており、そのキーワードが話題性に富んだトレンドと評価する方法がある。他の方法としては、所定の閾値を設け、この閾値よりも相対関連語類似度が小さくなった場合には、その相対関連語類似度のキーワードをトレンドと評価する方法がある。更に、相対関連語類似度を所定の期間蓄積しておき、その分散を計算し、分散値がある一定の閾値を超えた相対関連語類似度のキーワードをトレンドと評価する方法もある。
更に、他のトレンド評価の方法として、上述した相対共起度と同様に分散を用いて相対関連語類似度を計算する方法も適用できる。
このように、キーワードに関する話題の変化の度合いの指標である相対関連語類似度に基づいて、トレンドを評価するようにしたので、キーワードに対する注目度の高さによらず、話題が大きく変化したキーワードをトレンドとして評価することが可能である。
次に、本発明の第3の実施の形態について図面を参照して詳細に説明する。
第3の実施の形態は、第1及び第2の実施の形態に加えて、より詳細なトレンド評価が可能で具体的な実施の形態である。
図1を参照すると、本発明の第3の実施の形態は、トレンド評価装置101と、キーボードやマウス等の入力装置201と、ディスプレイやプリンタ等の出力装置301とを含む。
トレンド評価装置101は、さらに、情報を記憶する時系列テキスト記憶部11、関連語記憶部12、トレンド記憶部13と、プログラム制御により動作する関連語抽出手段21、相対出現度計算手段22、相対共起度計算手段23、相対関連語類似度計算手段24、トレンド評価手段25、トレンド可視化手段26とを含む。
時系列テキスト記憶部11には、時刻情報が付与された文書データが格納されている。時系列テキスト記憶部11に格納されている文書データの例を図2に示す。図2では、文書データとして、文書ID、更新日時、タイトルが格納されている。例えば、文書IDがD1の文書の更新日時は2005年7月21日13時43分54秒であり、文書のタイトルは「首都圏で震度5の強い地震」であることが分かる。尚、ここでは説明を簡単にするため、文書データとして文書ID、更新日時、タイトルが格納される例について述べたが、他にも文書の収集日時、執筆者、執筆者の個人情報、本文、アドレス、ジャンル、などの情報を格納しても良い。また、更新日時や収集日時などの時刻情報は年月日だけであっても良く、本実施の形態で述べた方法に限定しない。
また、時系列テキスト記憶部11に格納される文書としては、新聞記事、スポーツニュース、論文、日記、掲示板、blog、メーリングリスト、メールマガジンなどの様々情報源からの文書が挙げられる。これらの情報源を特定分野に限ることで、特定分野におけるトレンド語を抽出できる。例えば、情報源としてイラク戦争の新聞記事に限定することで、イラク戦争の話題に関するトピックでのトレンドを検出することができる。また、情報源の限定に加え、執筆者の個人情報でも限定し、掲示板に書かれたメッセージのうち、20代女性の書込みに限定することで、20代女性が最近話題にしているトレンドを評価することができる。
関連語記憶部12には、ある単語が特定の期間にどのような単語と共起しているかという単語間の関連データが格納されている。関連語記憶部12に格納されている単語間の関連データの例を図3に示す。図3では、単語間の関連データとして、関連ID、期間、キーワード、出現確率、関連語、共起確率が格納されている。例えば、関連IDがR1のデータを見ると、期間2005年7月21日〜2005年7月27日の間におけるキーワード「地震」の出現確率は12%で、その関連語「震度」との共起確率は60%であったことが分かる。ここで、キーワードKの出現確率とは、全キーワードの出現頻度合計に占めるキーワードKの出現頻度の割合、または、全文書数に占めるキーワードKが出現した文書数の割合、または、(Webページであれば)全サイト数に占めるキーワードKが出現したサイト数の割合、などを用いる。
例えば、サイト数ベースの出現確率を用いることにした場合、全サイト数が1000件あって、そのうち、キーワード「地震」が出現したサイト数が120件だとすると、キーワード「地震」の出現確率は120/1000=12%となる。またキーワードKに対する関連語Jの共起確率とは、キーワードKが出現した文書数に占めるキーワードKと関連語Jが両方とも出現した文書数の割合、または、(Webページであれば)キーワードKが出現したサイト数に占めるキーワードKと関連語Jが両方出現したサイト数の割合、などを用いる。例えば、サイト数ベースの共起確率を用いることにした場合、「地震」が出現したサイト数が120件であるのに対し、「地震」「震度」が両方出現したサイト数が72件だとすると、「地震」に対する「震度」の共起確率は72/120=60%となる。
トレンド記憶部13には、関連語記憶部12に記憶されている各キーワードに関して、特定の対象期間と、それより前の比較期間と比較した場合の相対出現度、相対共起度、相対関連語類似度、およびトレンドスコアが格納されている。トレンド記憶部13に格納されるデータの例を図4に示す。図4では、比較期間2005年6月1日〜2005年6月30日に対して、対象期間2005年7月21日〜2005年7月27日におけるキーワード「地震」の相対出現度は12.4であることが分かる。また、関連語「震度」「震災」「津波」との相対共起度はそれぞれ、1.2、0.8、2.0であることが分かる。また、キーワード「地震」の相対関連語類似度は0.67で、トレンドスコアは13.7であることが分かる。
ここで、キーワードKの相対出現度は、キーワードKに対する注目度の上昇度合いを表す指標である。具体的には、比較期間におけるキーワードKの出現確率Pb(K)に対する、対象期間におけるキーワードKの出現確率Pt(K)の比Pt(K)/Pb(K)として計算できる。例えば、キーワード「地震」の比較期間2005年6月1日〜2005年6月30日における出現確率Pb(地震)が0.97%で、対象期間2005年7月21日〜2005年7月27日における出現確率Pt(地震)が12%だったとすると、相対出現度はPt(K)/Pb(K)=12/0.97=12.4となる。相対出現度の値が大きいほど、対象期間での注目度が高まっているということを意味している。例えば図4では、対象期間2005年7月21日〜2005年7月27日において、キーワード「地震」の注目度は非常に高くなっているのに対し、キーワード「サッカー」の注目度はそれほど変化がなく、キーワード「京都」の注目度は若干低下傾向にあることが予想できる。
また、キーワードKと関連語Jとの相対共起度は、キーワードKのサブトピックに関する注目度の上昇度合いを表す指標である。具体的には、比較期間におけるキーワードKと関連語Jの共起確率Pb(J|K)に対する対象期間におけるキーワードKと関連語Jの共起確率Pt(J|K)の比Pt(J|K)/Pb(J|k)として計算できる。例えば、キーワード「地震」と関連語「震度」の比較期間2005年6月1日〜2005年6月30日における共起確率Pb(震度|地震)が50%、対象期間2005年7月21日〜2005年7月27日における共起確率Pt(震度|地震)が60%であったとすると、「地震」と「震度」の相対共起度はPt(J|K)/Pb(J|k)=60/50=1.2となる。相対共起度の値が大きいほど、対象期間でキーワードとその関連語との結びつきが強くなっているということを意味している。例えば図4では、対象期間2005年7月21日〜2005年7月27日において、キーワード「サッカー」と「女子」の結びつきが強くなっており、この期間では「サッカー」の中でも「女子サッカー」に関するサブトピックに注目が集まっていることが予想できる。
また、キーワードKの相対関連語類似度とは、キーワードKに関する話題の変化の度合いを表す指標である。具体的には、比較期間におけるキーワードKの関連語集合ベクトルVbと、対象期間におけるキーワードKの関連語集合ベクトルVtとのコサイン類似度{Vb・Vt}/{|Vb|×|Vt|}として計算できる。この時、ベクトルVb、Vtの各要素は、各関連語が含まれるか否かを0または1で表現したものである。例えば、キーワード「地震」の比較期間2005年6月1日〜2005年6月30日における関連語集合が「震度」「震災」「災害」、対象期間2005年7月21日〜2005年7月27日における関連語集合が「震度」「震災」「津波」であった場合、(震度,震災,災害,津波)の順にベクトルの要素を対応付けると、相対関連語類似度は{(1,1,1,0)・(1,1,0,1)}/{|(1,1,1,0)|×|(1,1,0,1)|}={1+1+0+0}/3=0.67である。相対関連語類似度は、その値の逆数が大きいほど、比較期間でのキーワードの関連語と、対象期間でのキーワードの関連語が著しく変化しているということを意味している。例えば図4では、比較期間2005年6月1日〜2005年6月30日に対して、対象期間2005年7月21日〜2005年7月27日では、キーワード「京都」に関する関連語が、ほとんど別のものに変わっており、「京都」に関して注目されているトピックが変化していることが予想できる。
尚、ここでは、相対関連語類似度としてコサイン類似度として説明したが、ベクトルの内積やベクトル間の距離を用いてもよく、本実施の形態の記載に限定されない。また、ベクトルVb、Vtの各要素として、各関連語が含まれるか否かを0または1で表現したものとして説明したが、キーワードと各関連語の共起確率を用いても良く、本実施の形態の記載に限定されない。さらに、ベクトルVbとVtをそれぞれ長さが1になるように正規化して用いても良く、本実施の形態の記載に限定されない。
また、キーワードKのトレンドスコアとは、キーワードKのトレンド性を数値化した値である。具体的には、相対出現度a1、相対共起度の最大値a2、相対関連語類似度の逆数a3にそれぞれ重みw1、w2、w3を掛けて加算したものである。例えば、キーワード「地震」の相対出現度a1が12.4、相対共起度の最大値a2が2.0、相対関連語類似度の逆数a3が1.5であり、重みw1、w2、w3がそれぞれ0.5、1.5、3.0だったとすると、キーワード「地震」のトレンドスコアはw1*a1+w2*a2+w3*a3 = 0.5*12.4+1.5*2.0+3.0*1.5=13.7となる。尚、ここでは、トレンドスコアとしてa1、a2、a3に重みw1、w2、w3を掛けた和としたが、w1*a1、w2*a2、w3*a3の最大値を用いる方法なども考えられ、本実施の形態の記載に限定されない。また、重みw1を0にすることにより、相対出現度を考慮に入れず、相対共起度と相対関連度類似度との組み合わせで考慮するように構成したり、重みw2を0にすることにより、相対共起度を考慮に入れず、相対出現度と相対関連度類似度との組み合わせで考慮するように構成したり、重みw3を0にすることにより、相対関連度類似度を考慮に入れず、相対出現度と相対共起度との組み合わせで考慮するように構成したりすることもできる。
また、上述の如く計算したトレンドスコアに重み付けを行っても良い。例えば、トレンドスコアの分散Vの逆数としてG=1/Vを計算し、このGをキーワードの変化の安定性として定義する。そして、トレンドスコアの比較期間での平均値Psと、トレンドスコアの対象期間での平均値Pxとを求め、その比H=(Px−Ps)/Psを求める。そして、比Hと安定性Gの積をトレンドスコア(トレンド性)F=G×Hとして計算するようにしても良い。尚、相対出現度を、上述の如く、Px/Psとするのではなく、(Px−Ps)/Psとした理由は、安定性をトレンド評価に取り入れた場合、Px/Ps>1ならば上昇傾向、Px/Ps<1ならば下降傾向、といった傾向判断ができなくなる。そこで、(Px−Ps)/Psを相対出現度とし、相対出現度Hと安定性Gの積をトレンドスコア(トレンド性)Fとすることによって、F>0ならば上昇、F<0ならば下降という傾向判断が可能となるからである。
このように、相対出現度、相対共起度、相対関連度類似度を考慮することによって、「地震」のように注目度が高くなった単語だけでなく、注目度自体は変化が無く、むしろ低下傾向であっても、「サッカー」と「女子」のように特定のサブトピックへの注目度が高まった単語や、「京都」のように話題全体に変化があった単語をトレンドとして検出することが可能となる。
関連語抽出手段21は、時系列テキスト記憶部11から時刻付きの文書データを読込み、入力手段201によって指定された対象期間と比較期間におけるキーワードの出現頻度、および関連語との共起確率を計算し、その結果を関連語記憶部12に格納する。この時、あらかじめキーワードの出現確率の閾値TH1、TH2を決めておき、出現確率がTH1以上TH2未満のキーワードを関連語記憶部12に格納する。例えば、TH1=0%、TH2=100%であれば、文書中に出現した全ての単語がキーワードとして格納されることになる。また、TH1=1%、TH2=90%などと指定することにより、ほとんど出現しない単語や、逆にどこにでも出現している単語を関連語記憶部12に格納しないようにできる。また、あらかじめキーワードKと関連語Jの共起確率の閾値TH3とTH4を決めておき、共起確率がTH3以上TH4未満の関連語を関連語記憶部12に格納する。例えば、TH3=0%、TH4=100%であれば、キーワードKと一緒に出現した全ての関連語Jがキーワードとして格納されることになる。また、TH1=1%、TH2=90%などと指定することにより、ほとんど共起しない関連語や、逆に常に共起している単語を関連語記憶部12に格納しないようにできる。
相対出現度計算手段22は、関連語記憶部12から単語間の関連データを読込み、入力手段201によって指定された対象期間と比較期間における出現確率の比を相対出現度として計算し、トレンド語評価手段25に入力する。
相対共起度計算手段23は、関連語記憶部12から単語間の関連データを読込み、入力手段201によって指定された対象期間と比較期間におけるキーワードと各関連語の共起確率の比を相対共起度として計算し、トレンド語評価手段25に入力する。
相対関連語類似度計算手段24は、関連語記憶部12から単語間の関連データを読込み、入力手段201によって指定された対象期間と比較期間における各関連語集合ベクトルのコサイン類似度を相対関連語類似度として計算し、トレンド語評価手段25に入力する。
トレンド評価手段25は、各キーワードについて、相対出現度計算手段22から入力された相対出現度、相対共起度計算手段23から入力された相対共起度、相対関連語類似度計算手段24から入力された相対関連語類似度の3つの値を元に、あらかじめ決められた重みw1、w2、w3を掛けてトレンドスコアを計算し、結果をトレンド語記憶部13に格納する。尚、本例では、トレンド評価手段25は、計算したトレンドスコア全てをトレンド語記憶部13に格納したが、計算したトレンドスコアのうち、所定の条件を満たすもののみトレンド語記憶部13に格納するように構成しても良い。トレンドスコアの格納の方法としては、予め所定の閾値を設け、この閾値を超えたトレンドスコアに対応するキーワードに関する情報のみ格納するように構成しても良い。また、他の方法としては、トレンドスコアの分散を計算し、分散値がある一定の閾値を超えたものに対応するキーワードに関する情報のみ格納するように構成しても良い。
トレンド可視化手段26は、トレンド語記憶部13に格納されているキーワードをキーとして、時系列テキスト記憶部11、関連語記憶部12をそれぞれ検索し、関連文書やキーワードの出現確率、関連語の時系列変化などを可視化し、出力手段301を通してプロモータに提示する。
次に、図1および図2〜図7を参照して本実施の形態の動作について詳細に説明する。
図5は、本発明の動作を示す流れ図である。
まず、プロモータは、入力手段201を通じて、対象期間と比較期間を入力する(図5のステップS1)。入力画面の例を図6に示す。図6のトレンド検出初期画面C1は、対象期間入力フォームC11、比較期間入力フォームC12、実行ボタンC13から構成されている。図6では、対象期間として2005年7月21日〜2005年7月27日、比較期間として2005年6月1日〜2005年6月30日が指定されている。
尚、期間の指定方法としては、対象期間を当日のみ、比較期間を昨日以前の1週間として短期的な傾向を分析するなどの方法も考えられる。また、対象期間を特定の1ヶ月間(例:2005年7月1日〜7月31日)、比較期間をその前半年間(例:2005年1月1日〜2005年6月30日)として長期的な傾向を分析するなどの方法も考えられる。また、対象期間を特定の1ヶ月間(例:2005年7月1日〜7月31日)、比較期間を前年同月(2004年7月1日〜2004年7月31日)として、前年同期比の傾向を分析するなどの方法も考えられる。さらに、対象期間を当日のみ、比較期間をそれ以前の1年間での同一曜日として、同じ曜日間での傾向を分析するなどの方法も考えられる。この場合、比較期間は不連続になるが、比較期間入力フォームC12で日付をカンマ区切りで入力すればよい。
図6のトレンド検出初期画面C1で実行ボタンC13がクリックされると、関連語抽出手段21が時系列テキスト記憶部11から時刻付きの文書データを読込み、指定された対象期間と比較期間におけるキーワードの出現頻度、および関連語との共起確率を計算し、その結果を関連語記憶部12に格納する(図5のステップS2)。
次に、相対出現度計算手段22は、関連語記憶部12から単語間の関連データを読込み、入力手段201によって指定された対象期間と比較期間における出現確率の比を相対出現度として計算し、トレンド語評価手段25に入力する(図5のステップS3)。
次に、相対共起度計算手段23は、関連語記憶部12から単語間の関連データを読込み、入力手段201によって指定された対象期間と比較期間におけるキーワードと各関連語毎の共起確率の比を相対共起度として計算し、トレンド語評価手段25に入力する(図5のステップS4)。
次に、相対関連語類似度計算手段24は、関連語記憶部12から単語間の関連データを読込み、入力手段201によって指定された対象期間と比較期間における各関連語集合ベクトルのコサイン類似度を相対関連語類似度として計算し、トレンド語評価手段25に入力する(図5のステップS5)。
次に、トレンド語評価手段25は、各キーワードについて、相対出現度計算手段22から入力された相対出現度、相対共起度計算手段23から入力された相対共起度、相対関連語類似度計算手段24から入力された相対関連語類似度の3つの値を元に、あらかじめ決められた重みw1、w2、w3を掛けてトレンドスコアを計算し、結果をトレンド語記憶部13に格納する(図5のステップS6)。
トレンド可視化手段26は、上記ステップS1〜S6を通じて得られた結果を出力手段301を通じて、図7に示すように表示することが可能である。図7のトレンド検出結果画面C2は、期間表示部C21、キーワード一覧C22、関連文書一覧C23、出現確率変化表示部C24、関連語表示部C25から構成される。
期間表示部C21には、プロモータによって指定された対象期間と比較期間が表示される。
キーワード一覧C22には、トレンド語記憶部13に格納されたキーワードの一覧が表示される。この時の、キーワードの並べ方としては、辞書順、文字数順、トレンドスコア順、対象期間での出現確率順、相対出現度順、相対共起度の最大値の順、相対関連語類似度順などがあり、いずれの並べ方を採用しても良い。また、一画面で全てのキーワードを表示できない時は、「▼次のキーワード」のようなリンクを表示し、これをクリックすると次のキーワードが表示されるようにしても良い。図7では、キーワードとして「地震」が選択状態になっているものとする。
関連文書一覧C23には、対象期間において、キーワード一覧C22で選択されたキーワードを含む文書のリストが表示される。この時の文書の並べ方としては、キーワードの出現回数順、更新日時順、などがあり、いずれの並べ方を採用しても良い。また、一画面で全ての文書を表示できない時は、「▼次の関連文書」のようなリンクを表示し、これをクリックすると次のキーワードが表示されるようにしても良い。さらに、文書IDの代わりに文書のアドレスを表示し、このアドレスを指定することで、文書本文を表示できるようにしても良い。図7では、キーワード「地震」をタイトルに含む文書として、文書IDがD1の「首都圏で震度5強の強い地震」と、文書IDがD10の「首都圏地震でエレベータ停止」が表示されている。
出現確率変化表示部C24には、対象期間と評価期間における、キーワード一覧C22で選択されたキーワードの出現確率の時系列変化をグラフで表示する。これにより、プロモータは出現確率の変化を一目で把握できる。図7では、キーワード「地震」の出現確率がグラフ化されている。
関連語表示部C25には、キーワード一覧C22で選択されたキーワードに関する関連語をネットワーク図として表示する。関連語のネットワーク図は、対象期間、比較期間でそれぞれ異なり、関連語表示部C25の左下のリンクで切り替えて表示できるようになっている。ネットワーク図におけるノードの大きさは、その期間における各単語の出現確率の大きさを表しており、アークの太さは、共起確率の高さを表している。図7では、図3の関連語記憶部12に格納されているキーワード「地震」に関するデータをネットワーク表示しており、キーワード「地震」「震度」「震災」「津波」の出現確率がそれぞれ12%、5%、3%、2%であるのに比例してノードの大きさが決まっている。また、キーワード「地震」に対する関連語「津波」の共起確率が10%であるのに対し、キーワード「震度」に対する関連語「地震」の共起確率が80%であることから、「震度→地震」のアークの太さは「地震→津波」のアークの太さの8倍になっている。これにより、ある期間におけるキーワードとその関連語の関係が一目で把握できる。また、対象期間と比較期間を切り替えて表示することにより、ノードの大きさ、アークの太さ、キーワードまわりの関連語の変化、などの変化も直感的に把握できるようになっている。この場合、ノードの大きさの変化が相対出現度に、アークの太さの変化が相対共起度に、キーワードまわりの関連語の変化が相対関連語類似度に対応している。
尚、ここでは、トレンド検出結果画面C2のキーワード一覧C22で、キーワードとして「地震」が選択されている場合について説明したが、キーワード一覧C22で、他のキーワードが選択されると、そのタイミングでトレンド可視化手段26が選択されたキーワードをキーとして、時系列テキスト記憶部11、関連語記憶部12をそれぞれ検索し、関連文書やキーワードの出現確率、関連語の時系列変化などをグラフ化する。
また、ここでは、コンテンツプロバイダやオンラインショップなどの事業者に所属するプロモータがトレンド評価装置を使ってトレンドやその関連文書、関連語を把握する利用形態の例について述べたが、他にも、トレンドを分析する分析事業者が別に存在し、図7のトレンド検出結果画面C2の内容を、別の事業者にレポートとして販売するといった利用形態も考えられる。また、特にコンテンツプロバイダやオンラインショップなどの事業者とは関係なく、トレンドを分析する事業者が独自に図7のトレンド検出結果画面C2を、不特定多数の閲覧者に公開するといった利用形態も考えられ、本実施の形態に述べた利用形態に限定されない。
次に、本実施の形態の効果について説明する。
本実施の形態では、相対出現度、相対共起度、相対関連度類似度を考慮したトレンドスコアを計算することによって、キーワードのトレンド性を判定している。そのため、キーワードそのものに対する注目度自体には変化が無く、むしろ低下傾向であっても、特定のサブトピックへの注目度が高まったキーワードや、話題全体に変化があったキーワードをトレンドとして検出することが可能となる。
また、本実施の形態では、キーワードに関連する文書一覧や、相対出現度、相対共起度、相対関連度類似度に関するグラフを表示している。そのため、キーワードに関連するトピックがどのように変化しているのかを簡単に把握することが可能である。
次に、本発明の第4の実施の形態について、図面を参照して詳細に説明する。
図8を参照すると、本発明の第4の実施の形態は、図1に示された第3の実施の形態の構成におけるトレンド可視化手段26が、商品推薦手段27に置き換わっており、さらに、商品情報記憶部14が追加されている点で異なる。
商品情報記憶部14には、商品情報が格納されている。商品情報には、商品の名前、説明文、キャッチコピー、画像、値段、仕様、利用条件、問合せ先、注文フォームのアドレス、仕入れコスト、利益率などが含まれる。図9、図10に商品情報の例を示す。図9、図10は、それぞれ、製品やコンテンツを商品とした場合の商品情報の例である。図9では、商品ID、商品名、商品の説明文が格納されており、図10では、番組ID、番組名、番組の説明文が格納されている。
商品推薦手段27は、トレンド語記憶部13に格納されているキーワードをキーとして、時系列テキスト記憶部11、関連語記憶部12、商品情報記憶部14をそれぞれ検索し、関連文書や関連商品を出力手段301を通してプロモータに提示する。
本実施の形態の動作を、図8〜13を参照して詳細に説明する。
図11は、本発明の第4の実施の形態の動作を表す流れ図である。
図11におけるステップS1〜S6における関連語抽出手段21、相対出現度計算手段22、相対共起度計算手段23、相対関連語類似度計算手段24、トレンド評価手段25の動作は、図5に示す第3の実施の形態における各手段21〜24の動作と同一のため、説明は省略する。
商品推薦手段27は、上記ステップS1〜S6を通じて得られたトレンド語記憶部13のキーワードをキーとして、時系列テキスト記憶部11、関連語記憶部12、商品情報記憶部14をそれぞれ検索し、関連文書や関連商品を図12のような商品推薦画面C3として、出力手段301を通してプロモータに提示する(図11のステップS7)。商品推薦画面C3は、期間表示部C31、キーワード一覧C32、関連文書一覧C33、関連語一覧C34、関連商品一覧C35から構成されている。図12は、商品情報記憶部14に、図9のような製品情報が格納されていた場合の出力例である。
期間表示部C31には、プロモータによって指定された対象期間と比較期間が表示される。
キーワード一覧C32には、トレンド語記憶部13に格納されたキーワードの一覧が表示される。この時の、キーワードの並べ方としては、辞書順、文字数順、トレンドスコア順、対象期間での出現確率順、相対出現度順、相対共起度の最大値の順、相対関連語類似度順などがあり、いずれの並べ方を採用しても良い。また、一画面で全てのキーワードを表示できない時は、「▼次のキーワード」のようなリンクを表示し、これをクリックすると次のキーワードが表示されるようにしても良い。図12では、キーワードとして「地震」が選択状態になっているものとする。
関連文書一覧C33には、対象期間において、キーワード一覧C32で選択されたキーワードを含む文書のリストが表示される。この時の文書の並べ方としては、キーワードの出現回数順、更新日時順、などがあり、いずれの並べ方を採用しても良い。また、一画面で全ての文書を表示できない時は、「▼次の関連文書」のようなリンクを表示し、これをクリックすると次のキーワードが表示されるようにしても良い。さらに、文書IDの代わりに文書のアドレスを表示し、このアドレスを指定することで、文書本文を表示できるようにしても良い。図12では、キーワード「地震」をタイトルに含む文書として、文書IDがD1の「首都圏で震度5強の強い地震」と、文書IDがD10の「首都圏地震でエレベータ停止」が表示されている。
関連語一覧C34には、キーワード一覧C32で選択されたキーワードに関する関連語の一覧を表示する。この時、プロモータが各関連語の重みを指定できるようにする。関連語の重みとは、商品検索時に商品の重要度を計算するために利用する。関連語の重みの初期値としては、すべて一定の値にする方法や、キーワードとの共起確率を使う方法などがあり、いずれの方法を採用しても良い。
関連商品一覧C35には、キーワード一覧C32で選択されたキーワードに関する関連商品の一覧を表示する。関連商品とは、商品名や説明文のいずれかにキーワード一覧C32で選択されたキーワードやその関連語が含まれている商品である。この時の商品の並べ方としては、キーワードの出現回数順、関連語の出現回数に関連語一覧C34で指定された重みを掛けた合計順、商品の値段順、商品の利益率順、などがあり、いずれの並べ方を採用しても良い。また、一画面で全ての商品を表示できない時は、「▼次の商品」のようなリンクを表示し、これをクリックすると次の商品が表示されるようにしても良い。図12では、キーワード「地震」を商品名か説明文のいずれかに含む商品として、「乾パンセット」「家具転倒防止板」「保存水」が表示されている。
図12では、商品情報記憶部14に図9のような製品情報が格納されていた場合の出力例について説明したが、商品情報記憶部14に図10のような番組情報が格納されていても、同様の仕組みで推薦を行うことができる。その場合の商品推薦画面の例を図13に示す。
図13では、キーワード一覧C32でキーワードとして「地震」が選択状態になっており、関連文書一覧C33と関連語一覧C34には図12と同じデータが表示されている。ただし、関連商品一覧C35には、キーワード「地震」を番組名か説明文のいずれかに含む番組として、「防災ひとくちメモ」「大地震の10年」「みんなの地学」が表示されている。このように、商品推薦手段27は分野を問わず、同様の方法でトレンドに関連する商品の推薦が可能である。ここでは、図9と図10のように、分野によって商品情報を分けた例で説明したが、製品情報と番組情報の両方を商品情報記憶部14に格納し、トレンドに関連する商品として製品・番組両方を推薦することも可能である。
尚、ここでは、商品推薦画面C3のキーワード一覧C32で、キーワードとして「地震」が選択されている場合について説明したが、キーワード一覧C32で、他のキーワードが選択されると、その商品推薦手段27が選択されたキーワードをキーとして、時系列テキスト記憶部11、関連語記憶部12、商品情報記憶部14をそれぞれ検索し、関連文書や関連商品を出力する。
また、ここでは、コンテンツプロバイダやオンラインショップなどの事業者に所属するプロモータがトレンド評価装置を使ってトレンドやその関連文書、関連語、および関連商品を把握する利用形態の例について述べたが、他にも、トレンドを分析する分析事業者が別に存在し、時系列テキスト記憶部11、関連語記憶部12、トレンド語記憶部13に格納された情報をプロモータにレポートとして販売し、プロモータ側で商品推薦手段27を使って、トレンドの関連商品を検索する利用形態も考えられる。また、プロモータが分析事業者に商品情報を提供し、分析事業者が図12の商品推薦画面C3に表示された内容をレポート化してプロモータに販売する利用形態も考えられる。また、分析事業者が1社または複数社のプロモータから商品情報の提供を受け、分析事業者自身がトレンドに関連する商品のプロモーションを行い、販売手数料を各社のプロモータから徴収するという利用形態も考えられる。さらに、分析事業者が1社または複数社から商品情報の提供を受け、販売代理店向けに図12の商品推薦画面C3に表示された内容をレポート化して提供し、販売代理店は販売手数料を各社のプロモータから徴収するとともに、分析事業者は販売代理店とプロモータのいずれかまたは両方から情報利用料を徴収するという利用形態も考えられる。
更に、本トレンド評価装置を、インターネットにおける商品紹介にも適用することができる。例えば、ネットオークションのように複数の種別の出品物を提示しなければならず、その一方で、一ページの表示範囲が限られているような場合、ネットオークションの主催者は、トレンドな商品をトップページに提示したいものである。そこで、本トレンド評価装置の商品情報記憶部14にオークションの出品物の情報(キーワードや、出品物の説明等)を記憶させておき、商品推薦手段27により、トレンドと評価されるキーワードに関連する出品物を検索させ、この出品物をトップページに提示するように構成する。尚、選択する出品物の数は、出品物の表示範囲に応じて設定しておく。
次に、本実施の形態の効果について説明する。
本実施の形態では、商品推薦手段27が、トレンドとして検出されたキーワードの関連文書や関連語とともに、関連商品を検索して提示する。そのため、(1)何がトレンドであるのかを判断し、(2)トレンドにふさわしい関連商品を探す作業が自動化され、商品のプロモーション方法の検討作業を効率化できる。
次に、本発明の第5の実施の形態について図面を参照して詳細に説明する。
図14を参照すると、本発明の第5の実施の形態は、図8に示された第4の実施の形態の構成に加え、周期性判定手段28が追加されている点で異なる。
周期性判定手段28は、トレンド語記憶部13に登録されたキーワードを継続して観察し、定期的にトレンドスコアが高くなるキーワードを検出し、それにあわせてトレンドスコアを補正する。
本実施の形態の動作を、図14〜16を参照して詳細に説明する。
図15は、本発明の第5の実施の形態の動作を表す流れ図である。
図15におけるステップS1〜S7における関連語抽出手段21、相対出現度計算手段22、相対共起度計算手段23、相対関連語類似度計算手段24、トレンド評価手段25、商品推薦手段26の動作は、図8に示す第2の実施の形態における各手段21〜26の動作と同一のため、説明は省略する。
周期性判定手段28は、トレンド語記憶部13に登録された各キーワードについて、過去Y年間において、一定期間毎にトレンドスコアが閾値TH5を超えた確率を集計する(図15のステップS8)。図16に、月別に集計した例を示す。例えば図16で、Y=5、TH5=100とすると、キーワード「地震」について、過去5年間で、1月にトレンドスコアが100を超えた割合が12%であったことが分かる。あるトレンドが周期的であるほど、この確率が高くなる傾向になると考えられる。例えば、図16で、確率50%を超える時期について見てみると、「サッカー」は毎年3月に周期的にトレンドスコアが高くなり、「京都」は毎年4月、7月、10月に周期的にトレンドスコアが高くなる傾向があることがわかる。周期性判定手段28は、さらに、分析の対象期間において、各キーワードのトレンドスコアに対して補正値を加算する。補正値としては、分析の対象期間におけるトレンドスコアに対して、過去にトレンドスコアが閾値TH5を超えた確率を掛けたものを加算するなどの方法が考えられる。例えば、現在の分析の対象期間が2005年7月21日〜2005年7月27で、トレンド語記憶部13の内容が図4に示す通りであり、過去の周期性が図16のようになっていた場合、キーワード「地震」のトレンドスコアは、13.7+13.7*0.02=13.97に補正される。また、キーワード「サッカー」のトレンドスコアは、31.0+31.0*0.3=40.3に補正される。さらに、キーワード「京都」のトレンドスコアは、789+789*0.78=1404に補正される。このように、周期性を伴ってトレンドになりやすいキーワードほど、トレンドスコアが高くなるように補正される。そのため、分析の対象期間ではまだトレンドとして検出されるほど大きな変化が現れていなくても、周期的にトレンドになるキーワードであれば、早めのタイミングでトレンドとして検出が可能になる。
尚、ここでは、図16の一定期間の例として月別の場合について説明したが、他にも、各月の第x週という期間や、日別、曜日別などの期間別の集計方法も考えられ、本実施の形態に述べた方法に限定されない。
次に、本実施の形態の効果について説明する。
本実施の形態では、周期性判定手段28が、過去のトレンド語記憶部13のデータから、キーワードのトレンドスコアが周期的に高くなる期間を集計し、分析対象期間でのトレンドスコアに対して補正を行う。そのため、分析の対象期間ではまだトレンドとして検出されるほど大きな変化が現れていなくても、周期的にトレンドになるキーワードであれば、早めのタイミングでトレンドとして検出が可能になる。
次に、本発明の第6の実施の形態について図面を参照して詳細に説明する。
図17を参照すると、本発明の第6の実施の形態は、図8に示された第4の実施の形態の構成における商品推薦手段27が、第2の商品推薦手段29に置き換わり、さらに、顧客情報記憶部15が追加されている点で異なる。
顧客情報記憶部15には、顧客情報が格納されている。顧客情報には、顧客の名前、年齢、住所、電話番号、職業、年収、趣味、過去の取引額、敏感度、関心キーワードなどが含まれる。図18に顧客情報の例を示す。図18では、顧客ID、顧客名、年齢、敏感度、関心キーワードが格納されている。ここで、敏感度とは、トレンドに対してどの程度のタイムラグで反応するかを日数で表現したものである。敏感度の決定方法としては、顧客情報の登録時に顧客に直接アンケートで確認する方法がある。例えば、「トレンドに敏感である」という質問項目に「はい」「いいえ」「どちらともいえない」の3つの選択肢を提示し、それぞれの回答に対して敏感度を0、7、3のように決定しても良い。選択肢は3段階に限らず5段階であっても良いし、直接敏感度にあたる日数を回答させて決定しても良い。また、関心キーワードとは、顧客が関心のあるトピックに関連したキーワードである。関心キーワードの決定方法としては、顧客情報の登録時に顧客に直接アンケートで確認する方法がある。例えば、「あなたの最近関心のあるキーワードは何ですか」という質問項目に対して自由記述で回答させ、それをそのまま関心キーワードと決定すれば良い。
第2の商品推薦手段29は、トレンド語記憶部13に格納されているキーワードをキーとして、時系列テキスト記憶部11、関連語記憶部12、商品情報記憶部14、顧客情報記憶部15をそれぞれ検索し、関連文書や関連商品、および推薦対象となる顧客を出力手段301を通してプロモータに提示する。
本実施の形態の動作を、図17〜20を参照して詳細に説明する。
図19は、本発明の第6の実施の形態の動作を表す流れ図である。
図19におけるステップS1〜S6における関連語抽出手段21、相対出現度計算手段22、相対共起度計算手段23、相対関連語類似度計算手段24、トレンド評価手段25の動作は、図8に示す第4の実施の形態における各手段21〜25の動作と同一のため、説明は省略する。
第2の商品推薦手段29は、上記ステップS1〜S6を通じて得られたトレンド語記憶部13のキーワードをキーとして、時系列テキスト記憶部11、関連語記憶部12、商品情報記憶部14、をそれぞれ検索し、関連文書、関連商品の一覧を得る(図19のステップS7)。
次に、第2の商品推薦手段29は、トレンド語記憶部13のキーワードをキーとして、顧客情報記憶部15を検索し、関連文書、関連商品、および適切な推薦先顧客を図20のような商品推薦画面C4として、出力手段301を通してプロモータに提示する(図19のステップS9)。商品推薦画面C4は、期間表示部C41、キーワード一覧C42、関連文書一覧C43、関連語一覧C44、関連商品一覧C45、顧客一覧C46から構成されている。図20におけるC41〜C45に表示されている情報は、図12に示す第4の実施の形態における商品推薦画面C3のC31〜C35に表示されている情報と同一のため、説明は省略する。
顧客一覧C46には、キーワード一覧C42で選択されたキーワードを関心キーワードとして登録している顧客の一覧を表示する。この時の顧客情報の並べ方としては、顧客名の辞書順、敏感度順、年齢順、年収順、過去の取引額順、などがあり、いずれの並べ方を採用しても良い。また、一画面で全ての顧客情報を表示できない時は、「▼次の顧客」のようなリンクを表示し、これをクリックすると次の顧客情報が表示されるようにしても良い。図20では、キーワード「地震」を関心キーワードに含み、敏感度の日数が短い顧客として、「日電太郎」「本気二郎」が表示されている。これにより、プロモータは、トレンドに関連した商品を誰に対して推薦すべきかを判断することができるようになる。
尚、ここでは、コンテンツプロバイダやオンラインショップなどの事業者に所属するプロモータがトレンド評価装置を使ってトレンドやその関連文書、関連語、関連商品、および推薦対象となる顧客を把握する利用形態の例について述べたが、他にも、トレンドを分析する分析事業者が別に存在し、時系列テキスト記憶部11、関連語記憶部12、トレンド語記憶部13の内容をプロモータにレポートとして販売し、プロモータ側で第2の商品推薦手段29を使って、トレンドの関連商品と推薦対象となる顧客を検索する利用形態も考えられる。また、プロモータが分析事業者に商品情報と顧客情報を提供し、分析事業者が図20の商品推薦画面C4に表示された内容をレポート化してプロモータに販売する利用形態も考えられる。また、分析事業者が1社または複数社のプロモータから商品情報と顧客情報の提供を受け、分析事業者自身がトレンドに関連する商品のプロモーションを行い、販売手数料を各社のプロモータから徴収するという利用形態も考えられる。さらに、分析事業者が1社または複数社から商品情報と顧客情報の提供を受け、販売代理店向けに図12の商品推薦画面C3に表示された内容をレポート化して提供し、販売代理店は販売手数料を各社のプロモータから徴収するとともに、分析事業者は販売代理店とプロモータのいずれかまたは両方から情報利用料を徴収するという利用形態も考えられる。
次に、本実施の形態の効果について説明する。
本実施の形態では、第2の商品推薦手段29が、トレンド語記憶部13に格納されているキーワードをキーとして、顧客情報記憶部15を検索する。これにより、トレンドに関連した商品を誰に対して推薦すべきかを判断することが可能である。
次に、本発明の第7の実施の形態について図面を参照して詳細に説明する。
図21を参照すると、本発明の第7の実施の形態は、図17に示された第6の実施の形態の構成における第2の商品推薦手段29が、第3の商品推薦手段30に置き換わり、さらに、販売実績記憶部16が追加されている点で異なる。
販売実績記憶部16には、販売実績情報が格納されている。販売実績情報には、販売日、購入者のIDと名前、商品IDと商品名、販売個数、販売金額などが含まれる。図22に販売実績情報の例を示す。図22では、販売日、購入者のIDと名前、商品IDと商品名が格納されている。
第3の商品推薦手段30は、トレンド語記憶部13に格納されているキーワードをキーとして、時系列テキスト記憶部11、関連語記憶部12、商品情報記憶部14、顧客情報記憶部15、販売実績記憶部16をそれぞれ検索し、関連文書や関連商品、および推薦対象となる顧客を出力手段301を通してプロモータに提示する。
本実施の形態の動作を、図21〜23を参照して詳細に説明する。
図23は、本発明の第7の実施の形態の動作を表す流れ図である。
図23におけるステップS1〜S6における関連語抽出手段21、相対出現度計算手段22、相対共起度計算手段23、相対関連語類似度計算手段24、トレンド評価手段25の動作は、図8に示す第4の実施の形態における各手段21〜25の動作と同一のため、説明は省略する。
第3の商品推薦手段30は、上記ステップS1〜S6を通じて得られたトレンド語記憶部13のキーワードをキーとして、時系列テキスト記憶部11、関連語記憶部12、商品情報記憶部14、をそれぞれ検索し、関連文書、関連商品の一覧を得る(図23のステップS7)。
次に、第3の商品推薦手段30は、顧客情報記憶部15に格納されている顧客IDをキーにして、販売実績記憶部15を検索し、どの顧客がどの商品を過去に購入したかの一覧を得ると同時に、販売実績中の商品IDをキーにして商品情報記憶部14を検索し、各商品にどのような説明文が付与されているかの情報を得る。ここで検索された商品名と説明文を形態素解析などを用いて分割し、各顧客と、購入した商品に関するキーワードを顧客情報記憶部15に格納されている関心キーワードに追加する。また、商品に関するキーワードをキーにしてトレンド語記憶部13を検索することにより、以前にトレンドスコアが高くなってから何日後にその商品が購入されたかを計算し、この日数を顧客情報記憶部15に格納されている敏感度の値と置き換える(図23のステップS10)。
次に、第3の商品推薦手段30は、トレンド語記憶部13のキーワードをキーとして、修正された顧客情報記憶部15を検索し、関連文書、関連商品、および適切な推薦先顧客を図20のような商品推薦画面C4として、出力手段301を通してプロモータに提示する(図23のステップS9)。これにより、実際の販売実績に即して、より適切な顧客に対してトレンド関連商品の推薦を行うことができる。
次に、本実施の形態の効果について説明する。
本実施の形態では、第3の商品推薦手段30が、実際の販売実績を元に顧客情報を修正して商品を推薦すべき顧客を検索する。これにより、実際の販売実績に即して、より適切な顧客に対してトレンド関連商品の推薦が可能になる。
次に、本発明の第8の実施の形態について、図面を参照して詳細に説明する。
図24を参照すると本発明の第6の実施の形態は、入力手段501、データ処理装置502、出力手段503、記憶装置504を備える。さらに、第1の実施の形態のトレンド評価装置101を実現するためのトレンド検出用プログラム500を備える。
入力手段501は、マウス、キーボード等、操作者からの指示を入力するための装置である。また、出力手段503は、表示画面、プリンタ等のデータ処理装置502による処理結果を出力する装置である。
トレンド検出用プログラム500は、データ処理装置502に読み込まれ、データ処理装置502の動作を制御し、記憶装置504に入力メモリ505とワークメモリ506を生成する。データ処理装置502は、トレンド評価装置101を実現するためのプログラムの制御により第1の実施形態と同一の処理を実行する。
図24におけるデータ処理装置502は、図1における関連語抽出手段21、相対出現度計算手段22、相対共起度計算手段23、相対関連語計算手段24、トレンド評価手段25、トレンド可視化手段26の処理を実行し、図24における記憶装置504には、図1における時系列テキスト記憶部11、関連語記憶部12、トレンド語記憶部13、の情報が格納される。ただし、時系列テキスト記憶部11は、記憶装置504に格納されたデータを利用する他に、データ処理装置502によって外部にあるデータベースにネットワーク(例えばインターネット)を介してアクセスして取得する形態であってもよい。
次に、本発明の第9の実施の形態について、図面を参照して詳細に説明する。
第9の実施の形態は、第8の実施の形態と同様に図24の構成図を用いる。トレンド検出用プログラム500は、データ処理装置502に読み込まれ、データ処理装置502の動作を制御し、記憶装置504に入力メモリ505とワークメモリ506を生成する。データ処理装置502は、トレンド評価装置102を実現するためのプログラムの制御により第2の実施形態と同一の処理を実行する。
図24におけるデータ処理装置502は、図8における関連語抽出手段21、相対出現度計算手段22、相対共起度計算手段23、相対関連語計算手段24、トレンド評価手段25、商品推薦手段27の処理を実行し、図24における記憶装置504には、図8における時系列テキスト記憶部11、関連語記憶部12、トレンド語記憶部13、商品情報記憶部14の情報が格納される。ただし、時系列テキスト記憶部11、商品情報記憶部14は、記憶装置504に格納されたデータを利用する他に、データ処理装置502によって外部にあるデータベースにネットワーク(例えばインターネット)を介してアクセスして取得する形態であってもよい。
次に、本発明の第10の実施の形態について、図面を参照して詳細に説明する。
第10の実施の形態は、第8の実施の形態と同様に図24の構成図を用いる。トレンド検出用プログラム500は、データ処理装置502に読み込まれ、データ処理装置502の動作を制御し、記憶装置504に入力メモリ505とワークメモリ506を生成する。データ処理装置502は、トレンド評価装置103を実現するためのプログラムの制御により第5の実施形態と同一の処理を実行する。
図24におけるデータ処理装置502は、図14における関連語抽出手段21、相対出現度計算手段22、相対共起度計算手段23、相対関連語計算手段24、トレンド評価手段25、商品推薦手段27、周期性判定手段28の処理を実行し、図24における記憶装置504には、図14における時系列テキスト記憶部11、関連語記憶部12、トレンド語記憶部13、商品情報記憶部14の情報が格納される。ただし、時系列テキスト記憶部11、商品情報記憶部14は、記憶装置504に格納されたデータを利用する他に、データ処理装置502によって外部にあるデータベースにネットワーク(例えばインターネット)を介してアクセスして取得する形態であってもよい。
次に、本発明の第11の実施の形態について、図面を参照して詳細に説明する。
第11の実施の形態は、第8の実施の形態と同様に図24の構成図を用いる。トレンド検出用プログラム500は、データ処理装置502に読み込まれ、データ処理装置502の動作を制御し、記憶装置504に入力メモリ505とワークメモリ506を生成する。データ処理装置502は、トレンド評価装置104を実現するためのプログラムの制御により第6の実施形態と同一の処理を実行する。
図24におけるデータ処理装置502は、図17における関連語抽出手段21、相対出現度計算手段22、相対共起度計算手段23、相対関連語計算手段24、トレンド評価手段25、商品推薦手段27、第2の商品推薦手段29の処理を実行し、図24における記憶装置504には、図17における時系列テキスト記憶部11、関連語記憶部12、トレンド語記憶部13、商品情報記憶部14、顧客情報記憶部15の情報が格納される。ただし、時系列テキスト記憶部11、商品情報記憶部14、顧客情報記憶部15は、記憶装置504に格納されたデータを利用する他に、データ処理装置502によって外部にあるデータベースにネットワーク(例えばインターネット)を介してアクセスして取得する形態であってもよい。
次に、本発明の第12の実施の形態について、図面を参照して詳細に説明する。
第12の実施の形態は、第8の実施の形態と同様に図24の構成図を用いる。トレンド検出用プログラム500は、データ処理装置502に読み込まれ、データ処理装置502の動作を制御し、記憶装置504に入力メモリ505とワークメモリ506を生成する。データ処理装置502は、トレンド評価装置105を実現するためのプログラムの制御により第5の実施形態と同一の処理を実行する。
図24におけるデータ処理装置502は、図21における関連語抽出手段21、相対出現度計算手段22、相対共起度計算手段23、相対関連語計算手段24、トレンド評価手段25、商品推薦手段27、第3の商品推薦手段30の処理を実行し、図24における記憶装置504には、図21における時系列テキスト記憶部11、関連語記憶部12、トレンド語記憶部13、商品情報記憶部14、顧客情報記憶部15、販売実績記憶部16の情報が格納される。ただし、時系列テキスト記憶部11、商品情報記憶部14、顧客情報記憶部15、販売実績記憶部16は、記憶装置504に格納されたデータを利用する他に、データ処理装置502によって外部にあるデータベースにネットワーク(例えばインターネット)を介してアクセスして取得する形態であってもよい。
本発明によれば、新聞記事、スポーツニュース、論文、日記、掲示板、blog、メーリングリスト、メールマガジンなどの様々情報源から、変化の大きなトレンド情報を自動検出するといった用途に適用できる。また、検出されたトレンドに関連する製品、TV番組、コンテンツ、レストラン、化粧品、サービスなどの商品の推薦やプロモーションに適用できる。

Claims (33)

  1. トレンド評価装置であって、
    キーワード、前記キーワードに関連する関連語と、前記キーワードと前記関連語との共起確率とが格納されている記憶手段と、
    前記キーワードと前記キーワードの関連語との比較期間の共起確率に対する前記キーワードと前記キーワードの関連語との対象期間の共起確率の比から、前記キーワードと前記キーワードの関連語との共起確率の変化を示す指標である相対共起度を計算する相対共起度計算手段と、
    前記相対共起度計算手段で計算された相対共起度を蓄積し、所定期間の相対共起度の分散値を求め、所定の閾値を超えた前記分散値に対応するキーワードとこのキーワードの関連語との組み合わせをトレンドと評価するトレンド評価手段と
    を有することを特徴とするトレンド評価装置。
  2. トレンド評価装置であって、
    キーワードと、前記キーワードの比較期間及び対象期間の関連語とが記憶された記憶手段と、
    前記比較期間におけるキーワードの関連語集合ベクトルと、前記対象期間における前記キーワードの関連語集合ベクトルとのコサイン類似度から、前記キーワードに関する話題の変化の度合いの指標である相対関連語類似度を計算する相対関連語類似度計算手段と、
    前記相対関連語類似度計算手段で計算された相対関連語類似度を蓄積し、所定期間の相対関連語類似度の分散値を求め、所定の閾値を超えた前記分散値に対応する相対関連語類似度のキーワードをトレンドするトレンド評価手段と
    を有することを特徴とするトレンド評価装置。
  3. トレンド評価装置であって、
    キーワード、前記キーワードに関連する関連語と、前記キーワードと前記関連語との共起確率とが格納されている記憶手段と、
    前記キーワードと前記キーワードの関連語との比較期間の共起確率に対する前記キーワードと前記キーワードの関連語との対象期間の共起確率の比から、前記キーワードと前記キーワードの関連語との共起確率の変化を示す指標である相対共起度を計算する相対共起度計算手段と、
    比較期間におけるキーワードの関連語集合ベクトルと、対象期間における前記キーワードの関連語集合ベクトルとのコサイン類似度から、前記キーワードに関する話題の変化の度合いの指標である相対関連語類似度を計算する相対関連語類似度計算手段と、
    前記相対共起度計算手段で計算された相対共起度と、前記相対関連語類似度計算手段で計算された相対関連語類似度とに基づいて、前記キーワードのトレンド性を数値化するトレンドスコアを計算するトレンドスコア計算手段と
    を有することを特徴とするトレンド評価装置。
  4. 前記トレンドスコアに基づいて、前記キーワードのトレンドを評価するトレンド評価手段を有することを特徴とする請求項に記載のトレンド評価装置。
  5. キーワードに対する注目度の上昇度合いを示す指標である相対出現度を計算する相対出現度計算手段を有し、
    前記トレンドスコア計算手段は、前記相対共起度計算手段で計算された相対共起度と、前記相対関連語類似度計算手段で計算された相対関連語類似度と、前記相対出現度計算手段で計算された相対出現度とに基づいて、前記キーワードのトレンド性を数値化するトレンドスコアを計算することを特徴とする請求項又は請求項に記載のトレンド評価装置。
  6. 前記トレンドスコア計算手段は、前記相対共起度、前記相対関連語類似度又は、前記相対出現度に対して重み付けを行った後に、トレンドスコアを計算することを特徴とする請求項から請求項のいずれかに記載のトレンド評価装置。
  7. 前記相対共起度、前記相対関連語類似度又は前記相対出現度を図形化して表示するトレンド可視化手段を有することを特徴とする請求項から請求項のいずれかに記載のトレンド評価装置。
  8. 商品に関する情報が格納された商品情報記憶手段と、
    前記トレンド評価手段の結果に基づくキーワードに関連する商品を、前記商品情報記憶手段から検索して提示する商品推薦手段と
    を有することを特徴とする請求項から請求項のいずれかに記載のトレンド評価装置。
  9. キーワードのトレンドスコアの周期性を判断し、周期性に対応してトレンドスコアを補正する周期性判定手段を有することを特徴とする請求項から請求項のいずれかに記載のトレンド評価装置。
  10. 商品に関する情報が格納された商品情報記憶手段と、
    顧客に関する顧客情報が格納された顧客情報記憶手段と、
    前記トレンド評価手段の結果に基づくキーワードに関連する商品を、前記商品情報記憶手段から検索し、この商品を推薦する顧客を前記顧客情報に基づいて前記顧客情報記憶手段から検索して提示する商品推薦手段と
    を有することを特徴とする請求項から請求項のいずれかに記載のトレンド評価装置。
  11. 販売実績に基づいて、前記顧客情報記憶手段の顧客情報を更新する更新手段を有することを特徴とする請求項10に記載のトレンド評価装置。
  12. トレンド評価方法であって、
    情報処理装置は、
    記憶手段に記憶されているキーワード、前記キーワードに関連する関連語と、前記キーワードと前記関連語との共起確率とを読み取り、
    前記キーワードと前記キーワードの関連語との比較期間の共起確率に対する前記キーワードと前記キーワードの関連語との対象期間の共起確率の比から、前記キーワードと前記関連語との共起確率の変化を示す指標である相対共起度を計算し、
    前記相対共起度を蓄積し、所定期間の相対共起度の分散値を求め、所定の閾値を超えた前記分散値に対応するキーワードとこのキーワードの関連語との組み合わせをトレンドと評価する
    することを特徴とするトレンド評価方法。
  13. トレンド評価方法であって、
    情報処理装置は、
    記憶手段に記憶されているキーワードと、前記キーワードの比較期間及び対象期間の関連語とを読み出し、
    前記比較期間におけるキーワードの関連語集合ベクトルと、前記対象期間における前記キーワードの関連語集合ベクトルとのコサイン類似度から、前記キーワードに関する話題の変化の度合いの指標である相対関連語類似度を計算し、
    前記相対関連語類似度を蓄積し、所定期間の相対関連語類似度の分散値を求め、所定の閾値を超えた前記分散値に対応する相対関連語類似度のキーワードをトレンドと評価することを特徴とするトレンド評価方法。
  14. トレンド評価方法であって、
    情報処理装置は、
    記憶手段からキーワード、前記キーワードに関連する関連語と、前記キーワードと前記関連語との共起確率とを読み出し、
    前記キーワードと前記キーワードの関連語との比較期間の共起確率に対する前記キーワードと前記キーワードの関連語との対象期間の共起確率の比から、前記キーワードと前記キーワードの関連語との共起確率の変化を示す指標である相対共起度を計算し、
    前記比較期間におけるキーワードの関連語集合ベクトルと、前記対象期間における前記キーワードの関連語集合ベクトルとのコサイン類似度から、前記キーワードに関する話題の変化の度合いの指標である相対関連語類似度を計算し、
    前記相対共起度と前記相対関連語類似度とに基づいて、前記キーワードのトレンド性を数値化するトレンドスコアを計算する
    ことを特徴とするトレンド評価方法。
  15. 前記トレンドスコアに基づいて、前記キーワードのトレンドを評価することを特徴とする請求項14に記載のトレンド評価方法。
  16. キーワードに対する注目度の上昇度合いを示す指標である相対出現度を計算し、
    前記相対出現度と、前記相対共起度と、前記相対関連語類似度とに基づいて、前記キーワードのトレンド性を数値化するトレンドスコアを計算することを特徴とする請求項14又は請求項15に記載のトレンド評価方法。
  17. 前記相対出現度は、比較期間におけるキーワードの出現確率に対する、対象期間における前記キーワードの出現確率の比であることを特徴とする請求項14から請求項16のいずれかに記載のトレンド評価方法。
  18. 前記相対共起度、前記相対関連語類似度又は、前記相対出現度に対して重み付けを行った後に、トレンドスコアを計算することを特徴とする請求項14から請求項17のいずれかに記載のトレンド評価方法。
  19. 前記相対共起度、前記相対関連語類似度又は前記相対出現度を図形化して表示することを特徴とする請求項14から請求項18のいずれかに記載のトレンド評価方法。
  20. 商品に関する情報から、トレンドが評価されたキーワードに関連する商品を検索して提示することを特徴とする請求項14から請求項19のいずれかに記載のトレンド評価方法。
  21. 商品に関する情報から、トレンドが評価されたキーワードに関連する商品を検索し、この商品を推薦する顧客を、顧客情報に基づいて検索することを特徴とする請求項14から請求項20のいずれかに記載のトレンド評価方法。
  22. トレンドの評価を情報処理装置に実行させるプログラムであって、
    前記プログラムは情報処理装置に、
    記憶手段に記憶されているキーワード、前記キーワードに関連する関連語と、前記キーワードと前記関連語との共起確率とを読み取とる処理と、
    前記キーワードと前記キーワードの関連語との比較期間の共起確率に対する前記キーワードと前記キーワードの関連語との対象期間の共起確率の比から、前記キーワードと前記キーワードの関連語との共起確率の変化を示す指標である相対共起度を計算する相対共起度計算処理と、
    前記相対共起度を蓄積し、所定期間の相対共起度の分散値を求め、所定の閾値を超えた前記分散値に対応するキーワードとこのキーワードの関連語との組み合わせをトレンドと評価するトレンド評価処理と
    を実行させることを特徴とするプログラム。
  23. トレンドの評価を情報処理装置に実行させるプログラムであって、
    前記プログラムは情報処理装置に、
    記憶手段に記憶されているキーワードと、前記キーワードの比較期間及び対象期間の関連語とを読み出す処理と、
    前記比較期間におけるキーワードの関連語集合ベクトルと、前記対象期間における前記キーワードの関連語集合ベクトルとのコサイン類似度から、前記キーワードに関する話題の変化の度合いの指標である相対関連語類似度を計算する相対関連語類似度計算処理と、
    前記相対関連語類似度を蓄積し、所定期間の相対関連語類似度の分散値を求め、所定の閾値を超えた前記分散値に対応する相対関連語類似度のキーワードのトレンドを評価するトレンド評価処理と
    を実行させることを特徴とするプログラム。
  24. トレンドの評価を情報処理装置に実行させるプログラムであって、
    前記プログラムは情報処理装置に、
    記憶手段からキーワード、前記キーワードに関連する関連語と、前記キーワードと前記関連語との共起確率とを読み出す処理と、
    前記キーワードと前記キーワードの関連語との比較期間の共起確率に対する前記キーワードと前記キーワードの関連語との対象期間の共起確率の比から、前記キーワードと前記キーワードの関連語との共起確率の変化を示す指標である相対共起度を計算する相対共起度計算処理と、
    比較期間におけるキーワードの関連語集合ベクトルと、対象期間における前記キーワードの関連語集合ベクトルとのコサイン類似度から、前記キーワードに関する話題の変化の度合いの指標である相対関連語類似度を計算する相対関連語類似度計算処理と、
    前記計算された相対共起度と、前記計算された相対関連語類似度とに基づいて、前記キーワードのトレンド性を数値化するトレンドスコアを計算するトレンドスコア計算処理と
    を実行させることを特徴とするプログラム。
  25. 前記トレンドスコアに基づいて、前記キーワードのトレンドを評価するトレンド評価処理を有することを特徴とする請求項24に記載のプログラム。
  26. 前記プログラムは情報処理装置に、キーワードに対する注目度の上昇度合いを示す指標である相対出現度を計算する相対出現度計算処理を実行させ、
    前記トレンドスコア計算処理は、前記計算された相対共起度と、前記相対関連語類似度と、前記計算された相対出現度とに基づいて、前記キーワードのトレンド性を数値化するトレンドスコアを計算することを特徴とする請求項24又は請求項25に記載のプログラム。
  27. 前記相対出現度計算処理は、比較期間におけるキーワードの出現確率に対する、対象期間における前記キーワードの出現確率の比から相対出現度を計算することを特徴とする請求項24から請求項26のいずれかに記載のプログラム。
  28. 前記トレンドスコア計算処理は、前記相対共起度、前記相対関連語類似度又は、前記相対出現度に対して重み付けを行った後に、トレンドスコアを計算することを特徴とする請求項24から請求項27のいずれかに記載のプログラム。
  29. 前記プログラムは情報処理装置に、前記相対共起度、前記相対関連語類似度又は前記相対出現度を図形化して表示するトレンド可視化処理を実行させることを特徴とする請求項24から請求項28に記載のプログラム。
  30. 前記プログラムは情報処理装置に、前記トレンド評価処理の結果に基づくキーワードに関連する商品を、商品に関する情報が格納された商品情報記憶手段から検索して提示する商品推薦処理を実行させることを特徴とする請求項24から請求項29のいずれかに記載のプログラム。
  31. 前記プログラムは情報処理装置に、キーワードのトレンドスコアの周期性を判断し、周期性に対応してトレンドスコアを補正する周期性判定処理を実行させることを特徴とする請求項24から請求項30のいずれかに記載のプログラム。
  32. 前記プログラムは情報処理装置に、前記トレンド評価処理の結果に基づくキーワードに関連する商品を、商品に関する情報が格納された商品情報記憶手段から検索し、この商品を推薦する顧客を前記顧客情報に基づいて顧客に関する顧客情報が格納された顧客情報記憶手段から検索して提示する商品推薦処理を実行させることを特徴とする請求項24から請求項31のいずれかに記載のプログラム。
  33. 前記プログラムは情報処理装置に、販売実績に基づいて、前記顧客情報記憶手段の顧客情報を更新する更新処理を実行させることを特徴とする請求項32に記載のプログラム。
JP2007539856A 2005-09-30 2006-09-25 トレンド評価装置と、その方法及びプログラム Active JP5067556B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007539856A JP5067556B2 (ja) 2005-09-30 2006-09-25 トレンド評価装置と、その方法及びプログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005288429 2005-09-30
JP2005288429 2005-09-30
PCT/JP2006/318921 WO2007043322A1 (ja) 2005-09-30 2006-09-25 トレンド評価装置と、その方法及びプログラム
JP2007539856A JP5067556B2 (ja) 2005-09-30 2006-09-25 トレンド評価装置と、その方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2007043322A1 JPWO2007043322A1 (ja) 2009-04-16
JP5067556B2 true JP5067556B2 (ja) 2012-11-07

Family

ID=37942573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007539856A Active JP5067556B2 (ja) 2005-09-30 2006-09-25 トレンド評価装置と、その方法及びプログラム

Country Status (3)

Country Link
US (1) US20100153107A1 (ja)
JP (1) JP5067556B2 (ja)
WO (1) WO2007043322A1 (ja)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ578672A (en) * 2006-12-29 2012-08-31 Thomson Reuters Glo Resources Information-retrieval systems, methods, and software with concept-based searching and ranking
US8290921B2 (en) * 2007-06-28 2012-10-16 Microsoft Corporation Identification of similar queries based on overall and partial similarity of time series
US20090144226A1 (en) * 2007-12-03 2009-06-04 Kei Tateno Information processing device and method, and program
WO2009096523A1 (ja) * 2008-01-30 2009-08-06 Nec Corporation 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム
JP5116593B2 (ja) * 2008-07-25 2013-01-09 インターナショナル・ビジネス・マシーンズ・コーポレーション 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム
US20110153601A1 (en) * 2008-09-24 2011-06-23 Satoshi Nakazawa Information analysis apparatus, information analysis method, and program
JP4969554B2 (ja) * 2008-11-14 2012-07-04 ヤフー株式会社 トピックグラフを利用したドキュメント検索サーバ及び方法
US8462160B2 (en) * 2008-12-31 2013-06-11 Facebook, Inc. Displaying demographic information of members discussing topics in a forum
US9521013B2 (en) 2008-12-31 2016-12-13 Facebook, Inc. Tracking significant topics of discourse in forums
EP2441010A4 (en) * 2009-06-09 2016-12-28 Ebh Entpr Inc METHODS, APPARATUS AND SOFTWARE FOR ANALYZING THE CONTENT OF MICROBLOGUE MESSAGES
JP5412981B2 (ja) * 2009-06-23 2014-02-12 富士ゼロックス株式会社 情報処理装置及びプログラム
US20110044447A1 (en) * 2009-08-21 2011-02-24 Nexidia Inc. Trend discovery in audio signals
US20130124531A1 (en) * 2010-09-08 2013-05-16 Walter Bachtiger Systems for extracting relevant and frequent key words from texts and their presentation in an auto-complete function of a search service
JP5299199B2 (ja) * 2009-09-29 2013-09-25 ブラザー工業株式会社 商品推奨方法及び商品推奨システム
US10074094B2 (en) * 2010-03-09 2018-09-11 Excalibur Ip, Llc Generating a user profile based on self disclosed public status information
US9197448B2 (en) * 2010-07-19 2015-11-24 Babar Mahmood Bhatti Direct response and feedback system
US20120166278A1 (en) * 2010-12-10 2012-06-28 Macgregor Malcolm Methods and systems for creating self-learning, contextually relevant, targeted, marketing campaigns, in real time and predictive modes
JP5614687B2 (ja) * 2011-02-04 2014-10-29 国立大学法人鳥取大学 時系列情報とテキスト情報とを含む時系列的テキストデータを解析する情報解析装置
JP5269938B2 (ja) * 2011-03-31 2013-08-21 ヤフー株式会社 急上昇ワード関連付け装置及び方法
JP5679194B2 (ja) * 2011-05-18 2015-03-04 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP5548654B2 (ja) * 2011-06-22 2014-07-16 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラム、及び情報処理プログラムが記録された記録媒体
JP5490082B2 (ja) * 2011-12-19 2014-05-14 株式会社インテック インターネットサイト情報分析方法と装置
JP5642058B2 (ja) * 2011-12-26 2014-12-17 株式会社日立システムズ 注目単語分析方法および注目単語分析システム
US20140067596A1 (en) * 2012-02-22 2014-03-06 Cobrain Company Methods and apparatus for recommending products and services
US20130232412A1 (en) * 2012-03-02 2013-09-05 Nokia Corporation Method and apparatus for providing media event suggestions
US20130291019A1 (en) * 2012-04-27 2013-10-31 Mixaroo, Inc. Self-learning methods, entity relations, remote control, and other features for real-time processing, storage, indexing, and delivery of segmented video
US20140123178A1 (en) 2012-04-27 2014-05-01 Mixaroo, Inc. Self-learning methods, entity relations, remote control, and other features for real-time processing, storage, indexing, and delivery of segmented video
JP5223018B1 (ja) * 2012-05-30 2013-06-26 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
WO2014083655A1 (ja) * 2012-11-29 2014-06-05 株式会社日立製作所 ネットワークグラフ生成方法及び意思決定支援システム
US9146980B1 (en) * 2013-06-24 2015-09-29 Google Inc. Temporal content selection
WO2015008388A1 (ja) * 2013-07-19 2015-01-22 楽天株式会社 レコメンド情報提示装置、レコメンド情報提示方法及びレコメンド情報提示プログラム
JP6040137B2 (ja) * 2013-10-17 2016-12-07 日本電信電話株式会社 アイテム推薦装置、アイテム推薦方法およびアイテム推薦プログラム
US9450771B2 (en) 2013-11-20 2016-09-20 Blab, Inc. Determining information inter-relationships from distributed group discussions
WO2015129044A1 (ja) * 2014-02-28 2015-09-03 楽天株式会社 情報処理システム、情報処理方法、および情報処理プログラム
JP2016099875A (ja) * 2014-11-25 2016-05-30 エコノミックインデックス株式会社 情報処理装置及び方法、並びにプログラム
US10459914B2 (en) 2015-09-18 2019-10-29 Facebook, Inc. Detecting key topics on online social networks
US9760838B1 (en) 2016-03-15 2017-09-12 Mattersight Corporation Trend identification and behavioral analytics system and methods
US10733221B2 (en) * 2016-03-30 2020-08-04 Microsoft Technology Licensing, Llc Scalable mining of trending insights from text
JP6679513B2 (ja) * 2017-02-08 2020-04-15 ヤフー株式会社 提供装置、提供方法、及び提供プログラム
US20180349351A1 (en) * 2017-05-31 2018-12-06 Move, Inc. Systems And Apparatuses For Rich Phrase Extraction
JP6749866B2 (ja) * 2017-06-07 2020-09-02 日本電信電話株式会社 トレンド評価装置、および、トレンド評価方法
US10599152B2 (en) * 2018-02-12 2020-03-24 Ford Global Technologies, Llc Earthquake emergency management system for automotive vehicles
JP6703592B1 (ja) * 2018-12-18 2020-06-03 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
US11574326B2 (en) * 2019-04-25 2023-02-07 Qualtrics, Llc Identifying topic variances from digital survey responses
US20210279662A1 (en) * 2020-03-05 2021-09-09 Bank Of America Corporation Intelligent factor based resource distribution machine loading
KR102537601B1 (ko) * 2020-12-10 2023-05-26 주식회사 카카오 광고 전략을 생성하기 위한 광고 방법 및 장치
KR102648300B1 (ko) * 2021-06-09 2024-03-14 네이버 주식회사 검색 질의의 사용자 의도에 기초한 상품군 생성 방법 및 시스템

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11316776A (ja) * 1998-05-01 1999-11-16 Nippon Telegr & Teleph Corp <Ntt> マクロトレンド計算装置および方法とマクロトレンド計算プログラムを記録した記録媒体
JP2000194745A (ja) * 1998-12-25 2000-07-14 Nec Corp トレンド評価装置及びトレンド評価方法
JP2001216311A (ja) * 2000-02-01 2001-08-10 Just Syst Corp イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置
JP2002207755A (ja) * 2001-01-09 2002-07-26 Fujitsu Ltd イベントデータに関する情報管理装置
JP2002342566A (ja) * 2001-05-15 2002-11-29 Asahi Servicer Co Ltd 債権債務情報管理システム
JP2004185572A (ja) * 2002-12-06 2004-07-02 Nippon Telegr & Teleph Corp <Ntt> 口コミ情報解析方法及び装置
JP2005071163A (ja) * 2003-08-26 2005-03-17 Seiko Epson Corp 商品購入アドバイスシステム、情報提供装置およびプログラム
JP2005190384A (ja) * 2003-12-26 2005-07-14 National Institute Of Information & Communication Technology イベント周期性の抽出方法及び装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4025443B2 (ja) * 1998-12-04 2007-12-19 富士通株式会社 文書データ提供装置及び文書データ提供方法
WO2000068757A2 (en) * 1999-05-07 2000-11-16 Carlos Cardona System and method for database retrieval, indexing and statistical analysis
US20020078054A1 (en) * 2000-11-22 2002-06-20 Takahiro Kudo Group forming system, group forming apparatus, group forming method, program, and medium
US7155668B2 (en) * 2001-04-19 2006-12-26 International Business Machines Corporation Method and system for identifying relationships between text documents and structured variables pertaining to the text documents
JP2002351897A (ja) * 2001-05-22 2002-12-06 Fujitsu Ltd 情報利用頻度予測プログラム、情報利用頻度予測装置および情報利用頻度予測方法
US20070037513A1 (en) * 2005-08-15 2007-02-15 International Business Machines Corporation System and method for targeted message delivery and subscription

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11316776A (ja) * 1998-05-01 1999-11-16 Nippon Telegr & Teleph Corp <Ntt> マクロトレンド計算装置および方法とマクロトレンド計算プログラムを記録した記録媒体
JP2000194745A (ja) * 1998-12-25 2000-07-14 Nec Corp トレンド評価装置及びトレンド評価方法
JP2001216311A (ja) * 2000-02-01 2001-08-10 Just Syst Corp イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置
JP2002207755A (ja) * 2001-01-09 2002-07-26 Fujitsu Ltd イベントデータに関する情報管理装置
JP2002342566A (ja) * 2001-05-15 2002-11-29 Asahi Servicer Co Ltd 債権債務情報管理システム
JP2004185572A (ja) * 2002-12-06 2004-07-02 Nippon Telegr & Teleph Corp <Ntt> 口コミ情報解析方法及び装置
JP2005071163A (ja) * 2003-08-26 2005-03-17 Seiko Epson Corp 商品購入アドバイスシステム、情報提供装置およびプログラム
JP2005190384A (ja) * 2003-12-26 2005-07-14 National Institute Of Information & Communication Technology イベント周期性の抽出方法及び装置

Also Published As

Publication number Publication date
US20100153107A1 (en) 2010-06-17
WO2007043322A1 (ja) 2007-04-19
JPWO2007043322A1 (ja) 2009-04-16

Similar Documents

Publication Publication Date Title
JP5067556B2 (ja) トレンド評価装置と、その方法及びプログラム
Franceschet A comparison of bibliometric indicators for computer science scholars and journals on Web of Science and Google Scholar
US8326658B1 (en) Generation and contextual presentation of statistical data reflective of user selections from an electronic catalog
US8818788B1 (en) System, method and computer program product for identifying words within collection of text applicable to specific sentiment
US8554641B2 (en) Merchandising items of topical interest
US20100191742A1 (en) System And Method For Managing User Attention By Detecting Hot And Cold Topics In Social Indexes
US20130290232A1 (en) Identifying news events that cause a shift in sentiment
US20110238730A1 (en) Correlated Information Recommendation
JP2010134733A (ja) 情報推薦装置、情報推薦方法、及びプログラム
US11176586B2 (en) Data analysis method and system thereof
JP5786458B2 (ja) キーワード抽出及びウエブコンテンツアクセス情報の収集装置
US10067964B2 (en) System and method for analyzing popularity of one or more user defined topics among the big data
JP5481242B2 (ja) ユーザ特徴と利用動向の分析システム、およびその処理方法とプログラム
US20180139296A1 (en) Method of producing browsing attributes of users, and non-transitory computer-readable storage medium
JP2007018285A (ja) 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム
US20100169316A1 (en) Search query concept based recommendations
Korfiatis et al. The impact of readability on the usefulness of online product reviews: a case study on an online bookstore
JP5277941B2 (ja) 関連商品提示方法、関連商品提示システム、プログラム、記録媒体
WO2012167399A1 (en) Sentiment trend visualization relating to an event occurring in a particular geographic region
US10719561B2 (en) System and method for analyzing popularity of one or more user defined topics among the big data
US20130185315A1 (en) Identification of Events of Interest
JP2021176085A (ja) ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム
CN114358871A (zh) 商品推荐方法及电子设备
KR101549188B1 (ko) 브랜드 이미지 측정장치 및 측정방법
CN107688979A (zh) 用于提供信用参考信息的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120718

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120731

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150824

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5067556

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150