JP2012038135A - トレンド推移判定装置またはその方法 - Google Patents

トレンド推移判定装置またはその方法 Download PDF

Info

Publication number
JP2012038135A
JP2012038135A JP2010178477A JP2010178477A JP2012038135A JP 2012038135 A JP2012038135 A JP 2012038135A JP 2010178477 A JP2010178477 A JP 2010178477A JP 2010178477 A JP2010178477 A JP 2010178477A JP 2012038135 A JP2012038135 A JP 2012038135A
Authority
JP
Japan
Prior art keywords
period
trend
specific
unit
document data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010178477A
Other languages
English (en)
Inventor
Takahiro Miura
高広 三浦
Mitsuo Hirotoshi
光郎 廣利
Zentoku Tomiyama
全徳 冨山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Solutions Ltd
Original Assignee
Hitachi Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Solutions Ltd filed Critical Hitachi Solutions Ltd
Priority to JP2010178477A priority Critical patent/JP2012038135A/ja
Publication of JP2012038135A publication Critical patent/JP2012038135A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】 簡易にトレンド分析の判定結果を得る。
【解決手段】 期特定キーワード記憶手段3はトレンド推移を構成する複数の期について、それぞれ用いられる期特定キーワードを各期について1または2以上の記憶する。出現頻度演算手段4は、文書データ記憶手段2に記憶された文書データから各本文に存在する期特定キーワードの出現頻度を求め、当該文書データの作成時期データと対応づける。判定手段5はトレンド推移を判定するための期間を所定の単位期間に分割した各細分単位期間について、前記出現頻度を求めた出現頻度を各期毎に総計した各期頻度総計値を演算し、前記各細分単位期間について、もっとも頻度総計値が高い期を当該細分単位期間における期であると判定する。報知手段7は判定結果を報知する。
【選択図】 図1

Description

この発明は、トレンド推移判定装置に関し、特に、その分析手法に関する。
特許文献1には、トレンドを予測する対象のキーワードに関するポジティブあるいはネガティブな表現を抽出・集計し、ある閾値を以て流行状態であると判断するトレンド予測装置法が開示されている。
また、特許文献2には、グルメ、音楽、芸能等の特定分野に関するオピニオンリーダーについて、ポジティブまたはネガティブな評価の発信を流行の初期段階とし、分野外の情報提供者による情報発信を流行の拡大段階と判断する情報分析装置が開示されている。
特開2006−227965号公報 特開2010−020731号公報
しかし、上記特許文献1においては、対象キーワードに関するポジティブあるいはネガティブな評価のみを追跡しているので、細かなトレンドの動きを把握することはできないという問題があった。また、特許文献2においては、あらかじめ第1情報提供者の一覧を作成しておく必要があるという問題があった。
この発明は、上記の問題点を解決して、簡易にトレンド時期の判定ができるトレンド推移判定装置を提供することを目的とする。
(1)本発明にかかるトレンド推移判定装置は、A)黎明期に用いられる黎明期特定キーワード、流行期に用いられる流行期特定キーワード、反動期に用いられる反動期特定キーワード、回復期に用いられる回復期特定キーワード、および安定期に用いられる安定期特定キーワードを、期特定ワードとして各期について1または2以上の記憶する期特定キーワード記憶手段、B)特定のテーマについての本文およびその作成時期データが対応づけられた文書データを記憶する文書データ記憶手段、C)前記各文書データから各本文に存在する前記期特定キーワードの出現頻度を求め、当該文書データの作成時期データと対応づける出現頻度演算手段、D)トレンド推移を判定するための期間を所定の単位期間に分割した各細分単位期間について、前記出現頻度を求めた黎明期特定キーワード、流行期特定キーワード、反動期特定キーワード、回復期特定キーワード、および安定期特定キーワードの出現頻度を各期毎に総計した各期頻度総計値を演算し、前記各細分単位期間について、もっとも頻度総計値が高い期を当該細分単位期間における期であると判定する判定手段を備えている。
したがって、簡易にトレンド時期の判定を可能とするトレンド推移判定装置を提供することができる。
(2)本発明にかかるトレンド推移判定装置においては、前記判定手段が判定した細分単位期間における期に基づいて、前記各期の期間開始時期および期間終了時期を求め、各期を構成する期間の長さから、前記特定のテーマについて、判定された期よりも時期的に後の期が到来する時期を予測する予測手段を備えている。
したがって、未到達のトレンド時期を簡易に予測することができる。
(3)本発明にかかるトレンド推移判定装置においては、前記予測手段は、前記判定手段が判定した細分単位期間における期に基づいて、前記各期の平均期間値を求め、これを加算して、前記特定のテーマについて、判定された期よりも時期的に後の期が到来する時期を予測する。
したがって、未到達のトレンド時期を平均値から予測することができる。
(4)本発明にかかるトレンド推移判定装置においては、前記期特定キーワードの出現頻度は、存在する文書数または期特定キーワードの出現数である。したがって、前記文書数または前記期特定キーワードの出現数に基づいて、トレンド推移を判定することができる。
(5)本発明にかかるトレンド推移判定装置においては、前記各期毎について、補正係数を記憶する補正係数記憶手段を備え、前記判定手段は、前記各期頻度総計値を前記補正係数で補正し、補正後の各期頻度総計値で、当該細分単位期間における期を判定する。したがって、各期頻度総計値を補正した値で、前記判定が可能となる。
(6)本発明にかかるトレンド推移判定装置は、1)前記トレンド推移を構成する複数の期について、それぞれ用いられる期特定キーワードを各期について1または2以上の記憶する期特定キーワード記憶手段、2)特定のテーマについての本文およびその作成時期データが対応づけられた文書データを記憶する文書データ記憶手段、3)前記各文書データから各本文に存在する前記期特定キーワードの出現頻度を求め、当該文書データの作成時期データと対応づける出現頻度演算手段、4)トレンド推移を判定するための期間を所定の単位期間に分割した各細分単位期間について、前記出現頻度を求めた出現頻度を各期毎に総計した各期頻度総計値を演算し、前記各細分単位期間について、もっとも頻度総計値が高い期を当該細分単位期間における期であると判定する判定手段を備えている。
したがって、簡易にトレンド時期の判定を可能とするトレンド推移判定装置を提供することができる。
本明細書において使用する用語について、説明する。「期特定キーワード」とは、いずれのトレンド段階であるのかを特定するキーワードであり、実施形態では、図3のトレンド表現辞書に記憶されたワードが該当する。「細分単位期間」とは、時間軸における分析単位であり、実施形態では、1月単位としたが、これに限定されない。「期頻度総計値」とは、図7に示す細分単位期間別のトレンド段階別の抽出数が該当する。さらに、補正係数で補正した後も含む。
トレンド推移分析装置1の機能ブロック図である。 トレンド推移分析装置1を、CPUを用いて実現したハードウェア構成の一例を示す図である。 トレンド表現辞書26dの一例である。 文書記憶部26kのデータ構造を示す図である。 メインプログラム26mのフローチャートを示す図である。 トレンド表現集計処理のフローチャートである。 トレンド表現集計情報データベースのデータ構造を示す図である。 トレンド推移情報データベースのデータ構造を示す図である。 トレンド段階分析処理の詳細フローチャートである。 トレンド予測処理の詳細フローチャートである。 トレンド予測処理における途中結果である。 トレンド予測処理における途中結果である。 トレンド予測処理における結果データである。
以下、本発明における実施形態について、図面を参照して説明する。
(1. 機能ブロック図)
図1に、本発明の1実施形態にかかるトレンド推移分析装置1の機能ブロック図を示す。
トレンド推移判定装置1は、期特定キーワード記憶手段3、文書データ記憶手段2、出現頻度演算手段4、判定手段5、予測手段6および報知手段7を備えている。
期特定キーワード記憶手段3は、黎明期に用いられる黎明期特定キーワード、流行期に用いられる流行期特定キーワード、反動期に用いられる反動期特定キーワード、回復期に用いられる回復期特定キーワード、および安定期に用いられる安定期特定キーワードを、期特定ワードとして各期について1または2以上の記憶する。文書データ記憶手段2は、特定のテーマについての本文およびその作成時期データが対応づけられた文書データを記憶する。出現頻度演算手段4は、前記各文書データから各本文に存在する前記期特定キーワードの出現頻度を求め、当該文書データの作成時期データと対応づける。判定手段5は、トレンド推移を判定するための期間を所定の単位期間に分割した各細分単位期間について、前記出現頻度を求めた黎明期特定キーワード、流行期特定キーワード、反動期特定キーワード、回復期特定キーワード、および安定期特定キーワードの出現頻度を各期毎に総計した各期頻度総計値を演算し、前記各細分単位期間について、もっとも頻度総計値が高い期を当該細分単位期間における期であると判定する。予測手段6は、前記判定手段が判定した細分単位期間における期に基づいて、前記各期の平均期間値を求め、これを加算して、前記特定のテーマについて、判定された期よりも時期的に後の期が到来する時期を予測する。報知手段7は、判定手段5の判定結果、および予測手段6の予測結果を報知する。
これにより、簡易に判定結果および予測結果を取得することができる。
(2. ハードウェア構成)
図1に示すトレンド推移分析装置1のハードウェア構成について、図2を用いて説明する。同図は、トレンド推移分析装置1を、CPUを用いて構成したハードウェア構成の一例である。
トレンド推移分析装置1は、CPU23、メモリ27、ハードディスク26、モニタ30、光学式ドライブ25、入力デバイス28(マウス28a,キーボード28b)、通信部31およびバスライン29を備えている。CPU23は、ハードディスク26に記憶された各プログラムにしたがいバスライン29を介して、各部を制御する。
ハードディスク26は、オペレーティングシステムプログラム26o(以下OSと略す)、メインプログラム26mが記憶されており、各種のデータが記憶される。本実施形態においては、オペレーティングシステムプログラム(OS)26oとして、LINUX(登録商標または商標)を採用したが、これに限定されるものではない。
なお、上記各プログラムは、光学式ドライブ25を介して、プログラムが記憶されたCD−ROM25aから読み出されてハードディスク26にインストールされたものである。なお、CD−ROM以外に、フレキシブルディスク(FD)、ICカード等のプログラムをコンピュータ可読の記録媒体から、ハードディスクにインストールさせるようにしてもよい。さらに、通信回線を用いてダウンロードするようにしてもよい。
本実施形態においては、プログラムをCD−ROMからハードディスク26にインストールさせることにより、CD−ROMに記憶させたプログラムを間接的にコンピュータに実行させるようにしている。しかし、これに限定されることなく、CD−ROMに記憶させたプログラムを光学式ドライブ25から直接的に実行するようにしてもよい。なお、コンピュータによって、実行可能なプログラムとしては、そのままインストールするだけで直接実行可能なものはもちろん、一旦他の形態等に変換が必要なもの(例えば、データ圧縮されているものを、解凍する等)、さらには、他のモジュール部分と組合して実行可能なものも含む。
ハードディスク26に記憶される各種データのデータ構造について説明する。トレンド表現辞書26dには、テーマに関係なく各トレンド段階において、よく用いられる期特定ワードを各トレンド段階について1または2以上、記憶する。本実施形態においては、黎明期(トレンド段階1)に用いられる黎明期特定キーワード、流行期(トレンド段階2)に用いられる流行期特定キーワード、反動期(トレンド段階3)に用いられる反動期特定キーワード、回復期(トレンド段階4)に用いられる回復期特定キーワード、および安定期(トレンド段階5)に用いられる安定期特定キーワードを、各トレンド段階について1または2以上、記憶している。たとえば、この場合、トレンド段階1の期特定ワードとして、「新しい」、「登場」が記憶されている。
文書情報データベース26dはデータの集合体であり、図4に示すように、「文書ID」、「作成時期」、「本文」を有する。例えば文書ID「D001」の文書は、作成時期が「2009/11/22」、本文が「クラウドが全面特集で取り上げられて・・」であることを表している。
トレンド表現情報データベース26Kは、後述するトレンド表現の集計処理結果が記憶される。トレンド推移情報データベース26Sには、トレンド表現分析結果が記憶される。各々のデータ構造については後述する。
(3.トレンド表現分析処理)
メインプログラム26mに基づくトレンド表現分析処理について、図5のフローチャートを用いて説明する。なお、以下の説明では、テーマ「XXX」についてのトレンド分析をする場合とし、そのため、文書情報データベース26dには、当該テーマに合致する文書を複数記憶している。かかるテーマに合致した文書の抽出処理について従来知られている手法を用いればよく、例えば、特定のキーワードによる類似度判断をすればよい。
CPU23はトレンド表現集計処理を行う(図5ステップS1)。トレンド表現集計処理の詳細フローチャートを図6に示す。
CPU23は、時間軸における分析単位を決定する(ステップS11)。本実施形態においては、時間軸における分析単位を1月単位とした。具体的には、文書情報データベース2054に含まれる全文書情報の日時情報から、最古および最新の日時情報を取り出して、その間を1月単位で分割するようにした。本実施形態においては、最古が2009/9/1で、最新が2010/4/30であったので、これらを1月単位で分割して8つの分析単位を得た。なお、かかる分析単位についてはテーマに応じて長短変化させてもよい。また、最古および最新の日時情報から、これを所定数単位に分割して、分析単位を決定するようにしてもよい。
CPU23は、集計表を生成する(ステップS12)。本実施形態においては、時間軸の分析単位を8個、トレンド段階の分析単位を5個としたので、5*8=40の集計表が生成される。CPU23は、文書情報DBの文書数だけ処理を繰り返す、繰り返しモードとする(ステップS13)。CPU23は、文書情報DBの本文を解析し、トレンド表現辞書に記憶された期特定ワードとのマッチング判断(類似度判断)をする(ステップS14)。かかる類似度判断は、従来知られている手法を採用すればよい。CPU23、マッチング結果に基づき、各文書について、マッチングした期特定ワード毎に、属する期の値を1つ増やす(ステップS15)。例えば、ある文書について、トレンド段階1のトレンド表現が1つあれば、トレンド段階1のカウント数が1つ増える。なお、文書の本文によっては、複数のトレンド段階のトレンド表現とマッチする場合も考えられる。この場合は、その分だけカウント数を増やす。
また、文章の本文中に、トレンド表現が繰り返される場合もある。本実施形態においては、文書数がいくつかあるかを集計するようにしたが、ワード数がいくつあるかを集計するようにしてもよい。例えば、1の文書内に、「移行」というトレンド表現が、数十回出てくる場合、そのぶんだけカウント数を増やすようにしてもよい。このように、ワード単位でトレンド表現をカウントすることにより、最終的に得られるトレンド曲線の波が激しくなる(流行期には高いピーク、反動期には急降下など)場合がある。この場合、流行の変化がより顕著になるという効果がある。
CPU23は、ステップS14,ステップS15の処理を文書情報データベースにおける文書数だけ繰り返す(ステップS16)。これにより図7に示すような8つの期間について、各トレンド段階に属するトレンド表現数が記憶される。
CPU23はトレンド表現集計処理が終了すると、トレンド表現分析処理を行う(図5ステップS3)。トレンド表現分析処理の詳細フローチャートを図9に示す。
CPU23は、図6ステップS11で取得した時間軸における分析単位ごとの期間を、トレンド表現集計情報DB26kから取得する(ステップS21)。本実施形態においては、既に説明したように、8つの期間(分析単位)が取得される。
CPU23は、ステップS24〜ステップS25までの処理を、ステップS21で取得した期間の数X(この場合8つ)だけ繰り返すモードとする(ステップS22、ステップS26)。
CPU23は、1つめの期間(2009/9/1〜9/30)についてのトレンド段階を決定する(ステップS24)。本実施形態においては、最大値を有するトレンド段階を決定するようにした。例えば、1つめの期間(2009/9/1〜9/30)については、トレンド段階1〜5について、それぞれ「1」「32」「28」「1」「3」であるので、トレンド段階2が当該期間におけるトレンド段階として決定される。
CPU23は結果をトレンド推移情報データベース26Sに格納する(ステップS25)。
CPU23は、ステップS21で取得した期間の数だけ、ステップS24,ステップS25を繰り返す。これにより図8に示すようなトレンド表現分析結果が得られる。
これにより、テーマ「XXX」については、2009年9月が「流行期」、2009年10月〜12月が「反動期」、2010年1月、2月が「回復期」、2010年3月、4月が「安定期」であると判断することができる。
本実施形態においては、2つめ以降の期間についても、各期間についての文書数でトレンド段階を決定するようにした。たとえば、2つめの期間(2009/10/1〜10/31)については、トレンド段階1〜5について、それぞれ「5」「10」「75」「10」「2」によって、トレンド段階を決定した。しかしこれに限定されず、それまでの期間の累計によってトレンド段階を決定するようにしてもよい。この場合であれば、2つめの期間(2009/10/1〜10/31)のトレンド段階1〜5について、について、1つめの期間(2009/9/1〜9/30)の対応するトレンド段階1〜5の「1」「32」「28」「1」「3」をそれぞれ累積した「6」「42」「83」「11」「5」によって、トレンド段階を決定してもよい。3つめ以降についても同様である。
また、辞書に記憶された登録数で、図5ステップS1で得られた集計結果を正規化するようにしてもよい。たとえば、「黎明期」が登録数100語、「流行期」が登録数200語、「反動期」が登録数200語、「回復期」が登録数100語、「安定期」が登録数100語である場合、流行期および反動期について抽出したトレンド表現数を1/2とすればよい。
本実施形態においては、各分析単位において、その中でトレンド表現の数が一番多い段階を当該分析単位におけるトレンド段階であると判断している。ただし、これに限定されず、適切な重み付け係数をトレンド段階毎に記憶しておき、係数を乗算した値が一番大きいものを選択するようにしてもよい。特に、流行期および反動期の表現は他のトレンド段階と比較すると、トレンド表現数が頻出する傾向があり、逆に回復期、および安定期については、トレンド表現数が少なくなる傾向ある。
したがって、予めトレンド段階毎に重み係数を記憶しておき、これに基づいて、抽出したトレンド表現数を補正するようにすればよい。
(4.トレンド予測処理)
上記実施形態においては、既にデータが存在するトレンド段階を判断するようにしたが、まだ到達していない未来についてのトレンド段階を予測することもできる。図10を用いて説明する。以下では、図3ステップS3までの処理が終了して、図11に示すような13の期間についてのトレンド段階判定結果が得られている場合について説明する。
CPU23は、全トレンド段階を抽出する(ステップS31)。この場合、2008/09/01〜2009/09/30までの13の期間について、トレンド段階「1」、「2」、「3」の3つのトレンド段階が取得される。CPU23は、取得したトレンド段階の数だけ、ステップS33の処理を繰り返す。(ステップS32、ステップS34)。トレンド段階の個数Xだけ繰り返す。以下、繰り返しカウンタをxとして、初期値を1とする。この場合、Xは3となる。
CPU23は注目するトレンド段階該当期間を演算する(ステップS33)。すなわち、トレンド推移情報データベース26Sから、トレンド段階が「現在着目しているx番目のトレンド段階」であるレコードを、期間が古いものから順にソートして取り出し、その結果から、先頭レコードの期間の始点と末尾レコードの期間の終点との差分を演算し、これを当該トレンド段階における期間とする。例えば、この場合、x=1であるので、トレンド推移情報データベースから、トレンド段階が「1」であるレコードを、期間が古いものから順にソートして取り出す。これにより図12に示すようなデータが得られる。このうち、先頭レコードの期間の始点「2008/09/01」および末尾レコードの期間の終点「2009/01/31」の差分である「152日」を以って、トレンド段階「1」における該当期間とする。
ステップS33の処理をX=3まで繰り返すことにより図13に示す各トレンド段階におけるトレンド段階該当期間が得られる。
CPU23は、取得した各トレンド段階該当期間から、次のトレンド段階の期間を予測する(ステップS35)。本実施形態においては、トレンド推移情報データベース26Sの末尾レコードにおける期間の終端の翌日、および、それにステップ902〜ステップ904で取得した全てのトレンド段階における全体の期間の平均値を加算したものを組み合わせた期間を予測値とした。図13の例であれば、次のトレンド段階「4」は、トレンド推移情報データベース26Sの末尾レコードの終端の翌日である「2009/10/01」を始点とし、それにトレンド段階における全体の期間の平均値 (152+119+121)/3≒130日 を加算した「2010/02/08」を終点と予測できる。すなわち、現状ではまだ起こっていないトレンド段階「4」は「2009/10/01」に始まり「2010/02/08」に終わると予測することができる。
予測手法については、他のやりかたであってもよい。上記の例では、各トレンド段階該当期間は、ほぼ均等であるとしたが、5つのトレンド段階について、分野ごとに、一定の傾向があるのであれば、分野ごとにかかる補正をするようにしても良い。例えば、分野Aに属するテーマについては、「流行期」と「反動期」が他の期に比べると、約0.8倍であるなどである。
また、トレンド段階毎に、将来のトレンド表現のカウント数を予測するようにしてもよい。具体的には、トレンド段階毎に、横軸に期間を縦軸にトレンド表現のカウント数を、図7に示すトレンド段階毎に求めて、得られた離散データにマッチする近似関数を最小二乗法等により、求めればよい。近似関数についてはn次の多項式とすればよい。本実施形態においては、2次の多項式としたが、これに限定されない。
かかる予測処理を全列について行うことにより、各トレンド段階について、未来の期間についての表現数を予測することができる。
例えば、図7において、2010/02/01〜2010/02/28までしかデータが存在しない場合であっても、トレンド段階毎に3月、4月の表現数を予測することができる。このようにして予測したトレンド表現数に基づいて、各期間のトレンド段階を決定することにより、将来におけるトレンド段階を予測することができる。
また、最小二乗法だけでなく、ニューラルネットワーク等既知の予測法を採用することもできる。
以上のように、本発明のトレンド推移分析装置によれば、あるトピックについてのトレンドの状況や今後の推移予測を知ることで、より高度な企業の戦術・戦略策定あるいはマーケティング活動が可能になる。
(5.他の実施形態)
本実施形態においては、トレンド段階として、「黎明期」〜「安定期」までの、5つのトレンド段階を分析する場合について説明したが、その一部について該当期間を分析することもできる。すなわち、トレンド段階としては上記5つに限定されない。
上記実施形態においては、図1に示す機能を実現するために、CPU23を用い、ソフトウェアによってこれを実現している。しかし、その一部もしくは全てを、ロジック回路などのハードウェアによって実現してもよい。なお、プログラムの一部の処理を、オペレーティングシステム(OS)にさせるようにしてもよい。

Claims (7)

  1. 黎明期に用いられる黎明期特定キーワード、流行期に用いられる流行期特定キーワード、反動期に用いられる反動期特定キーワード、回復期に用いられる回復期特定キーワード、および安定期に用いられる安定期特定キーワードを、期特定ワードとして各期について1または2以上の記憶する期特定キーワード記憶手段、
    特定のテーマについての本文およびその作成時期データが対応づけられた文書データを記憶する文書データ記憶手段、
    前記各文書データから各本文に存在する前記期特定キーワードの出現頻度を求め、当該文書データの作成時期データと対応づける出現頻度演算手段、
    トレンド推移を判定するための期間を所定の単位期間に分割した各細分単位期間について、前記出現頻度を求めた黎明期特定キーワード、流行期特定キーワード、反動期特定キーワード、回復期特定キーワード、および安定期特定キーワードの出現頻度を各期毎に総計した各期頻度総計値を演算し、前記各細分単位期間について、もっとも頻度総計値が高い期を当該細分単位期間における期であると判定する判定手段、
    を備えたトレンド推移判定装置。
  2. 請求項1のトレンド推移判定装置において、
    前記判定手段が判定した細分単位期間における期に基づいて、前記各期の期間開始時期および期間終了時期を求め、各期を構成する期間の長さから、前記特定のテーマについて、判定された期よりも時期的に後の期が到来する時期を予測する予測手段、
    を備えたことを特徴とするトレンド推移判定装置。
  3. 請求項2のトレンド推移判定装置において、
    前記予測手段は、前記判定手段が判定した細分単位期間における期に基づいて、前記各期の平均期間値を求め、これを加算して、前記特定のテーマについて、判定された期よりも時期的に後の期が到来する時期を予測すること、
    を特徴とするトレンド推移判定装置。
  4. 請求項1〜3のいずれのトレンド推移判定装置において、
    前記期特定キーワードの出現頻度は、存在する文書数または期特定キーワードの出現数であること、
    を特徴とするトレンド推移判定装置。
  5. 請求項4のトレンド推移判定装置において、
    前記各期毎について、補正係数を記憶する補正係数記憶手段を備え、
    前記判定手段は、前記各期頻度総計値を前記補正係数で補正し、補正後の各期頻度総計値で、当該細分単位期間における期を判定すること、
    を特徴とするトレンド推移判定装置。
  6. 特定のテーマについてのトレンド推移を判定する装置であって、
    前記トレンド推移を構成する複数の期について、それぞれ用いられる期特定キーワードを各期について1または2以上の記憶する期特定キーワード記憶手段、
    特定のテーマについての本文およびその作成時期データが対応づけられた文書データを記憶する文書データ記憶手段、
    前記各文書データから各本文に存在する前記期特定キーワードの出現頻度を求め、当該文書データの作成時期データと対応づける出現頻度演算手段、
    トレンド推移を判定するための期間を所定の単位期間に分割した各細分単位期間について、前記出現頻度を求めた出現頻度を各期毎に総計した各期頻度総計値を演算し、前記各細分単位期間について、もっとも頻度総計値が高い期を当該細分単位期間における期であると判定する判定手段、
    を備えたトレンド推移判定装置。
  7. コンピュータを以下の手段として機能させるためのトレンド推移判定プログラム。
    特定のテーマについてのトレンド推移を判定する場合の前記トレンド推移を構成する複数の期について、それぞれ用いられる期特定キーワードを各期について1または2以上の記憶する期特定キーワード記憶手段、
    特定のテーマについての本文およびその作成時期データが対応づけられた文書データを記憶する文書データ記憶手段、
    前記各文書データから各本文に存在する前記期特定キーワードの出現頻度を求め、当該文書データの作成時期データと対応づける出現頻度演算手段、
    トレンド推移を判定するための期間を所定の単位期間に分割した各細分単位期間について、前記出現頻度を求めた出現頻度を各期毎に総計した各期頻度総計値を演算し、前記各細分単位期間について、もっとも頻度総計値が高い期を当該細分単位期間における期であると判定する判定手段。
JP2010178477A 2010-08-09 2010-08-09 トレンド推移判定装置またはその方法 Pending JP2012038135A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010178477A JP2012038135A (ja) 2010-08-09 2010-08-09 トレンド推移判定装置またはその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010178477A JP2012038135A (ja) 2010-08-09 2010-08-09 トレンド推移判定装置またはその方法

Publications (1)

Publication Number Publication Date
JP2012038135A true JP2012038135A (ja) 2012-02-23

Family

ID=45850064

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010178477A Pending JP2012038135A (ja) 2010-08-09 2010-08-09 トレンド推移判定装置またはその方法

Country Status (1)

Country Link
JP (1) JP2012038135A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5627820B1 (ja) * 2014-02-04 2014-11-19 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
WO2015118619A1 (ja) * 2014-02-04 2015-08-13 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
JP2015149057A (ja) * 2014-09-30 2015-08-20 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
US9208503B2 (en) 2012-05-30 2015-12-08 Rakuten, Inc. Information processing apparatus, information processing method, information processing program, and recording medium

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9208503B2 (en) 2012-05-30 2015-12-08 Rakuten, Inc. Information processing apparatus, information processing method, information processing program, and recording medium
JP5627820B1 (ja) * 2014-02-04 2014-11-19 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
WO2015118618A1 (ja) * 2014-02-04 2015-08-13 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
WO2015118619A1 (ja) * 2014-02-04 2015-08-13 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
JP2015149057A (ja) * 2014-09-30 2015-08-20 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム

Similar Documents

Publication Publication Date Title
US8862782B2 (en) Background synchronization
US9779356B2 (en) Method of machine learning classes of search queries
US20190258660A1 (en) System and method for summarizing a multimedia content item
US8122438B2 (en) Computer implemented method and system for accurate, efficient and adaptive calling context profiling
EP3356951B1 (en) Managing a database of patterns used to identify subsequences in logs
US8751497B2 (en) Multi-shot scheduling system
CN107688488B (zh) 一种基于元数据的任务调度的优化方法及装置
JP2010515996A5 (ja)
US10146872B2 (en) Method and system for predicting search results quality in vertical ranking
JP2012038135A (ja) トレンド推移判定装置またはその方法
KR102141083B1 (ko) 데이터베이스 시스템의 최적화 방법, 시스템, 전자장치 및 저장매체
WO2015185020A1 (en) Information category obtaining method and apparatus
JP2018530827A (ja) コンテンツ配信方法および装置
JP2000194745A (ja) トレンド評価装置及びトレンド評価方法
WO2018202127A1 (zh) 信息推送方法及装置、存储介质和电子装置
JP5787941B2 (ja) トリガクエリ取得装置、トリガクエリ取得方法、およびプログラム
US7877335B2 (en) System and method for learning a network of categories using prediction
US20160055203A1 (en) Method for record selection to avoid negatively impacting latency
US8949249B2 (en) Techniques to find percentiles in a distributed computing environment
CN104657397B (zh) 一种信息处理方法及终端
US9858551B2 (en) Ranking analysis results based on user perceived problems in a database system
US20180004846A1 (en) Explicit Behavioral Targeting of Search Users in the Search Context Based on Prior Online Behavior
JP2019160239A (ja) 解析装置、解析方法及びコンピュータープログラム
JP2020042607A (ja) 情報処理装置、サーバ、情報処理方法及び情報処理プログラム
JP2007323434A (ja) 話題度算出方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体