JP2012038135A

JP2012038135A - トレンド推移判定装置またはその方法

Info

Publication number: JP2012038135A
Application number: JP2010178477A
Authority: JP
Inventors: Takahiro Miura; 高広三浦; Mitsuo Hirotoshi; 光郎廣利; Zentoku Tomiyama; 全徳冨山
Original assignee: Hitachi Solutions Ltd
Current assignee: Hitachi Solutions Ltd
Priority date: 2010-08-09
Filing date: 2010-08-09
Publication date: 2012-02-23

Abstract

【課題】簡易にトレンド分析の判定結果を得る。
【解決手段】期特定キーワード記憶手段３はトレンド推移を構成する複数の期について、それぞれ用いられる期特定キーワードを各期について１または２以上の記憶する。出現頻度演算手段４は、文書データ記憶手段２に記憶された文書データから各本文に存在する期特定キーワードの出現頻度を求め、当該文書データの作成時期データと対応づける。判定手段５はトレンド推移を判定するための期間を所定の単位期間に分割した各細分単位期間について、前記出現頻度を求めた出現頻度を各期毎に総計した各期頻度総計値を演算し、前記各細分単位期間について、もっとも頻度総計値が高い期を当該細分単位期間における期であると判定する。報知手段７は判定結果を報知する。
【選択図】図１

Description

この発明は、トレンド推移判定装置に関し、特に、その分析手法に関する。

特許文献１には、トレンドを予測する対象のキーワードに関するポジティブあるいはネガティブな表現を抽出・集計し、ある閾値を以て流行状態であると判断するトレンド予測装置法が開示されている。

また、特許文献２には、グルメ、音楽、芸能等の特定分野に関するオピニオンリーダーについて、ポジティブまたはネガティブな評価の発信を流行の初期段階とし、分野外の情報提供者による情報発信を流行の拡大段階と判断する情報分析装置が開示されている。

特開２００６−２２７９６５号公報特開２０１０−０２０７３１号公報

しかし、上記特許文献１においては、対象キーワードに関するポジティブあるいはネガティブな評価のみを追跡しているので、細かなトレンドの動きを把握することはできないという問題があった。また、特許文献２においては、あらかじめ第１情報提供者の一覧を作成しておく必要があるという問題があった。

この発明は、上記の問題点を解決して、簡易にトレンド時期の判定ができるトレンド推移判定装置を提供することを目的とする。

(1)本発明にかかるトレンド推移判定装置は、Ａ）黎明期に用いられる黎明期特定キーワード、流行期に用いられる流行期特定キーワード、反動期に用いられる反動期特定キーワード、回復期に用いられる回復期特定キーワード、および安定期に用いられる安定期特定キーワードを、期特定ワードとして各期について１または２以上の記憶する期特定キーワード記憶手段、Ｂ）特定のテーマについての本文およびその作成時期データが対応づけられた文書データを記憶する文書データ記憶手段、Ｃ）前記各文書データから各本文に存在する前記期特定キーワードの出現頻度を求め、当該文書データの作成時期データと対応づける出現頻度演算手段、Ｄ）トレンド推移を判定するための期間を所定の単位期間に分割した各細分単位期間について、前記出現頻度を求めた黎明期特定キーワード、流行期特定キーワード、反動期特定キーワード、回復期特定キーワード、および安定期特定キーワードの出現頻度を各期毎に総計した各期頻度総計値を演算し、前記各細分単位期間について、もっとも頻度総計値が高い期を当該細分単位期間における期であると判定する判定手段を備えている。

したがって、簡易にトレンド時期の判定を可能とするトレンド推移判定装置を提供することができる。

(2)本発明にかかるトレンド推移判定装置においては、前記判定手段が判定した細分単位期間における期に基づいて、前記各期の期間開始時期および期間終了時期を求め、各期を構成する期間の長さから、前記特定のテーマについて、判定された期よりも時期的に後の期が到来する時期を予測する予測手段を備えている。

したがって、未到達のトレンド時期を簡易に予測することができる。

(3)本発明にかかるトレンド推移判定装置においては、前記予測手段は、前記判定手段が判定した細分単位期間における期に基づいて、前記各期の平均期間値を求め、これを加算して、前記特定のテーマについて、判定された期よりも時期的に後の期が到来する時期を予測する。

したがって、未到達のトレンド時期を平均値から予測することができる。

(4)本発明にかかるトレンド推移判定装置においては、前記期特定キーワードの出現頻度は、存在する文書数または期特定キーワードの出現数である。したがって、前記文書数または前記期特定キーワードの出現数に基づいて、トレンド推移を判定することができる。

(5)本発明にかかるトレンド推移判定装置においては、前記各期毎について、補正係数を記憶する補正係数記憶手段を備え、前記判定手段は、前記各期頻度総計値を前記補正係数で補正し、補正後の各期頻度総計値で、当該細分単位期間における期を判定する。したがって、各期頻度総計値を補正した値で、前記判定が可能となる。

(6)本発明にかかるトレンド推移判定装置は、1)前記トレンド推移を構成する複数の期について、それぞれ用いられる期特定キーワードを各期について１または２以上の記憶する期特定キーワード記憶手段、2)特定のテーマについての本文およびその作成時期データが対応づけられた文書データを記憶する文書データ記憶手段、3)前記各文書データから各本文に存在する前記期特定キーワードの出現頻度を求め、当該文書データの作成時期データと対応づける出現頻度演算手段、4)トレンド推移を判定するための期間を所定の単位期間に分割した各細分単位期間について、前記出現頻度を求めた出現頻度を各期毎に総計した各期頻度総計値を演算し、前記各細分単位期間について、もっとも頻度総計値が高い期を当該細分単位期間における期であると判定する判定手段を備えている。

本明細書において使用する用語について、説明する。「期特定キーワード」とは、いずれのトレンド段階であるのかを特定するキーワードであり、実施形態では、図３のトレンド表現辞書に記憶されたワードが該当する。「細分単位期間」とは、時間軸における分析単位であり、実施形態では、1月単位としたが、これに限定されない。「期頻度総計値」とは、図７に示す細分単位期間別のトレンド段階別の抽出数が該当する。さらに、補正係数で補正した後も含む。

トレンド推移分析装置１の機能ブロック図である。トレンド推移分析装置１を、ＣＰＵを用いて実現したハードウェア構成の一例を示す図である。トレンド表現辞書２６ｄの一例である。文書記憶部２６kのデータ構造を示す図である。メインプログラム２６mのフローチャートを示す図である。トレンド表現集計処理のフローチャートである。トレンド表現集計情報データベースのデータ構造を示す図である。トレンド推移情報データベースのデータ構造を示す図である。トレンド段階分析処理の詳細フローチャートである。トレンド予測処理の詳細フローチャートである。トレンド予測処理における途中結果である。トレンド予測処理における途中結果である。トレンド予測処理における結果データである。

以下、本発明における実施形態について、図面を参照して説明する。

（１. 機能ブロック図）
図１に、本発明の１実施形態にかかるトレンド推移分析装置１の機能ブロック図を示す。

トレンド推移判定装置１は、期特定キーワード記憶手段３、文書データ記憶手段２、出現頻度演算手段４、判定手段５、予測手段６および報知手段７を備えている。

期特定キーワード記憶手段３は、黎明期に用いられる黎明期特定キーワード、流行期に用いられる流行期特定キーワード、反動期に用いられる反動期特定キーワード、回復期に用いられる回復期特定キーワード、および安定期に用いられる安定期特定キーワードを、期特定ワードとして各期について１または２以上の記憶する。文書データ記憶手段２は、特定のテーマについての本文およびその作成時期データが対応づけられた文書データを記憶する。出現頻度演算手段４は、前記各文書データから各本文に存在する前記期特定キーワードの出現頻度を求め、当該文書データの作成時期データと対応づける。判定手段５は、トレンド推移を判定するための期間を所定の単位期間に分割した各細分単位期間について、前記出現頻度を求めた黎明期特定キーワード、流行期特定キーワード、反動期特定キーワード、回復期特定キーワード、および安定期特定キーワードの出現頻度を各期毎に総計した各期頻度総計値を演算し、前記各細分単位期間について、もっとも頻度総計値が高い期を当該細分単位期間における期であると判定する。予測手段６は、前記判定手段が判定した細分単位期間における期に基づいて、前記各期の平均期間値を求め、これを加算して、前記特定のテーマについて、判定された期よりも時期的に後の期が到来する時期を予測する。報知手段７は、判定手段５の判定結果、および予測手段６の予測結果を報知する。

これにより、簡易に判定結果および予測結果を取得することができる。

（２. ハードウェア構成）
図１に示すトレンド推移分析装置１のハードウェア構成について、図２を用いて説明する。同図は、トレンド推移分析装置１を、ＣＰＵを用いて構成したハードウェア構成の一例である。

トレンド推移分析装置１は、ＣＰＵ２３、メモリ２７、ハードディスク２６、モニタ３０、光学式ドライブ２５、入力デバイス２８（マウス２８ａ，キーボード２８ｂ）、通信部３１およびバスライン２９を備えている。ＣＰＵ２３は、ハードディスク２６に記憶された各プログラムにしたがいバスライン２９を介して、各部を制御する。

ハードディスク２６は、オペレーティングシステムプログラム２６ｏ（以下ＯＳと略す）、メインプログラム２６mが記憶されており、各種のデータが記憶される。本実施形態においては、オペレーティングシステムプログラム（ＯＳ）２６ｏとして、LINUX（登録商標または商標）を採用したが、これに限定されるものではない。

なお、上記各プログラムは、光学式ドライブ２５を介して、プログラムが記憶されたＣＤ−ＲＯＭ２５ａから読み出されてハードディスク２６にインストールされたものである。なお、ＣＤ−ＲＯＭ以外に、フレキシブルディスク（ＦＤ）、ＩＣカード等のプログラムをコンピュータ可読の記録媒体から、ハードディスクにインストールさせるようにしてもよい。さらに、通信回線を用いてダウンロードするようにしてもよい。

本実施形態においては、プログラムをＣＤ−ＲＯＭからハードディスク２６にインストールさせることにより、ＣＤ−ＲＯＭに記憶させたプログラムを間接的にコンピュータに実行させるようにしている。しかし、これに限定されることなく、ＣＤ−ＲＯＭに記憶させたプログラムを光学式ドライブ２５から直接的に実行するようにしてもよい。なお、コンピュータによって、実行可能なプログラムとしては、そのままインストールするだけで直接実行可能なものはもちろん、一旦他の形態等に変換が必要なもの（例えば、データ圧縮されているものを、解凍する等）、さらには、他のモジュール部分と組合して実行可能なものも含む。

ハードディスク２６に記憶される各種データのデータ構造について説明する。トレンド表現辞書２６dには、テーマに関係なく各トレンド段階において、よく用いられる期特定ワードを各トレンド段階について１または２以上、記憶する。本実施形態においては、黎明期（トレンド段階１）に用いられる黎明期特定キーワード、流行期（トレンド段階２）に用いられる流行期特定キーワード、反動期（トレンド段階３）に用いられる反動期特定キーワード、回復期（トレンド段階４）に用いられる回復期特定キーワード、および安定期（トレンド段階５）に用いられる安定期特定キーワードを、各トレンド段階について１または２以上、記憶している。たとえば、この場合、トレンド段階１の期特定ワードとして、「新しい」、「登場」が記憶されている。

文書情報データベース２６dはデータの集合体であり、図４に示すように、「文書ＩＤ」、「作成時期」、「本文」を有する。例えば文書ＩＤ「Ｄ００１」の文書は、作成時期が「２００９／１１／２２」、本文が「クラウドが全面特集で取り上げられて・・」であることを表している。

トレンド表現情報データベース２６Kは、後述するトレンド表現の集計処理結果が記憶される。トレンド推移情報データベース２６Sには、トレンド表現分析結果が記憶される。各々のデータ構造については後述する。

（３．トレンド表現分析処理)
メインプログラム２６mに基づくトレンド表現分析処理について、図５のフローチャートを用いて説明する。なお、以下の説明では、テーマ「ＸＸＸ」についてのトレンド分析をする場合とし、そのため、文書情報データベース２６dには、当該テーマに合致する文書を複数記憶している。かかるテーマに合致した文書の抽出処理について従来知られている手法を用いればよく、例えば、特定のキーワードによる類似度判断をすればよい。

ＣＰＵ２３はトレンド表現集計処理を行う（図５ステップＳ１）。トレンド表現集計処理の詳細フローチャートを図６に示す。

ＣＰＵ２３は、時間軸における分析単位を決定する（ステップＳ１１）。本実施形態においては、時間軸における分析単位を1月単位とした。具体的には、文書情報データベース２０５４に含まれる全文書情報の日時情報から、最古および最新の日時情報を取り出して、その間を１月単位で分割するようにした。本実施形態においては、最古が2009/9/1で、最新が2010/4/30であったので、これらを１月単位で分割して８つの分析単位を得た。なお、かかる分析単位についてはテーマに応じて長短変化させてもよい。また、最古および最新の日時情報から、これを所定数単位に分割して、分析単位を決定するようにしてもよい。

ＣＰＵ２３は、集計表を生成する（ステップＳ１２）。本実施形態においては、時間軸の分析単位を８個、トレンド段階の分析単位を５個としたので、５＊８＝４０の集計表が生成される。ＣＰＵ２３は、文書情報ＤＢの文書数だけ処理を繰り返す、繰り返しモードとする（ステップＳ１３）。ＣＰＵ２３は、文書情報ＤＢの本文を解析し、トレンド表現辞書に記憶された期特定ワードとのマッチング判断（類似度判断）をする(ステップＳ１４)。かかる類似度判断は、従来知られている手法を採用すればよい。ＣＰＵ２３、マッチング結果に基づき、各文書について、マッチングした期特定ワード毎に、属する期の値を１つ増やす(ステップＳ１５)。例えば、ある文書について、トレンド段階１のトレンド表現が１つあれば、トレンド段階１のカウント数が１つ増える。なお、文書の本文によっては、複数のトレンド段階のトレンド表現とマッチする場合も考えられる。この場合は、その分だけカウント数を増やす。

また、文章の本文中に、トレンド表現が繰り返される場合もある。本実施形態においては、文書数がいくつかあるかを集計するようにしたが、ワード数がいくつあるかを集計するようにしてもよい。例えば、１の文書内に、「移行」というトレンド表現が、数十回出てくる場合、そのぶんだけカウント数を増やすようにしてもよい。このように、ワード単位でトレンド表現をカウントすることにより、最終的に得られるトレンド曲線の波が激しくなる(流行期には高いピーク、反動期には急降下など)場合がある。この場合、流行の変化がより顕著になるという効果がある。

ＣＰＵ２３は、ステップＳ１４，ステップＳ１５の処理を文書情報データベースにおける文書数だけ繰り返す(ステップＳ１６)。これにより図７に示すような８つの期間について、各トレンド段階に属するトレンド表現数が記憶される。

ＣＰＵ２３はトレンド表現集計処理が終了すると、トレンド表現分析処理を行う（図５ステップＳ３）。トレンド表現分析処理の詳細フローチャートを図９に示す。

ＣＰＵ２３は、図６ステップＳ１１で取得した時間軸における分析単位ごとの期間を、トレンド表現集計情報ＤＢ２６kから取得する（ステップＳ２１）。本実施形態においては、既に説明したように、８つの期間（分析単位)が取得される。

ＣＰＵ２３は、ステップＳ２４〜ステップＳ２５までの処理を、ステップＳ２１で取得した期間の数X（この場合８つ）だけ繰り返すモードとする（ステップＳ２２、ステップＳ２６）。

ＣＰＵ２３は、１つめの期間（2009/9/1〜9/30）についてのトレンド段階を決定する（ステップＳ２４）。本実施形態においては、最大値を有するトレンド段階を決定するようにした。例えば、１つめの期間（2009/9/1〜9/30）については、トレンド段階１〜５について、それぞれ「１」「３２」「２８」「１」「３」であるので、トレンド段階２が当該期間におけるトレンド段階として決定される。

ＣＰＵ２３は結果をトレンド推移情報データベース２６Sに格納する（ステップＳ２５）。

ＣＰＵ２３は、ステップＳ２１で取得した期間の数だけ、ステップＳ２４，ステップＳ２５を繰り返す。これにより図８に示すようなトレンド表現分析結果が得られる。

これにより、テーマ「ＸＸＸ」については、2009年９月が「流行期」、2009年10月〜12月が「反動期」、2010年1月、2月が「回復期」、2010年3月、4月が「安定期」であると判断することができる。

本実施形態においては、2つめ以降の期間についても、各期間についての文書数でトレンド段階を決定するようにした。たとえば、２つめの期間（2009/10/1〜10/31）については、トレンド段階１〜５について、それぞれ「５」「１０」「７５」「１０」「２」によって、トレンド段階を決定した。しかしこれに限定されず、それまでの期間の累計によってトレンド段階を決定するようにしてもよい。この場合であれば、２つめの期間（2009/10/1〜10/31）のトレンド段階１〜５について、について、１つめの期間（2009/9/1〜9/30）の対応するトレンド段階１〜５の「１」「３２」「２８」「１」「３」をそれぞれ累積した「６」「４２」「８３」「１１」「５」によって、トレンド段階を決定してもよい。３つめ以降についても同様である。

また、辞書に記憶された登録数で、図５ステップＳ１で得られた集計結果を正規化するようにしてもよい。たとえば、「黎明期」が登録数１００語、「流行期」が登録数２００語、「反動期」が登録数２００語、「回復期」が登録数１００語、「安定期」が登録数１００語である場合、流行期および反動期について抽出したトレンド表現数を１／２とすればよい。

本実施形態においては、各分析単位において、その中でトレンド表現の数が一番多い段階を当該分析単位におけるトレンド段階であると判断している。ただし、これに限定されず、適切な重み付け係数をトレンド段階毎に記憶しておき、係数を乗算した値が一番大きいものを選択するようにしてもよい。特に、流行期および反動期の表現は他のトレンド段階と比較すると、トレンド表現数が頻出する傾向があり、逆に回復期、および安定期については、トレンド表現数が少なくなる傾向ある。

したがって、予めトレンド段階毎に重み係数を記憶しておき、これに基づいて、抽出したトレンド表現数を補正するようにすればよい。

（４．トレンド予測処理)
上記実施形態においては、既にデータが存在するトレンド段階を判断するようにしたが、まだ到達していない未来についてのトレンド段階を予測することもできる。図１０を用いて説明する。以下では、図３ステップＳ３までの処理が終了して、図１１に示すような１３の期間についてのトレンド段階判定結果が得られている場合について説明する。

ＣＰＵ２３は、全トレンド段階を抽出する(ステップＳ３１）。この場合、2008/09/01〜2009/09/30までの１３の期間について、トレンド段階「１」、「２」、「３」の３つのトレンド段階が取得される。ＣＰＵ２３は、取得したトレンド段階の数だけ、ステップＳ３３の処理を繰り返す。（ステップＳ３２、ステップＳ３４）。トレンド段階の個数Xだけ繰り返す。以下、繰り返しカウンタをxとして、初期値を１とする。この場合、Xは３となる。

ＣＰＵ２３は注目するトレンド段階該当期間を演算する(ステップＳ３３)。すなわち、トレンド推移情報データベース２６Ｓから、トレンド段階が「現在着目しているx番目のトレンド段階」であるレコードを、期間が古いものから順にソートして取り出し、その結果から、先頭レコードの期間の始点と末尾レコードの期間の終点との差分を演算し、これを当該トレンド段階における期間とする。例えば、この場合、x＝１であるので、トレンド推移情報データベースから、トレンド段階が「１」であるレコードを、期間が古いものから順にソートして取り出す。これにより図１２に示すようなデータが得られる。このうち、先頭レコードの期間の始点「2008/09/01」および末尾レコードの期間の終点「2009/01/31」の差分である「152日」を以って、トレンド段階「１」における該当期間とする。

ステップＳ３３の処理をX＝３まで繰り返すことにより図１３に示す各トレンド段階におけるトレンド段階該当期間が得られる。

ＣＰＵ２３は、取得した各トレンド段階該当期間から、次のトレンド段階の期間を予測する(ステップＳ３５)。本実施形態においては、トレンド推移情報データベース２６Ｓの末尾レコードにおける期間の終端の翌日、および、それにステップ９０２〜ステップ９０４で取得した全てのトレンド段階における全体の期間の平均値を加算したものを組み合わせた期間を予測値とした。図１３の例であれば、次のトレンド段階「４」は、トレンド推移情報データベース２６Ｓの末尾レコードの終端の翌日である「2009/10/01」を始点とし、それにトレンド段階における全体の期間の平均値 (152＋119＋121)/3≒130日を加算した「2010/02/08」を終点と予測できる。すなわち、現状ではまだ起こっていないトレンド段階「４」は「2009/10/01」に始まり「2010/02/08」に終わると予測することができる。

予測手法については、他のやりかたであってもよい。上記の例では、各トレンド段階該当期間は、ほぼ均等であるとしたが、５つのトレンド段階について、分野ごとに、一定の傾向があるのであれば、分野ごとにかかる補正をするようにしても良い。例えば、分野Ａに属するテーマについては、「流行期」と「反動期」が他の期に比べると、約０．８倍であるなどである。

また、トレンド段階毎に、将来のトレンド表現のカウント数を予測するようにしてもよい。具体的には、トレンド段階毎に、横軸に期間を縦軸にトレンド表現のカウント数を、図７に示すトレンド段階毎に求めて、得られた離散データにマッチする近似関数を最小二乗法等により、求めればよい。近似関数についてはｎ次の多項式とすればよい。本実施形態においては、２次の多項式としたが、これに限定されない。

かかる予測処理を全列について行うことにより、各トレンド段階について、未来の期間についての表現数を予測することができる。

例えば、図７において、2010/02/01〜2010/02/28までしかデータが存在しない場合であっても、トレンド段階毎に3月、4月の表現数を予測することができる。このようにして予測したトレンド表現数に基づいて、各期間のトレンド段階を決定することにより、将来におけるトレンド段階を予測することができる。

また、最小二乗法だけでなく、ニューラルネットワーク等既知の予測法を採用することもできる。

以上のように、本発明のトレンド推移分析装置によれば、あるトピックについてのトレンドの状況や今後の推移予測を知ることで、より高度な企業の戦術・戦略策定あるいはマーケティング活動が可能になる。

（５.他の実施形態）
本実施形態においては、トレンド段階として、「黎明期」〜「安定期」までの、５つのトレンド段階を分析する場合について説明したが、その一部について該当期間を分析することもできる。すなわち、トレンド段階としては上記５つに限定されない。

上記実施形態においては、図１に示す機能を実現するために、ＣＰＵ２３を用い、ソフトウェアによってこれを実現している。しかし、その一部もしくは全てを、ロジック回路などのハードウェアによって実現してもよい。なお、プログラムの一部の処理を、オペレーティングシステム（ＯＳ）にさせるようにしてもよい。

Claims

黎明期に用いられる黎明期特定キーワード、流行期に用いられる流行期特定キーワード、反動期に用いられる反動期特定キーワード、回復期に用いられる回復期特定キーワード、および安定期に用いられる安定期特定キーワードを、期特定ワードとして各期について１または２以上の記憶する期特定キーワード記憶手段、
特定のテーマについての本文およびその作成時期データが対応づけられた文書データを記憶する文書データ記憶手段、
前記各文書データから各本文に存在する前記期特定キーワードの出現頻度を求め、当該文書データの作成時期データと対応づける出現頻度演算手段、
トレンド推移を判定するための期間を所定の単位期間に分割した各細分単位期間について、前記出現頻度を求めた黎明期特定キーワード、流行期特定キーワード、反動期特定キーワード、回復期特定キーワード、および安定期特定キーワードの出現頻度を各期毎に総計した各期頻度総計値を演算し、前記各細分単位期間について、もっとも頻度総計値が高い期を当該細分単位期間における期であると判定する判定手段、
を備えたトレンド推移判定装置。
請求項１のトレンド推移判定装置において、
前記判定手段が判定した細分単位期間における期に基づいて、前記各期の期間開始時期および期間終了時期を求め、各期を構成する期間の長さから、前記特定のテーマについて、判定された期よりも時期的に後の期が到来する時期を予測する予測手段、
を備えたことを特徴とするトレンド推移判定装置。
請求項２のトレンド推移判定装置において、
前記予測手段は、前記判定手段が判定した細分単位期間における期に基づいて、前記各期の平均期間値を求め、これを加算して、前記特定のテーマについて、判定された期よりも時期的に後の期が到来する時期を予測すること、
を特徴とするトレンド推移判定装置。
請求項１〜３のいずれのトレンド推移判定装置において、
前記期特定キーワードの出現頻度は、存在する文書数または期特定キーワードの出現数であること、
を特徴とするトレンド推移判定装置。
請求項４のトレンド推移判定装置において、
前記各期毎について、補正係数を記憶する補正係数記憶手段を備え、
前記判定手段は、前記各期頻度総計値を前記補正係数で補正し、補正後の各期頻度総計値で、当該細分単位期間における期を判定すること、
を特徴とするトレンド推移判定装置。
特定のテーマについてのトレンド推移を判定する装置であって、
前記トレンド推移を構成する複数の期について、それぞれ用いられる期特定キーワードを各期について１または２以上の記憶する期特定キーワード記憶手段、
特定のテーマについての本文およびその作成時期データが対応づけられた文書データを記憶する文書データ記憶手段、
前記各文書データから各本文に存在する前記期特定キーワードの出現頻度を求め、当該文書データの作成時期データと対応づける出現頻度演算手段、
トレンド推移を判定するための期間を所定の単位期間に分割した各細分単位期間について、前記出現頻度を求めた出現頻度を各期毎に総計した各期頻度総計値を演算し、前記各細分単位期間について、もっとも頻度総計値が高い期を当該細分単位期間における期であると判定する判定手段、
を備えたトレンド推移判定装置。
コンピュータを以下の手段として機能させるためのトレンド推移判定プログラム。
特定のテーマについてのトレンド推移を判定する場合の前記トレンド推移を構成する複数の期について、それぞれ用いられる期特定キーワードを各期について１または２以上の記憶する期特定キーワード記憶手段、
特定のテーマについての本文およびその作成時期データが対応づけられた文書データを記憶する文書データ記憶手段、
前記各文書データから各本文に存在する前記期特定キーワードの出現頻度を求め、当該文書データの作成時期データと対応づける出現頻度演算手段、
トレンド推移を判定するための期間を所定の単位期間に分割した各細分単位期間について、前記出現頻度を求めた出現頻度を各期毎に総計した各期頻度総計値を演算し、前記各細分単位期間について、もっとも頻度総計値が高い期を当該細分単位期間における期であると判定する判定手段。