以下、添付した図面を参照して本発明の好ましい実施形態について詳細に説明する。本発明の利点及び特徴、これらを達成する方法は添付する図面と共に詳細に後述する実施形態を参照すると明確になるであろう。しかし、本発明は、以下で開示する実施形態に限定されるものではなく、互いに異なる多様な形態で実現されるものであり、本実施形態は、単に本発明の開示を完全にし、本発明が属する技術分野で通常の知識を有する者に発明の範疇を完全に知らせるために提供されるものであり、本発明は、請求項の範囲によってのみ定義される。明細書全体にかけて同一参照符号は同一構成要素を指称する。
他に定義されなければ、本明細書で使用されるすべての用語(技術及び科学的用語を含む)は、本発明が属する技術分野で通常の知識を有する者に共通に理解できる意味で使用される。また一般的に使用される辞書に定義されている用語は特別に定義して明らかにしない限り理想的にまたは過度に解釈されない本明細書で使用された用語は実施形態を説明するためであり、本発明を制限しようとするものではない。本明細書で、単数型は特別に言及しない限り複数型も含む。
図1は本発明のいくつかの実施形態で参照されるキーワードと資産価格との関連性を説明する概念図である。ブロッグ、インターネットニュース、メッセンジャー、SNSなど多様なインターネット上のウェブページを介してテキストが流通される。各テキストのコンテンツは多様なイシューを含む。このようなイシューは多様な種類の資産価値に影響を及ぼし得る。
図1を参照すると、例えば、テキスト1が株式情報ブロッグの掲示物である場合、テキストコンテンツは株式情報を含み得る。テキストコンテンツに含まれたイシュー1がA企業に対する株式展望である場合、イシュー1は前記特定企業の株式価値に影響を及ぼし得る。また、テキスト2がインターネットニュースのウェブページ上のテキストであり、テキストコンテンツが国内の不動産市場展望をイシューとして含む場合を仮定する。イシュー2がB地域の不動産相場に対する情報である場合、イシュー2は不動産相場に影響を及ぼし得る。
このときイシューはインターネット上で前記イシューを示すキーワード形式で流通される。前記例において、イシュー1は「A」、「A企業」、「A企業の株価」などのようなキーワードで表現される。また、イシュー2は「B」、「B不動産」、「B相場」などのようにキーワードで表現される。説明したテキストコンテンツ及びキーワードを参照して以下、本発明の一実施形態によるキーワードと資産価格との関連性評価システムの構成及び動作について具体的に説明する。
図2は本発明の一実施形態によるキーワードと資産価格との関連性評価システムの例示である。説明の便宜上、前記キーワードと資産価格との関連性評価システムはシステムと称する。図2を参照すると、システムはサービスサーバ100、ユーザ端末200及び外部装置300を含み得る。
ここでサービスサーバ100、ユーザ端末200及び外部装置300は互いにインターネットを介して連結されるコンピュータ装置である。サービスサーバ100は各種情報を保存し、本発明の実施形態を実現するための一つ以上のプログラムを保存するサーバ装置であり得る。ユーザ端末200サーバ装置、デスクトップPCのような固定式コンピュータ装置、ノートブック、スマートフォン、タブレットPCのようなモバイルコンピューティング装置のうちいずれか一つであり得る。また、外部装置300はインターネット上のテキストコンテンツが保存されたサーバ装置であり得る。また、外部装置300は資産及び資産に対する価格情報が保存されたサーバ装置であり得る。例えば、外部装置300は証券相場情報を提供する証券取引所の証券情報サーバであり得る。
本発明の一実施形態によるシステムにおいて、サービスサーバ100はインターネットを介して外部装置300から第1日付に掲示されたテキストコンテンツを収集し得る。このために、サービスサーバ100は自動でウェブページを探索するウェブクローラ(Web Crawler)を保存し得る。例えば、第1日付はサービスサーバ100がクローリングを遂行する当日の日付であり得る。この場合、サービスサーバ100は当日を基準に予め設定した時間までインターネット上に掲示されているテキストコンテンツを収集する。
サービスサーバ100はウェブクローラのクローリングにより収集されたテキストコンテンツそれぞれからキーワードを抽出する。ここでキーワード抽出のために多様なアルゴリズムが利用され得る。サービスサーバ100はキーワード抽出に利用されるアルゴリズムのためのプログラムを少なくとも一つ保存し得る。例えば、サービスサーバ100はLDA(Latent Dirichlet Allocation)アルゴリズムを利用し得る。サービスサーバ100はLDAアルゴリズムを利用してテキストコンテンツの主題を決定し、主題と関連性の高いキーワードを抽出し得る。
収集したテキストコンテンツそれぞれからキーワードが抽出されると、サービスサーバ100は多様な出処から抽出されたキーワードを組み合わせる。サービスサーバ100はこれにより抽出されたキーワードを含む第1日付のキーワードプールを構成する。サービスサーバ100は同じ方式で第2日付のキーワードプールを構成する。ここで、第2日付は第1日と異なる日付を意味し、第1日付から予め設定した範囲内の属する近い日付であり得る。
サービスサーバ100は第1日付のキーワードプールと第2日付のキーワードプールの比較結果を利用して第1日付の日間キーワードを生成する。
サービスサーバ100は生成された日間キーワードをユーザ端末200に提供する。また、サービスサーバ100は複数のユーザ端末200それぞれに日間キーワードを利用した多様なサービスを提供し得る。例えば、サービスサーバ100は複数のユーザ端末200に日間キーワードを利用した資産の投資ガイドサービスを提供し得る。
本発明の他の実施形態によれば、サービスサーバ100は外部装置300からインターネットを介して収集したテキストコンテンツから第1日付の日間キーワードを生成する。また、サービスサーバ100は第1日付の日間キーワードに属する各キーワードに対する日付別露出頻度情報を生成し得る。
サービスサーバ100は生成された各キーワードに対する日付別露出頻度情報と予め登録された資産の日付別価格情報を比較する。これにより、サービスサーバ100は予め登録された資産のうち各キーワードに対応する資産を決定する。
サービスサーバ100は第1日付の日間キーワード及び前記各キーワードに対応する資産に対する情報をユーザ端末200に送信する。
図3は本発明の他の実施形態によるサービスサーバ100のブロック図である。
図3を参照すると、サービスサーバ100はプロセッサ101、ネットワークインターフェース102、メモリ103、ストレージ104を含んで構成され得る。
プロセッサ101はサービスサーバ100の各構成の全般的な動作を制御する。プロセッサ101はCPU(Central Processing Unit)、MPU(Micro Processor Unit)、MCU(Micro Controller Unit)、または本発明の技術分野によく知られている任意の形態のプロセッサを含んで構成され得る。また、プロセッサ101は本発明の実施形態による方法を実行するための少なくとも一つのアプリケーションまたはプログラムに対する演算を遂行することができる。サービスサーバ100は一つ以上のプロセッサを備え得る。
ネットワークインターフェース102はサービスサーバ100の有無線インターネット通信をサポートする。また、ネットワークインターフェース102はインターネット通信以外の多様な通信方式をサポートすることもできる。このため、ネットワークインターフェース102は各種通信モジュールを含んで構成され得る。
ネットワークインターフェース102はインターネットを介して外部装置300からテキストコンテンツを収集する。また、ネットワークインターフェース102はキーワード及び資産に対する情報をユーザ端末200と送受信し得る。
メモリ103は各種データ、命令及び/または情報を保存する。またメモリ103は本発明の実施形態によるテキストコンテンツを利用した日間キーワード自動生成方法及びキーワードと資産価格との関連性評価方法を遂行するためにストレージ104から一つ以上のプログラム105をロードするための一つ以上のプログラムを保存し得る。図3ではメモリ103の例示としてRAMを示した。
ストレージ104は外部装置300から受信されたデータなどを非臨時的に保存できる。ストレージ140はROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、フラッシュメモリなどのような非揮発性メモリ、ハードディスク、着脱型ディスク、または本発明が属する技術分野でよく知られている任意の形態のコンピュータで読み取りできる記録媒体を含んで構成され得る。
ストレージ104は本発明の実施形態による方法を遂行するための一つ以上のプログラム105を保存し得る。図3ではプログラム105の例示として資産管理ソフトウェアを示した。
ストレージ104にはキーワードプール及び日間キーワードに対するデータベース106がインストールされ得る。また、ストレージ104に予め登録された資産及び各キーワードに対応する資産に対するデータベース107がインストールされ得る。
図面に示していないが、サービスサーバ100は前記構成の他に各種設定及び情報の入力を受けるための入力部及び情報をディスプレイするための出力部を含んで構成され得る。前記入力部及び出力部はそれぞれ本発明が属する技術分野でよく知られている任意の形態の入力手段及び出力手段を含んで構成され得る。
本明細書でサービスサーバ100はキーワードと資産価格との関連性評価方法を遂行することからキーワードと資産価格との関連性評価装置という。また、サービスサーバ100はテキストコンテンツを利用した日間キーワード自動生成方法を遂行することから日間キーワード自動生成装置とも言う。または、サービスサーバ100は単に装置と略称する場合もある。
以下、本発明の実施形態による方法はサービスサーバ100により遂行されると仮定する。
以下、前述した図1ないし図3の説明に基づいて本発明の他の実施形態についてサービスサーバ100の遂行する方法によって区分して説明する。以下で区分して説明する実施形態は別途実施しなければならないものでなく、互いに結合して実施することができる。また、以下で説明する実施形態は図1ないし図3に対する説明で前述した本発明の実施形態とも結合して実施され得ることに留意しなければならない。
テキストコンテンツを利用した日間キーワード自動生成方法
本発明の一実施形態によれば、日間キーワード自動生成装置100はテキストコンテンツを利用した日間キーワード自動生成方法を実行する。以下、図4ないし図12を参照してテキストコンテンツを利用した日間キーワード自動生成方法について詳細に説明する。
図4は本発明の実施形態によるテキストコンテンツを利用したキーワード自動生成方法の順序図である。図4を参照すると、装置100は第1日付のテキストコンテンツをインターネットを介して収集する(S10)。装置100は前記テキストコンテンツそれぞれからキーワードを抽出し、抽出されたキーワードを含む第1日付のキーワードプールを構成する(S20)。前記テキストコンテンツの収集及びキーワード抽出方式は図2の説明を参照する。装置100は第1日付の日間キーワード生成のために、第1日付の予め設定した基準時間まで収集したテキストコンテンツを利用することもできる。
図5は本発明のいくつかの実施形態で参照されるキーワードプールの例示である。また、図6は本発明のいくつかの実施形態で参照される日間キーワードを説明するための例示図である。
図5を参照すると、装置100は日付D1に掲示されたテキストコンテンツからキーワードを抽出し、キーワードプール501を構成する。また、装置100は日付D2、D3に掲示されたテキストコンテンツからキーワードを抽出し、それぞれキーワードプール502及びキーワードプール503を構成し得る。前記キーワードプールには予め設定された個数のキーワードが含まれ得る。また、キーワードプールは抽出された個数が多いキーワード順に羅列したリスト形式であり得る。前記キーワードプールは装置100のストレージ104に保存される。
装置100は第1日付のキーワードプールと第2日付のキーワードプールを比較する(S30)。前記例において装置100は、キーワードプール501、キーワードプール502、キーワードプール503をそれぞれ比較する。装置100は前記比較結果を利用して第1日付の日間キーワードを生成する(S40)。
ここで日間キーワードは当日収集したテキストコンテンツのうち他の日付と差別化される露出頻度を示すキーワードである。すなわち、第1日付の日間キーワードは第1日付を他の日付と区分するキーワードを意味する。例えば第1日付に特別のイシューが発生し、該当イシューに対するインターネット上で検索が急増する場合、これに対するメンションがウェブページ上に多数露出される場合、装置100が収集したテキストコンテンツには前記イシューを示すキーワードが多数含まれ得る。これにより、装置100は前記イシューを示すキーワードを含むキーワードプールを構成し得る。装置100はキーワードプールから高い割合で存在するキーワードを第1日付の日間キーワードとして生成することができる。
キーワード1KW1がテキストコンテンツ上で時系列的に露出する頻度を示すグラフ600を図6に示した。キーワード1KW1は図5のキーワードプールに含まれている「北朝鮮の核実験」と仮定する。また、日付D2が図6に示すt1であると仮定する。
図5及び図6を参照すると、キーワード1KW1は他の日付に比べて日付D2に高い露出頻度を示す。図5において日付D1のキーワード1KW1の露出頻度は17位であり、日付D2で露出頻度は1位であり、日付D3では25位である。すなわち、「北朝鮮の核実験」というキーワードは日付D2を日付D1及び日付D3と差別化させるキーワードに該当する。
S30段階で装置100は第1日付のキーワードプールに属したキーワードの露出頻度と第2日付のキーワードプールに属したキーワードの露出頻度を比較する。特に、装置100は露出頻度の差が臨界値以上であるキーワードを第1日付の日間キーワードとして決定する。前記キーワードプール501で17位に該当するキーワード1KW1の露出頻度は図6のb1であると仮定する。また、図6の露出頻度a0と露出頻度b1との差を前記臨界値であると仮定する。
図6を参照すると、日付D2でキーワード1KW1の露出頻度はa1である。このとき、a1とb1の差は臨界値であるa0とb1との差より大きい値を有する。これにより、装置100はキーワード1KW1を日付D2の日間キーワードとして決定し得る。
前記日間キーワードの正確性を確保するために、S30段階で第1日付と第2日付のキーワードプールを比較する方法の他に多様な実施形態が利用され得る。
例えば、装置100はS30段階で構成された第1日付のキーワードプールに属するそれぞれのキーワードに対する特定日付区間のあいだの露出頻度を判断し得る。このため、装置100は第1日付を基準に第1時間ウィンドウを決定する。すなわち、装置100は第1日付に収集したテキストコンテンツから構成されたキーワードプールを第1時間ウィンドウ内の時間のあいだ収集したテキストコンテンツから構成されたキーワードプールと比較する。ここで第1時間ウィンドウは前記第2日付を含む複数の日付区間であり得る。
図7は本発明のいくつかの実施形態で参照される日間キーワード上の第1時間ウィンドウを説明するための例示図である。図7において第1日付はt1であると仮定する。
図7を参照すると、グラフ710で装置100はt1を基準にt1以前の日付を含む区間を第1時間ウィンドウ711として決定する。またはグラフ720に示すように、装置100はt1を基準にt1を含む日付区間を第1時間ウィンドウ721として決定し得る。前記第1時間ウィンドウ(711、721)の大きさは装置100のユーザまたは製造者により決定され得る。
グラフ710を参照すると、装置100はキーワードプールに属したキーワード1KW1に対する第1時間ウィンドウ711内の日付別露出頻度を測定する。すなわち、装置100は第1時間ウィンドウ711内の日付のキーワードプールを比較すると、繰り返して登場するキーワードの露出頻度を測定することができる。装置100はt1とt2での露出頻度の差が臨界値以上である場合、キーワード1KW1をt1の日間キーワードとして決定する。反面、t0とt2での露出頻度の差が臨界値未満である場合、装置100はキーワード1KW1がt2の日間キーワードではないと判断する。
グラフ720を参照すると、装置100はキーワード1KW1に対する第1時間ウィンドウ721内の日付別露出頻度を測定する。装置100はt2及びt3のキーワード1KW1の露出頻度をそれぞれt1での露出頻度と比較する。比較結果、露出頻度の差が臨界値以上である場合、装置100はキーワード1KW1をt1の日間キーワードとして決定する。
本発明の他の実施形態によれば、装置100は前述したキーワード1KW1の露出頻度を考慮せず、日間キーワードを決定することができる。
例えば、第1日付のキーワードプールが新規キーワードを含む場合を仮定する。ここで、新規キーワードは、第1時間ウィンドウに属する少なくとも一つの他の日付の日間キーワードプールに含まれないキーワードを含み得る。または新規キーワードは第1時間ウィンドウ内に極めて少ない回数で掲示されたキーワードを含み得る。
装置100は第1日付のキーワードプールに新規キーワードが存在するかを判断する。また、装置100は前記キーワードが第1日付に基準値以上の回数で掲示されたかを判断することもできる。
前記判断結果、基準値以上掲示された新規キーワードが存在すると、装置100は新規キーワードを含む前記第1日付の日間キーワードを生成する。これにより、他の日付に掲示されたことのない新規キーワードに対しては、装置100が第1日付のキーワードプールと異なる日付のキーワードプールを比較する過程を行う必要がない。
装置100は前述した過程をキーワードプールに属するそれぞれのキーワードに対して行い、第1日付の日間キーワードを生成する。すなわち、第1日付の日間キーワードは一つ以上の日間キーワードを含み得る。
図8は本発明のいくつかの実施形態で参照される日間キーワード上の第2時間ウィンドウを説明するための例示図である。図8において第1日付はt1であると仮定する。
装置100は第1日付を基準にキーワード1KW1の露出頻度判断のため、第1時間ウィンドウだけでなく第2時間ウィンドウを決定し得る。第2時間ウィンドウは第1時間ウィンドウより多くの日付を含む日付区間であり得る。
装置100はt1を基準にt1以前の日付区間を第1及び第2時間ウィンドウとして決定する。グラフ810において、第1時間ウィンドウ711はt1からt0までの日付区間であり、第2時間ウィンドウ811はt1からt4までの日付区間である場合を例示した。
または、装置100はt1を基準にt1を含む日付区間を第1及び第2時間ウィンドウ721として決定し得る。グラフ820において、第1時間ウィンドウ721はt1を含むt2とt3とのあいだの日付区間であり、第2時間ウィンドウ821はt1を含むt5とt6とのあいだの日付区間の場合を例示した。
装置100は前記第2時間ウィンドウ(811、821)のあいだ収集したテキストコンテンツ上のキーワード1KW1の掲示回数と第1時間ウィンドウ(711、721)内のキーワード1KW1の掲示回数を判断する。また、装置100は前記掲示回数のあいだの比率を演算し得る。装置100は前記演算結果を基準に第1日付のキーワードプールに含まれた各キーワードに対し、除去するかどうかを決定する。
装置100は第2時間ウィンドウのあいだキーワード1KW1の掲示回数と第1ウィンドウのあいだキーワード1KW1の掲示回数比率が臨界値以上である場合、キーワード1KW1を前記キーワードプールに残存させ、臨界値未満である場合、キーワード1KW1を前記キーワードプールから除去する。
前記臨界値が0.7であると仮定する。例えば、第2時間ウィンドウのあいだキーワード1KW1は100回掲示され、第1時間ウィンドウのあいだキーワード1KW1は80回掲示された場合について説明する。この場合、掲示回数の比率は0.8になる。前記比率0.8は0.7以上であるため、装置100はキーワード1KW1を前記キーワードプールに残存させる。ここで、キーワード1KW1は第1時間ウィンドウのあいだ集中的に掲示されたキーワードであることが分かる。
他の例として、第2時間ウィンドウのあいだキーワード1KW1は100回掲示され、第1時間ウィンドウのあいだキーワード1KW1は20回掲示された場合について説明する。この場合、掲示回数の比率は0.2である。比率0.2は0.7未満であるため、装置100はキーワード1KW1をキーワードプールから除去する。ここでキーワード1KW1は第1ウィンドウ区間より第1ウィンドウ以外の時間区間のあいだより多く掲示されたことが分かる。
上記では主に第1時間ウィンドウ及び第2時間ウィンドウが日付区間である場合について説明した。本発明の他の実施形態によれば、前記第1時間ウィンドウ及び第2時間ウィンドウは日付区間でなく時間区間であり得る。この場合、S10段階ないしS20段階で装置100が第1日付の予め設定した基準時間まで収集したテキストコンテンツからキーワードプールを構成すると仮定する。
例えば、図1のシステムでユーザ端末200が午後2時にサービスサーバ100に接続した場合、サービスサーバである装置100は、前記接続時間を基準に日間キーワードを生成する。このとき、装置100は第1時間ウィンドウを第1日付の前記接続時間2時間前までの時間区間として決定し得る。この場合、装置100は接続時間2時間前まで収集したテキストコンテンツから構成されたキーワードプールと接続時間を基準に構成されたキーワードプールを比較する。
前述した第1時間ウィンドウ及び第2時間ウィンドウのサイズは装置100のユーザまたは製造者により決定され得る。または、前記第1時間ウィンドウ及び第2時間ウィンドウのサイズは装置100から本発明の実施形態によるサービスの提供を受けるユーザ端末200のユーザ設定により調節され得る。これにより、ユーザ端末200のユーザの設定によって第1日付の日間キーワードは異なる。これのため、装置100はユーザ端末200に前記第1時間ウィンドウ及び第2時間ウィンドウのサイズを調節するためのユーザインターフェースを提供し得る。
図9は第1時間ウィンドウを利用したキーワードの抽出過程の例示であり、図10は第1時間ウィンドウ及び第2時間ウィンドウを利用したキーワードの抽出過程の例示である。前記第1時間ウィンドウと第2時間ウィンドウの効果について図9及び図10を参照して詳細に説明する。図9及び図10で第1時間ウィンドウは第1日付を含む日付区間であると仮定する。
図9を参照すると、第1日付が日付D7である場合、装置100は第1日付のキーワードプール901を構成する。キーワードプール901は例えば、「FTA発効」、「プロ野球」、「半導体新技術」などのキーワードを露出頻度順に含み得る。また、キーワードプール901は露出頻度が少ない「代替休日」をキーワードとして含み得る。
一方、日付D8のキーワードプール902は「プロ野球」、「代替休日」などのキーワードを露出頻度順に含み得る。また、キーワードプール902は露出頻度が少ない「FTA発効」をキーワードとして含み得る。
装置100は第1時間ウィンドウに属する日付D8のキーワードプール902と日付D7のキーワードプール901を比較する。図9を参照すると、「FTA発効」キーワードは日付D7では露出頻度が非常に高い反面、日付D8での露出頻度は非常に低い。この場合、装置100は前記露出頻度を比較して、「FTA発効」キーワードを日付D7のキーワードプール901に残存させる。また、装置100は前記露出頻度の差が臨界値以上である場合、「FTA発効」キーワードを日付D7の日間キーワード910として決定し得る。同様方式により装置100は「半導体新技術」キーワードを日付D7の日間キーワード910として決定し得る。
反面、「プロ野球」キーワードの場合、日付D7及び日付D8の露出頻度の差が大きくない。したがって、装置100は「プロ野球」キーワードを日付D7のキーワードプール901から除去することにより、「プロ野球」キーワードを日付D7の日間キーワードに含まなくてもよい。
第1日が日付D8である場合、装置100は第1日付のキーワードプール902を構成する。装置100は第1時間ウィンドウに属する日付D7のキーワードプール9021と日付D8のキーワードプール902を比較する。図9を参照すると、「代替休日」キーワードは日付D8での露出頻度が非常に高い反面、日付D7での露出頻度は低い。この場合、装置100は前記露出頻度を比較して、「代替休日」キーワードを日付D8のキーワードプール902に残存させる。また、装置100は前記露出頻度の差が臨界値以上である場合、「代替休日」キーワードを日付D8の日間キーワード910として決定し得る。反面、「プロ野球」キーワードの場合、日付D8及び日付D7の露出頻度の差が大きくない。 したがって、装置100は「プロ野球」キーワードを日付D8のキーワードプール902から除去することにより、「プロ野球」キーワードを日付D8の日間キーワードに含まなくてもよい。
前記例では第1日付である日付D7と第1時間ウィンドウに属する日付D8のキーワードプールのみを比較したが、装置100は第1時間ウィンドウに属する複数の日付のキーワードプールと第1日付のキーワードプールを比較することもできる。
装置100は図9の説明で参照した第1時間ウィンドウを含む第2時間ウィンドウを決定する。図10では第2時間ウィンドウが日付D2と日付D12を含む日付区間として決定された場合を仮定する。
第1日が日付D7である場合、装置100は日付D2のキーワードプール1001、日付D8のキーワードプール902及びD12のキーワードプール1002を含む複数のキーワードプールと日付D7のキーワードプール901を比較する。
装置100は「FTA発効」キーワード及び「半導体新技術」キーワードが日付D7及び日付D8を含む第1時間ウィンドウのあいだ掲示された回数を判断する。また、装置100は「FTA発効」キーワード及び「半導体新技術」キーワードが第1時間ウィンドウを除いた第2時間ウィンドウのあいだ掲示された回数を判断し得る。図10を参照すると、「FTA発効」キーワード及び「半導体新技術」キーワードは全体第2時間ウィンドウでいずれも多くの回数で掲示された。装置100は掲示回数比率を判断し、「FTA発効」キーワード及び「半導体新技術」キーワードを日付D7のキーワードプール901から除去する。これにより、日付D7の日間キーワード1010は「FTA発効」キーワード及び「半導体新技術」キーワードを含まなくてもよい。
反面、「プロ野球」キーワードの場合、日付D7及び日付D8を含む第1時間ウィンドウのあいだには多くの回数で掲示されたが、他の日付では少ない回数で掲示されたりキーワードプールに含まれなかった。したがって、装置100は掲示回数の比率を判断し、「プロ野球」キーワードを日付D8のキーワードプール902に残存させる。これにより、日間キーワード1010は「プロ野球」キーワードを含み得る。
第1日付が日付D8である場合も、前記例と類似の結果が導き出される。すなわち、日間キーワード1010を参照すると、互いに異なる日付の日間キーワードは同一のキーワードを含み得る。また、連続した日付の日間キーワードが同一のキーワードを含み得る。例えば、特定のイシューが相当期間のあいだ継続して社会全般に影響を及ぼす場合がある。この場合、装置100は第2時間ウィンドウを利用して互いに異なる日付でも同一のキーワードを抽出し得る。
図9及び図10を参照すると、同一の日付(D7、D8)に同一のキーワードプール(901、902)が構成されたとしても、装置100は第2時間ウィンドウを利用して互いに異なる日間キーワード(910、1010)を生成する。
図11は本発明の本発明のいくつかの実施形態で参照される出処による日間キーワードの優先順位を説明するための例示図である。装置100は第1日付に収集されるテキストコンテンツの出処を識別する。装置100は第1日付の日間キーワードを含むテキストコンテンツの出処のみを識別し得る。
これにより、装置100は識別された出処に基づいて前記第1日付の日間キーワードに属するキーワードの優先順位を決定する。装置100は具体的に識別された出処の属性に応じて前記優先順位を決定する。ここで出処の属性は、出処の提供者の性格、出処のメディアの種類、出処のチャネルの種類などに応じて決定され得る。例えば出処の提供者の性格は出処が公共機関であるか、私設機関であるか、個人であるかに対する情報であり得る。出処のメディアの種類は出処が経済メディアであるか、スポーツメディアであるかなどに対する情報であり得る。また、出処のチャネルの種類は出処がインターネットニュースであるか、ブロッグであるか、SNSなであるかなどに対する情報であり得る。また、前記出処の属性は前述したキーワード抽出アルゴリズムにより識別されたテキストコンテンツの内容に基づいて決定され得る。
また、装置100は同一出処の互いに異なるセクションを互いに異なる出処として識別し得る。例えば、装置100はA新聞社が提供するインターネットニュース上の芸能ニュースセクションと政治ニュースセクションを互いに異なる出処として識別する。
装置100は前記属性に応じてキーワードに互いに異なる加重値を付与する。図11を参照すると、S30段階で生成された日間キーワードに対して装置100は前記出処及び出処の属性による加重値情報を含む日間キーワード情報1100を保存する。前記キーワード情報1100に基づいて装置100はキーワードの優先順位情報1110を生成する。
キーワード情報1100を参照すると、例えば、加重値Aの加重値は1であり、加重値Bの加重値は0.5であり、加重値Cの加重値は0.3であると仮定する。このとき、キーワード2KW2は(25*1)+(20*0.5)=35の優先順位点数を有する。キーワード1KW1は掲示回数34を優先順位点数として有する。また、キーワード3KW3は50*0.3=15の優先順位点数を有する。
これにより、装置100は優先順位情報1110を生成する。優先順位1110を参照すると、装置100は優先順位点数が最も高いキーワード2KW2の優先順位を最も高く決定する。
一方、互いに異なる出処から得られたキーワードは同一のキーワードでも資産の価格に及ぼす影響が違うこともある。したがって、装置100が互いに異なる出処から得られた同一のキーワードを互いに異なるキーワードとして識別する必要がある。
本発明の他の実施形態によれば、装置100は第1日付の日間キーワードのうち一つのキーワードが互いに異なる出処を有するキーワードである場合、同一のキーワードでも互いに異なるキーワードとして認識し得る。図11を参照すると、装置100はキーワード2KW2の出処が「佳山日報」及び「佳山スポーツ」で互いに異なるものとして識別する。また、出処のメディアの種類が異なるため、装置100は前記出処の属性が異なると判断する。前記例において、装置100は前記互いに異なる出処それぞれの属性に応じて「佳山日報」のキーワード2KW2と「佳山スポーツ」のキーワード2KW2を互いに異なるキーワードとして決定する。
これにより、同音異義語が同時に第1日付の日間キーワードとして生成された場合も、装置100は前記同音異義語を互いに異なるキーワードとして識別し得る。
本発明のいくつかの実施形態で、各キーワードとのマッチングが試みられる資産は、そのキーワードの出処と事前にマッチングした資産に限定される。例えば、芸能と関連した出処(例えば、インターネット新聞の芸能面)は、エンターテイメント関連株式と事前にマッチングし得る。このとき、芸能と関連した出処を有するキーワードはエンターテイメント関連株式との相関関係が存在するかどうかのみを判断すればよい。
図12は本発明のいくつかの実施形態で参照されるキーワードにマッチングする資産を説明するための例示図である。前述したように、装置100は第1日付の日間キーワードを含むテキストコンテンツの出処を識別する。また、装置100は前述したテキストコンテンツの出処に応じて日間キーワードに対応する資産をマッチングさせる。
図12で第1日付の日間キーワードに属するキーワードの例示として、キーワード1KW1(1201)、キーワード2KW2(1202)及びキーワード3KW3(1203)を示した。
キーワード1KW1(1201)が含まれたテキストコンテンツの出処はIT株式種目の相場を展望するブロッグである場合を仮定する。この場合、装置100はキーワード1KW1(1201)を資産1210にマッチングさせる。資産1210は各企業の証券であり得、または特定カテゴリに属する株式種目であり得る。
キーワード2KW2(1202)が含まれたテキストコンテンツの出処は新車試乗記が記載されたインターネットマガジンである場合を仮定する。この場合、装置100はキーワード2KW2(1202)を資産1220にマッチングさせる。資産1220は自動車企業の証券であり得る。また、キーワード3KW3(1203)が含まれたテキストコンテンツの出処は不動産関連インターネットカフェである場合を仮定する。この場合、装置100はキーワード3KW3(1203)を資産1230にマッチングさせる。資産1230は特定地域の再建築分譲権であり得る。
ここまでは本発明の実施形態のうち日間キーワード自動生成装置100により行われるテキストコンテンツを利用した日間キーワード自動生成方法に関する実施形態について説明した。以下では、生成された日間キーワードを利用する方法に関する実施形態について説明する。
キーワードと資産価格との関連性評価方法
前述した実施形態で生成された日間キーワードが資産の価格に及ぼす影響を確認するため、それぞれの日間キーワードに対応する資産がいかなる資産であるかを決定しなければならない。次に、対応する資産に日間キーワードがいかなる影響を及ぼすかを分析しなければならない。前記キーワードに対応する資産を決定する方法及びキーワードの影響力を分析する方法は、以下で説明する実施形態により明確になる。
本発明の他の実施形態によれば、キーワードと資産価格との関連性評価装置100はキーワードと資産価格との関連性評価方法を実行する。以下、図13ないし図20を参照してキーワードと資産価格との関連性評価装置100により行われるキーワードと資産価格との関連性評価方法につい詳細に説明する。
図13は本発明のまた他の実施形態によるキーワードと資産価格との関連性評価方法の順序図である。また、図14は本発明のいくつかの実施形態で参照されるキーワードに対応する資産を説明するための例示図である。
図13を参照すると、装置100はインターネットを介して第1日付に掲示されたテキストコンテンツを収集する(S1301)。装置100はテキストコンテンツそれぞれからキーワードを抽出し、第1日付の日間キーワードを生成する(S1302)。装置100が第1日付の日間キーワードを生成する具体的な方法として、前述したテキストコンテンツを利用した日間キーワード自動生成方法が利用され得る。
装置100は第1日付の日間キーワードに属する各キーワードに対する日付別露出頻度情報を生成する(S1303)。例えば、露出頻度情報は生成された日間キーワードに属する各キーワードの日付別露出頻度をヒストグラムで示した情報であり得る。図14では露出頻度情報の例示としてグラフ1400を示した。露出頻度情報は予め設定した日付区間の日付別露出頻度情報を含み得る。図14を参照すると、キーワード1KW1は日付t1に露出頻度N1を有し、日付t2に露出頻度N2を有する。また、キーワード1KW1は日付t1及びt2とのあいだに位置した日付t11に露出頻度N11を有する。
装置100は生成された各キーワードに対する日付別露出頻度情報と予め登録した資産の日付別価格情報を比較する(S1304)。装置100は図1の外部装置300から資産及び資産の時間別、日付別の価格情報の提供を受ける。装置100は提供された情報をストレージ104に登録する。図14で予め登録した資産の日付別価格情報の例示として資産1ASSET1、資産2ASSET2及び資産3ASSET3の日付別価格情報をそれぞれグラフ(1401、1402、1403)で示した。
グラフ1401を参照すると、資産1ASSET1は日付t1に価格情報P0を有し、日付t2に価格P1を有する。グラフ1402を参照すると、資産2ASSET2は日付t1に価格P1を有し、日付t2に価格P2を有する。また、資産2ASSET2は日付t1とt2とのあいだに位置した日付t11に価格P0を有する。グラフ1403を参照すると、資産3ASSET3は日付t1に価格P1を有し、日付t2に価格P2を有する。また、資産3ASSET3は日付t1とt2とのあいだに位置した日付t11に価格P01を有する。
装置100は各キーワードに対する日付別露出頻度情報と予め登録した資産の日付別価格情報を比較することにより、予め登録した資産のうち各キーワードに対応する資産を決定する(S1305)。すなわち、装置100は特定キーワードに対応する資産がいかなる資産であるかを決定する。このとき、装置100は予め登録した資産のうち、各キーワードに対する第1期間のあいだの日付別露出頻度に対応し、第2期間のあいだ臨界値以上の日付別価格変化量を有する資産を識別する。装置100は識別された資産を前記各キーワードに対応する資産として決定する。
ここで第1期間はキーワードの露出頻度情報を測定する期間であり、予め設定した日付区間である。第2期間はキーワードの影響が資産に発現する期間であり、第2期間は第1期間と所定の時間差を有して始まる区間であり得る。特定キーワードが資産の価格情報変化に直ちに影響を与えないこともあるからである。例えば、キーワードAが日間キーワードとして生成され、キーワードAが資産Aに影響を及ぼすキーワードである場合、資産Aは2日以後に価格が変動され得る。または第2期間は第1期間を含む区間であり得る。特定キーワードが資産の価格情報変化に直ちに影響を与える場合、第2期間は第1期間と同一期間であり得る。前記第1期間対比第2期間の長さや開始点は装置100のユーザまたは製造者の設定によって決定され得る。
キーワード1KW1の日付別露出頻度情報と資産1ASSET1の日付別価格情報を比較する。
グラフ1400を参照すると、キーワード1KW1は第1期間である所定の初期日付からt1のあいだN0からN1まで露出頻度が増加する。グラフ1401で資産1ASSET1は第2期間であるt1以後の所定の日付あいだ、価格P0から価格が持続的に下落する。ここで、資産1ASSET1はキーワード1KW1の影響により価格が下落する資産であり得る。再びグラフ1400で、キーワード1KW1はt1からt11までの日付のあいだ、N1からN11まで露出頻度が減少する。資産1ASSET1の場合、同一日付のあいだに価格が継続して下落する。装置100はキーワード1KW1の露出頻度が増減するあいだ、資産1ASSET1の価格が持続して下落することを検知し得る。これにより、資産1ASSET1がキーワード1KW1に影響を受けないと判断する。
キーワード1KW1の日付別露出頻度情報と資産2ASSET2及び資産3ASSET3の日付別価格情報を比較する。
グラフ1400とグラフ(1402、1403)をそれぞれ比較すると、キーワード1KW1の日付別露出頻度の傾向と資産2ASSET2及び資産3ASSET3の日付別価格変化の傾向が一致している。これにより、装置100はキーワード1KW1の日付別露出頻度に対応し、資産2ASSET2及び資産3ASSET3が日付別価格変化量を有すると判断する。このとき、装置100は前記資産2ASSET2及び資産3ASSET3のうち、臨界値以上の価格変化量を有する資産3ASSET3をキーワード1KW1に対応する資産として決定する。資産の価格変化はキーワード以外の影響よっても発生し得るので、装置100は臨界値未満の価格変化を有する資産2ASSET2はキーワード1KW1に影響を受けない資産として決定する。
グラフ1403を参照すると、資産3ASSET3は価格変化量はキーワード1KW1の露出頻度と類似の形態を示す。すなわち、キーワード1KW1の露出頻度が増加すると、資産3ASSET3の価格も増加する。反面、キーワード1KW1の露出頻度の増加により価格が減少する資産もあり得る。
図15は本発明のいくつかの実施形態で参照されるキーワードに対応する資産を説明する他の例示図である。図15を参照すると、装置100はキーワード1KW1の露出頻度に対応する価格変化量を有する資産として資産3ASSET3及び資産4ASSET4を識別する。このとき、価格変化量は、前記価格変化量の絶対値を含む。すなわち、グラフ1400とグラフ1501を比較すると、キーワード1KW1の露出頻度が正の値を有するあいだ、資産4ASSET4の価格変化量は負の値を有する。この場合にも、装置100は資産4ASSET4をキーワード1KW1に対応する資産として決定する。
一つの資産に対応するキーワードは複数存在し得る。複数のキーワードを含み得る。このとき、複数のキーワードのうち対応する資産に影響力が高いキーワードを判断する方法について16を参照して説明する。
図16は本発明のいくつかの実施形態で参照される資産に対するキーワードの影響を説明する例示図である。ここで第1日付がt1であり、第2日付がt2であると仮定する。第2日付は第1日付以後の日付である。
装置100はS1305段階で、キーワード1KW1を第1日付t1の日間キーワードとして決定する。また、図16を参照すると、装置100はキーワード1KW1の露出頻度情報1400と予め登録された資産の価格情報を比較し、資産5ASSET5を日間キーワードに対応する資産として決定する。具体的には、装置100はキーワード1KW1の露出頻度が第1期間のあいだNOからN1に増加することに対応し、第2期間のあいだ臨界値以上(P0からP1)の価格変化量を有する資産として資産5ASSET5を識別し得る。図16では前記第1期間及び第2期間はいずれも所定の初期日付からt1までの期間である場合を例示した。
その後、装置100は第2日付t2の日間キーワードを生成する。装置100は第2日付の日間キーワードに第1日付の日間キーワードに属するいずれか一つのキーワードと同一のキーワードが存在するかを判断する。例えば、第1日付のキーワード1KW1が「金利引き上げ」である場合、装置100は第2日付の日間キーワードに「金利引き上げ」が存在するかを判断する。
このように第1日付の日間キーワードのうちいずれか一つと同一のキーワードが第2日付の日間キーワードに存在すると、装置100は前記同一のキーワードに対応すると決定された資産の日付別価格情報をモニタリングする。このとき、装置100は前記第2日付を基準に予め設定した期間のあいだの日付別価格情報をモニタリングする。図16では、予め設定した期間がt1からt2までの期間である場合を例示した。
前記例において装置100は「金利引き上げ」に対応する資産5ASSET5の日付別価格情報をモニタリングする。図16では「金利引き上げ」に対応する資産5ASSET5の日付別価格情報の例示としてグラフ1601を示した。装置100は「金利引き上げ」の露出頻度がグラフ1400に示すようにN1からN2に変化することに対応し、資産5ASSET5の日付別価格がグラフ1601に示したようにP1からP2に変化することをモニタリングする。
装置100は前記モニタリング結果に基づいて「金利引き上げ」キーワードの資産5ASSET5に対する関連性情報を決定する。ここで関連性情報は「金利引き上げ」キーワードが資産5ASSET5の価格変化に影響を及ぼすかどうか及び「金利引き上げ」キーワードの資産5ASSET5価格に対する影響力の指標を含み得る。
装置100は第1日付の日間キーワード「金利引き上げ」の露出頻度に対する発生した資産5ASSET5の価格変化量比率、第2日付の日間キーワード「金利引き上げ」の露出頻度に対する発生した資産5ASSET5の価格変化量比率を測定する。前記測定した比率に基づいて装置100はキーワード1KW1の資産5ASSET5に対する影響力を確認する。
また、装置100は前記モニタリング結果、前記資産5ASSET5のt1からt2までの価格変化量が臨界値以上である場合、前記「金利引き上げ」キーワードの前記資産5ASSET5に対する関連性情報をアップデートし得る。前記例においてグラフ1601のP1及びP2の差が臨界値以上である場合、装置100は「金利引き上げ」キーワードの資産5ASSET5に対する影響力指標をアップグレードさせ得る。第1日付t1を基準に決定された「金利引き上げ」キーワードと資産5ASSET5の関連性が第2日付t2を基準に再度確認されたからである。
一方、前記例と同様方式により、キーワード2KW2が第1日付t1の日間キーワードとして決定された場合について説明する。装置100はキーワード2KW2に対応する資産として資産5ASSET5を決定する。キーワード2KW2が「物価上昇」である場合を仮定する。装置100は第2日付t2の日間キーワードを生成し、第2日付の日間キーワードに「物価上昇」が含まれた場合、これを識別する。
次に、装置100は対応する第1日付の日間キーワードに対応する資産5ASSET5の日付別価格情報をモニタリングする。図16では「物価上昇」に対応する資産5ASSET5の日付別価格情報の例示としてグラフ1602を示した。装置100は「物価上昇」の露出頻度をグラフ1600に示したようにN1からN2に変化することに対応し、資産5ASSET5の日付別価格がグラフ1602に示したようにP1からP2に変化することをモニタリングする。これにより、装置100はキーワード2KW2の資産5ASSET5に対する影響力を確認し得る。
装置100は前記確認された影響力に基づいてキーワード1KW1及びキーワード2KW2の資産5ASSET5に対する優劣関係を判断する。
前記した資産に対するキーワードの影響力とは、結局日間キーワードに属するそれぞれのキーワードが対応する資産の価格増減に及ぼす影響を意味する。すなわち、装置100はキーワードの影響によりどれほど資産の価格が増減するかを判断する。装置100は前記判断結果を関連性情報として保存する。
装置100は前記保存された関連性情報に基づいて他の日付の資産の価格変化を予測する。
前述したように装置100は日間キーワードに属する個別キーワードの資産に対する関連性情報を決定する。以下、関連性情報の多様な指標について説明する。
図17は本発明のいくつかの実施形態で参照されるキーワードの発生時点と資産価格の変化時点の差異を説明する例示図である。図18は本発明のいくつかの実施形態で参照されるキーワードが資産に影響を及ぼす期間を説明する例示図である。
図17において、グラフ1400に示すようにキーワード1KW1が第1日付t1及び第2日付t2で日間キーワードとして決定された場合を仮定する。また、キーワード1KW1に対応する資産が資産6ASSET6及び資産7ASSET7である場合を仮定する。
第1期間のあいだ(所定の初期日付からt1のあいだ)キーワード1KW1の露出頻度が増加するあいだ、グラフ1701で資産6ASSET6の価格が第2期間のあいだ(所定の初期日付からt01のあいだ)増加した。
装置100は前記第1期間と第2期間の先後関係を判断する。装置100は前記判断結果を第1日付の日間キーワードであるキーワード1KW1の資産6ASSET6に対する関連性情報として保存する。グラフ1701を参照すると、資産6ASSET6の価格変化はキーワード1KW1の発生日付(第1日付)に先行する特性を有する。
以後、第2日付t2の日間キーワードとしてキーワード1KW1が決定されると、装置100は前記保存された関連性情報に基づいて資産6ASSET6の価格変化が第2日付に先行する特性を有すると予測し得る。
グラフ1702で資産7ASSET7の価格は第2期間のあいだ(所定の初期日付からt11のあいだ)増加した。この場合にも、装置100は第1期間及び第2期間の先後関係を判断し、キーワード1KW1の資産7ASSET7に対する関連性情報として保存する。グラフ1702を参照すると、資産7ASSET7の価格変化はキーワード1KW1の発生に後行する特性を有する。
その後、第2日付t2の日間キーワードとしてキーワード1KW1が決定されると、装置100は前記保存された関連性情報に基づいて資産7ASSET7の価格変化が第2日に後行する特性を有すると予測し得る。
また、装置100は前記第1期間と第2期間の時間間隔を測定する。装置100は前記測定結果をキーワード1KW1の資産7ASSET7に対する関連性情報として保存する。グラフ1702を参照すると、第1日付t1でキーワード1KW1が日間キーワードとして生成されると、これに影響を受ける資産7ASSET7の価格変化はt11に表れる。装置100はキーワード1KW1の資産7ASSET7に対する影響力が時間間隔(t11-t1)の後に表れると判断し得る。
その後、第2日付t2の日間キーワードとしてキーワード1KW1が決定されると、装置100は前記保存された関連性情報に基づいて資産7ASSET7の価格変化が時間間隔(t21-t2)以後に表れる特性を有すると予測し得る。
図18において、グラフ1400に示すようにキーワード1KW1が第1日付t1及び第2日付t2で日間キーワードとして決定された場合を仮定する。
第1期間のあいだ(所定の初期日付からt1のあいだ)キーワード1KW1の露出頻度が増加するあいだ、グラフ1800で資産の価格が増加した。また、前記増加した価格が第2期間E1のあいだ維持された。
装置100はキーワード1KW1の資産の価格に対する影響力が維持される前記第2期間を関連性情報として保存し得る。
その後、第2日付t2の日間キーワードとしてキーワード1KW1が決定されると、装置100は前記保存された関連性情報に基づいて資産価格が第2期間E2のあいだ維持される特性を有すると予測し得る。
一方、S1302段階で生成された第1日付の日間キーワードは複数のキーワードを含み得る。複数のキーワードの露出頻度情報に対応し、特定資産の価格が第1日付で上昇した場合を仮定する。この場合、複数のキーワードはいずれも資産の価格に影響を及ぼす。または複数のキーワードのうちいずれか一つは資産の価格に影響を及ぼさない場合があり得る。このような場合について図19及び図20を参照して説明する。
図19は本発明のいくつかの実施形態で参照される複数のキーワードのうち資産に影響を及ぼすキーワードに対する例示図である。
図19では、グラフ1900のキーワード1KW1及びキーワード2KW2が第1日付の日間キーワードに含まれる場合を仮定する。また、図19において前記キーワード1KW1及びキーワード2KW2に対応すると決定された資産の例示としてグラフ1910を示した。
S1305段階で、装置100は第1日付を基準にキーワード1KW1及びキーワード2KW2がいずれも前記資産に影響を及ぼすと判断する。このとき、第2日付t2の日間キーワードとしてキーワード1KW1が決定された場合、装置100は第1日付の日間キーワードのうち一つのキーワードが再び第2日付t2の日間キーワードとして決定されたことを識別し得る。
装置100は第2日付t2を基準に予め設定した期間のあいだ決定された資産の日付別価格情報をモニタリングし得る。
図19では前記資産の日付別価格情報の例示としてグラフ1911を示した。装置100はモニタリング結果に基づいて前記キーワード1KW1の資産に対する関連性情報を決定する。グラフ1910及びグラフ1911を比較し、装置100はキーワード1KW1の資産に対する関連性が高いことを判断し得る。
反面、第2日付t2の日間キーワードとしてキーワード2KW2が決定された場合、装置100は第1日付の日間キーワードのうち一つのキーワードが再び第2日付t2の日間キーワードとして決定されたことを識別し得る。装置100は第2日付t2を基準に予め設定した期間のあいだ決定された資産の日付別価格情報をモニタリングし得る。
図19において前記資産の日付別価格情報の例示としてグラフ1912を示した。装置100はモニタリング結果に基づいて前記キーワード2KW2の資産に対する関連性情報を決定し得る。グラフ1910及びグラフ1912を比較して装置100はキーワード2KW2を資産と関連しないキーワードとして判断する。この場合、装置100は第1日付を基準にキーワード1KW1及びキーワード2KW2がいずれも前記資産に影響を及ぼすと判断した結果を修正する。すなわち、装置100は前記キーワード2KW2が資産と関連しないため第1日付に登録された日間キーワードを修正し得る。このとき、装置100は、第1日付のキーワード生成に誤りがあると判断し、前述したテキストコンテンツを利用した日間キーワード自動生成方法の実施形態で説明した第1ウィンドウ及び第2ウィンドウのサイズを調節し得る。
図20は本発明のいくつかの実施形態で参照される複数のキーワードに影響を受ける資産に対する例示である。図19に対する説明と重複する内容は省略する。
S1305段階で、装置100は第1日付を基準にキーワード1KW1及びキーワード2KW2がいずれも資産に影響を及ぼすと判断する。その後、装置100は第2日付の日間キーワードを生成する。生成された第2日付のキーワードにまたキーワード1KW1及びキーワード2KW2が存在すると、装置100は前記複数のキーワード(キーワード1KW1及びキーワード2KW2)に対応すると決定された資産の日付別価格情報をモニタリングし得る。
装置100はモニタリング結果に基づいて前記複数のキーワードの前記決定された資産に対する関連性情報を決定する。
例えば、グラフ1900のように第1日付t1の日間キーワードのうちキーワード1KW1及びキーワード2KW2がいずれもグラフ1910のように資産に影響を及ぼす場合を仮定する。
装置100は、グラフ1901のように、その後、第2日付t2でキーワード1KW1を日間キーワードとして生成する。第2日付の日間キーワードがグラフ2001のように資産に影響を及ぼさない場合、装置100はキーワード1KW1と資産が関連しないと判断し得る。
装置100はキーワード2KW2もグラフ2002のように資産に影響を及ぼさない場合、キーワード2KW2も資産と関連しないと判断し得る。
仮に、また他の日付に第1日付t1の日間キーワードと同様にキーワード1KW1及びキーワード2KW2がいずれも含まれた場合に、資産の価格が臨界値以上に増加した場合を仮定する。
装置100は前記第1日付t1、第2日付t2及びまた他の日付の資産の価格情報に基づいて前記資産が複数のキーワードであるキーワード1KW1及びキーワード2KW2のすべてに対して影響を受け、個別のキーワードに対しては影響を受けないと判断する。
装置100はキーワード1KW1及びキーワード2KW2がペアを成して資産に対する関連性情報として保存し得る。
キーワードと資産価格との関連性評価装置の具体的な実施形態
前述した実施形態によれば、装置100は日間キーワードに対応する資産を決定し、日間キーワードが資産に及ぼす影響に対する分析する。特に、装置100は第1日付の日間キーワードと対応する資産の関連性情報に基づいて第2日に同一の日間キーワードが資産の価格に及ぼす影響を予測することもできる。このような予測に基づいて装置100はユーザ端末200に資産に対する投資ガイドサービスを提供することができる。
前記投資ガイドサービスの提供のために装置100は前記日間キーワード及び対応する資産に対する情報をストレージ104に保存する。また、装置100は日間キーワードが対応する資産に及ぼす影響に対する分析結果を保存することもできる。例えば、装置100は図16ないし図18に対する説明で前述した関連性情報を保存する。
図21は本発明のいくつかの実施形態で参照されるキーワードと資産の関連性情報の例示である。また、図22は本発明のいくつかの実施形態で参照されるキーワードの資産に対する関連性指標の例示である。
図21では、日間キーワードKWと対応する資産Aの関連性情報CRデータを例示した。装置100のストレージ104は前記データを保存する。図21を参照すると、前記データは特定日付の日間キーワードKW情報とこれに対応する資産A情報を含み得る。この場合、装置100は日間キーワードKWが生成された各日付を基準に関連性情報CRを保存する。または、装置100は資産Aの種類を基準に対応する日間キーワードKWの関連性情報CRを保存し得る。また、前記データはキーワードの出処に基づいた優先順位情報を含み得る。
図21のそれぞれの関連性情報CRは、関連性指標に対する情報を含み得る。関連性指標は、日間キーワードが対応する資産に及ぼす具体的な影響に対する情報である。
図22を参照すると、関連性情報CRは以下のような関連性指標に対する情報を含む。
関連性情報CRは日間キーワードが資産の価格増減に及ぼす影響に対する情報を含み得る。前記関連性情報CRは特定日間キーワードが生成され、前記日間キーワードに対応して資産の価格が上がるか、または落ちるかに対する情報である。
関連性情報CRは日間キーワードが資産の価格変動に影響を与える時差に対する情報を含み得る。前記関連性情報CRは日間キーワードが生成され、前記日間キーワードに対応し、どの位の時間間隔で資産の価格が変動するかに対する情報である。
関連性情報CRは日間キーワードが資産の価格変動に影響を与える期間に対する情報を含み得る。前記関連性情報CRは日間キーワードが生成され、前記日間キーワードに対応して資産の価格が変動が持続する期間に対する情報である。
関連性情報CRは日間キーワードの資産価格に対する影響力情報を含み得る。前記関連性情報CRは日間キーワードが生成され、前記日間キーワードに対応して資産の価格がどれほど増減するかに対する情報である。
関連性情報CRは関連性指標の信頼度情報を含み得る。前記関連性情報CRは関連性指標による資産価格の予測正確性に対する情報である。第1日付に生成された日間キーワードに対して保存された関連性情報が存在する場合を仮定する。このとき、装置100は第1日付以後、第2日付に前記日間キーワードと同一のキーワードが生成された場合に資産の価格変化が第1日付の関連性情報に同一に従うかを判断する。装置100は前記判断結果を関連性指標として図22の関連性情報CRに保存し得る。
以下、前記関連性情報を利用して装置100がユーザ端末200に提供する投資ガイドサービスについて図23ないし図26を参照して説明する。
図23は本発明のまた他の実施形態で参照される日間キーワードを提供するグラフィックユーザインターフェース(GUI、Graphic User Interface)の例示である。
図23を参照すると、装置100はユーザ端末200に投資ガイドサービスのためのグラフィックユーザインターフェース2300を提供する。前記インターフェース2300は第1日付の日間キーワード情報2301を含み得る。インターフェース2300に第1日付の日間キーワードの例示として当日収集したテキストコンテンツから生成されたキーワードが図示されている。
ユーザ端末200を介して日間キーワードのうちいずれか一つ2302が選択されると、装置100は選択されたキーワードに対応してインターフェース2310を生成する。また、装置100は前記ユーザ端末200にインターフェース2310を提供し得る。
インターフェース2310は前記選択されたキーワードに対応する資産情報(2311、2312、2313)を含み得る。インターフェース2310は選択されたキーワードに対応する一つ以上の資産情報(2311、2312、2313)を含み得る。また、インターフェース2310は種類格別資産情報を選択するためのインターフェース2314を含み得る。
装置100は図21及び図22で説明したキーワードの資産に対する関連性情報及び関連性指標に対する情報を利用して投資ガイドサービスを提供し得る。
図24は本発明のいくつかの実施形態で参照されるキーワードが資産価格に影響を及ぼす時期に基づいた投資ガイドインターフェースの例示である。
図24を参照すると、装置100は日間キーワードのうちキーワード2302が選択された場合、ユーザ端末200にインターフェース2400を提供する。図24ではインターフェース2400がキーワード2302に対応する資産情報としてキーワード2302に対応する一つ以上の企業の株式相場情報2401を含む場合を例示した。
ユーザ端末200を介してA企業が選択されると、装置100はユーザ端末200にインターフェース2410を提供する。インターフェース2410はキーワード2302に対応して変動されたA企業株式の価格情報2411を含み得る。例えば、前記価格情報はA企業株式の予め設定した期間のあいだの価格変化量情報であり得る。
また、インターフェース2410はキーワード2302とA企業株式に対する関連性情報を含み得る。例えば、キーワード2302によりA企業の株式価格がいかなる影響を受けるかに対する情報2412を含み得る。インターフェース2410はキーワード2302がA企業の株式価格に影響を及ぼす時差情報(2412、2413)を含み得る。また、インターフェース2410はキーワード2302がA企業の株式価格に影響を及ぼす期間に対する情報2413を含み得る。
装置100は前記関連性情報を提供し、前記A企業株式に対する投資ガイドを提供するメッセージ2414をユーザ端末200に送信する。
前記メッセージ2414はA企業株式に対し、買入または売却に対する推薦を含み得る。また、メッセージ2414は前記時差情報及び影響を及ぼす期間情報に基づいてA企業株式の買入または売却時点、保有期間に対するガイドを含み得る。
図25は本発明のいくつかの実施形態で参照されるキーワードが資産価格に影響を及ぼす程度に基づいた投資ガイドインターフェースの例示である。
装置100はユーザ端末200を介してユーザからキーワードが入力されると、これを受信する。装置100はユーザから入力されたキーワードに対応してインターフェース2500を生成する。前記インターフェース2500は入力されたキーワード2501に対応する資産に対する情報2502を含み得る。
このとき、装置100は入力されたキーワードが予め保存した他の日付または当日付の日間キーワードのうちいずれか一つと一致するかを判断する。すなわち、日間キーワードに属するキーワードが入力されると、装置100は入力されたキーワードに対応する資産情報を識別し得る。装置100はキーワード及び識別された資産情報に基づいてインターフェース2500を生成し得る。
前記資産に対する情報2502のうちいずれか一つが選択されると装置100はインターフェース2510を生成する。また、装置100は生成されたインターフェース2510をユーザ端末200に送信し得る。
インターフェース2510は入力されたキーワード2501に対応して変動した資産の価格情報2511及び関連性情報を含み得る。例えば、キーワード2501の影響が資産価格の変動に先行するかまたは後行するかに対する情報2512を含み得る。インターフェース2510はキーワード2501が資産の価格に影響を及ぼす時差情報2513を含み得る。また、インターフェース2510はキーワード2501が資産の価格に及ぼす影響力の情報、すなわち、キーワード2501が資産の価格変動に及ぼす影響に対する情報2514を含み得る。
装置100は前記関連性情報を提供して前記A企業株式に対する投資ガイドを提供するメッセージ2515をユーザ端末200に送信する。
前記メッセージ2515は資産に対する買入または売却に対する推薦を含み得る。装置100は前記影響力情報に基づいて資産投資時予想される目標収益情報を生成し得る。この場合、また、メッセージ2514は前記目標収益情報を含み得る。
前記では、ユーザからキーワードが選択されたり、入力される場合、装置100から提供される投資ガイドサービスについて説明した。本発明の他の実施形態によれば、装置100はユーザが保有中であるかまたは、関心のある資産に対するキーワード情報をユーザ端末200に提供し得る。すなわち、ユーザに、保有中であるかまたは関心のある資産に対するキーワードを提供し、今後前記キーワードが日間キーワードに含まれた場合、ユーザが対応する機会を提供するためである。
図26は本発明のまた他の実施形態による資産に対応する日間キーワードを説明する例示図である。図26を参照すると、装置100はユーザ端末200を介して資産に対する選択入力を受信する。これのため、装置100はインターフェース2600をユーザ端末200に提供する。インターフェース2600は資産リスト2601を含み得る。資産リスト2601には一つ以上の資産2602が含まれる。前記資産のうちいずれか一つに対してユーザ選択が受信されると、装置100はこれに対応してインターフェース2610を生成する。また、装置100は前記インターフェース2610をユーザ端末200に提供し得る。前記インターフェース2610は選択された資産情報2602及びこれに対応するキーワードリスト2611を含み得る。
一方、装置100は前記ユーザ選択資産に対する情報を保存する。装置100は前記ユーザ選択資産に対応するキーワードを第1日付の日間キーワードの中から識別する。装置100はその後、第2日付の日間キーワードを生成する。このとき、第2日付の日間キーワードに前記ユーザ選択資産に対応するキーワードが存在すると、装置100はこれを感知し、ユーザ端末200に前記ユーザ選択資産に対応するキーワードを送信する。これにより、ユーザはユーザが保有中であるかまたは関心のある資産の価格に変動が発生し得ることを認知することができる。装置100は第2日付の日間キーワードに前記キーワードが含まれたことに基づいてユーザ選択資産の価格変動可能性を判断し得る。装置100は前記判断に基づいて投資ガイドメッセージをユーザ端末200に送信し得る。
図27は本発明のまた他の実施形態による資産の価格変化に対応する日間キーワードの抽出方法の順序図である。図28は本発明のまた他の実施形態による資産の価格変化が発生した場合、これに基づいて他の資産を推薦するサービスの例示である。
前述したように、キーワードは対応する資産に必ずも先行して影響を及ぼすものではない。すなわち、資産の価格変動が発生した後に、日間キーワードに前記資産に対応するキーワードが含まれ得る。以下では、資産の価格変動がキーワードに先行して発生した場合、これに対応するキーワードを識別する方法について説明する。また、識別されたキーワードに後行して価格変動が予想される他の資産を識別する方法について説明する。
図27を参照すると、装置100は予め登録された資産のうち第1期間のあいだ日付別価格変化量が臨界値以上である資産を識別する(S2701)。また、装置100は第1日付のテキストコンテンツを収集して第1日付の日間キーワードを生成する(S2702)。このとき、前記S2702段階はS2701段階の後に実行されなくてもよい。すなわち、装置100はS2701段階とは別にS2702段階を行う。ここで第1日付は当日であり得る。すなわち、装置100は毎日収集したテキストコンテンツからキーワードを抽出し、抽出されたキーワードに基づいて第1日付の日間キーワードを生成する。
装置100は第1日付の日間キーワードに属する各キーワードに対する第2期間のあいだの日付別露出頻度を感知する(S2703)。装置100は資産の第1期間のあいだの日付別価格変化量に対応する第2期間のあいだの日付別露出頻度を有するキーワードを抽出する(S2704)。装置100はこのときキーワードを前記第1日付の日間キーワードのうちから抽出する。
装置100は前記抽出されたキーワードを、前記資産に対応するキーワードとして決定する(S2705)。
次に、装置100は前記資産に対する第3期間のあいだ臨界値以上の価格変化量を感知する。また、装置100は予め登録された資産のうち前記決定されたキーワードに対応する資産を識別し得る。装置100は前記識別された資産に対する情報をユーザ端末200に送信する。これにより、装置100は特定資産の価格が変動すると、これに基づいて前記特定資産と異なる資産の価格変動を予測し得る。また、装置100は前記予測に基づく投資ガイドをユーザの端末200に提供し得る。
図28を参照すると、装置100は予め登録された資産の価格変化量情報をディスプレイするインターフェース2800をユーザ端末200に送信する。資産の価格変化量情報2801は第1期間のあいだ資産の価格増減情報を含み得る。
装置100は前記資産の価格変化量情報2801に含まれたいずれか一つの資産の価格変化量に基づいて前記いずれか一つの資産に対応するキーワードを識別する。
価格変化量情報2801を参照すると、図28はA企業株式の価格変化量が20%であり、B企業株式の価格変化量が5%である場合が例示した。例えば、価格変化量の臨界値が15%である場合、装置100はA企業株式に対応する露出頻度を有するキーワードを識別し得る。
装置100は前記キーワードの識別のため、日間キーワード情報を予め保存する。すなわち、装置100は予め保存した日間キーワード情報のうち前記キーワードを識別する。装置100は前記識別されたキーワードを前記資産に対応するキーワードとして判断し得る。
装置100は前記キーワードを識別することによりインターフェース2810を生成し、これをユーザ端末200に提供する。前記インターフェース2810は臨界値以上の価格が変動した資産2811及びこれに対応すると判断したキーワード情報2812を含み得る。キーワード情報2812は一つ以上のキーワードを含み得る。装置100は前記キーワードの出処に基づいて優先順位を決定し、インターフェース2810はキーワード(2813、2814、2815)の優先順位情報を含み得る。
次に、装置100はキーワード情報2812上のキーワード(2813、2814、2815)のうちいずれか一つに対応する資産に対する情報を識別し得る。前記識別される資産は臨界値以上の価格が変動した資産2811と異なるの資産を含み得る。装置100は前記キーワード(2813、2814、2815)のうちいずれか一つのキーワード2814及びこれに対応する資産情報2821を含むインターフェース2820を生成する。装置100は前記インターフェース2820をユーザ端末200に送信し得る。
これにより、装置100は特定資産の価格が臨界値以上の変化量を有する場合、価格変動が予想される他の資産に対する投資ガイドサービスをユーザの端末200に提供することができる。
テキストコンテンツにマッチングされた資産情報のディスプレイ方法
前記では、キーワードと対応する資産とのあいだの関連性情報を利用する本発明の実施形態について説明した。前記、キーワードと資産とのあいだの関連性は前記キーワードを含むテキストコンテンツまで拡張される。以下、図29を参照して詳細に説明する。
図29は本発明のまた他の実施形態によるテキストコンテンツ、キーワード、及び資産のマッチング関係を説明するための概念図である。図29はテキストコンテンツの例としてインターネットをニュースを示した。前述した本発明の実施形態により、キーワード2901及び対応する資産2903がマッチングされて保存されていると仮定する。
ユーザ端末200はディスプレイ部にインターネットニュース2905をディスプレイする。ニュース2905は少なくとも一つのキーワードを含み得る。図29ではニュース2905はキーワード1KW1、キーワード2KW2及びキーワード3KW3を含む場合を例示した。
ユーザ端末200は前記ニュース2905上のキーワード1KW1、キーワード2KW2及びキーワード3KW3を感知し、これを抽出2911する。前記キーワードが抽出されることにより、ユーザ端末200は予め登録された資産のうち抽出された少なくとも一つのキーワード2911それぞれにマッチングされた資産(2913、2923、2933)を抽出する。
図29を参照すると、予め登録された資産のうち、キーワード1KW1にマッチングされた資産2913として資産1、資産2及び資産3が例示されている。また、キーワード2KW2にマッチングされた資産2923として資産1、資産3及び資産4が例示されている。キーワード3KW3にマッチングされた資産2933は資産3及び資産5である。
ユーザ端末200は前記マッチングされた資産を識別し、予め登録された資産のうちこれを抽出する。また、ユーザ端末200は前記抽出された資産のうち予め設定した回数以上抽出された資産が存在する場合、前記予め設定した回数以上抽出された資産を前記テキストコンテンツにマッチングさせる。
再び図29を参照すると、抽出された資産のうち資産3の場合3回抽出された。例えば、前記予め設定された回数が3回である場合、資産3はニュース2905にマッチングされる。
ユーザ端末200は前記予め設定した回数以上抽出された資産に対する情報を前記第1領域と異なる第2領域にディスプレイする。すなわち、前記ニュース2905がディスプレイされた領域と異なる領域に前記資産3に対する情報がディスプレイされる。
このとき、前記少なくとも一つのキーワードにマッチングされた資産は、少なくとも一つのキーワードそれぞれに対する第1期間のあいだの日付別露出頻度に対応し、第2期間のあいだ臨界値以上の日付別価格の変化量を有する資産を含み得る。すなわち、前記マッチングされた資産は前述した本発明の実施形態によりキーワードにマッチングされた資産であり得る。また、前記資産に対する情報は、少なくとも一つのキーワード及び前記予め設定した回数以上抽出された資産の間の関連性情報に基づいて決定された前記予め設定した回数以上抽出された資産の価格予測情報を含み得る。すなわち、ここで資産に対する情報は前述した本発明の実施形態による資産の資産価格の変動程度の予測結果を含み得る。
前述したように、テキストコンテンツと資産がマッチングされると、ユーザはユーザ端末200を介して特定資産を基準にマッチングしたテキストコンテンツを照会することもできる。
これのため、ユーザ端末200が資産に対する情報をディスプレイ部上の第1領域にディスプレイする。
前記資産に対する情報はユーザ要請に応じて、ウェブページを介して提供される資産の相場、価格変化などに対する情報であり得る。
ユーザ端末200は前記第1領域と異なる第2領域に前記資産にマッチングされたテキストコンテンツのリストをディスプレイし得る。ここで、前記資産にマッチングされたテキストコンテンツは前記資産にマッチングされたキーワードを少なくとも一つ含み得る。例えば、前記テキストコンテンツのリストは前記資産にマッチングされたキーワードを含むインターネットニュース記事であり得る。また、前記リストは前記インターネットニュース記事のリストであり得る。
ユーザ端末200は前記ディスプレイされたリスト上のテキストコンテンツのうちいずれか一つに対する選択入力が受信されると、前記いずれか一つのテキストコンテンツをディスプレイし得る。前記例において、ユーザ端末200は前記キーワードを含むインターネットニュース記事をディスプレイし得る。
これまで添付した図面を参照して説明した本発明の実施形態による方法はコンピュータが読み取りできるコードで実現されたコンピュータプログラムの実行により遂行され得る。前記コンピュータプログラムはインターネットなどのネットワークを介して第1コンピュータ装置から第2コンピュータ装置に送信され、前記第2コンピュータ装置に設置され得、これにより前記第2コンピュータ装置で使用され得る。前記第1コンピュータ装置及び前記第2コンピュータ装置は、サーバ装置、デスク塔PCのような固定式コンピュータ装置、ノートブック、スマートフォン、タブレットPCのようなモバイルコンピューティング装置をすべて含む。
以上添付した図面を参照して本発明の実施形態を説明したが、本発明が属する技術分野における通常の知識を有する者は、本発明がその技術的思想や必須の特徴を変更しない範囲で他の具体的な形態で実施され得ることを理解することができる。したがって、上記実施形態はすべての面で例示的なものであり、限定的なものでないと理解しなければならない。