JP5855202B1 - 検索装置、検索方法及び検索プログラム - Google Patents

検索装置、検索方法及び検索プログラム Download PDF

Info

Publication number
JP5855202B1
JP5855202B1 JP2014213921A JP2014213921A JP5855202B1 JP 5855202 B1 JP5855202 B1 JP 5855202B1 JP 2014213921 A JP2014213921 A JP 2014213921A JP 2014213921 A JP2014213921 A JP 2014213921A JP 5855202 B1 JP5855202 B1 JP 5855202B1
Authority
JP
Japan
Prior art keywords
keyword
search
brand
user
search query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014213921A
Other languages
English (en)
Other versions
JP2016081388A (ja
Inventor
孝世 小林
孝世 小林
昭彦 那須
昭彦 那須
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2014213921A priority Critical patent/JP5855202B1/ja
Application granted granted Critical
Publication of JP5855202B1 publication Critical patent/JP5855202B1/ja
Publication of JP2016081388A publication Critical patent/JP2016081388A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

【課題】投資対象をユーザの関心に応じて拡張すること。【解決手段】本願に係る検索装置は、抽出部と、受付部と、応答部とを備える。抽出部は、情報媒体に掲載された記事の中から、キーワードと銘柄とを関連付けて抽出する。受付部は、ユーザが任意に指定可能な検索クエリを受け付ける。応答部は、抽出部によって抽出されたキーワードと、受付部によって受け付けられた検索クエリの全部又は一部とが一致する場合には、検索クエリに対する検索結果として、キーワードと関連付けられている銘柄をユーザに応答する。【選択図】図1

Description

本発明は、検索装置、検索方法及び検索プログラムに関する。
近年、インターネットの飛躍的な普及に伴い、株式投資に関する情報の提供がネットワークを介して盛んに行われている。例えば、一般に投資家が得る情報には、専門家からの助言や予測情報、またファイナンスニュースなどがある。
上記のような株式投資に関する情報提供の例としては、ユーザに単一のキーワードを選択させることにより、キーワードが含まれるニュースに関連した銘柄情報を提供可能とする銘柄情報提供システムに関する技術が知られている。
特開2008−107929号公報
しかしながら、上記の従来技術では、投資対象をユーザの関心に応じて拡張できるとは限らない。具体的には、上記の従来技術では、ユーザにキーワードを選択させて、キーワードに対応する銘柄及びニュースに関する情報を提供する。ここで、ユーザに選択させるキーワードは、予め銘柄(企業)に紐付けられているキーワードであるため、ユーザは、提示されたキーワードを選択したとしても、抽出される銘柄及びニュースは一般に想定される範囲内にとどまる可能性がある。このように、上記の従来技術では、所定のキーワードを選択して投資対象となる銘柄を検索しても、投資対象を有用に拡張することができるとは限らないという課題がある。
本願は、上記に鑑みてなされたものであって、投資対象をユーザの関心に応じて拡張できる検索装置、検索方法及び検索プログラムを提供することを目的とする。
本願に係る検索装置は、情報媒体に掲載された記事の中から、キーワードと銘柄とを関連付けて抽出する抽出部と、ユーザが任意に指定可能な検索クエリを受け付ける受付部と、前記抽出部によって抽出されたキーワードと、前記受付部によって受け付けられた検索クエリの全部又は一部とが一致する場合には、当該検索クエリに対する検索結果として、前記キーワードと関連付けられている銘柄を前記ユーザに応答する応答部と、を備えたことを特徴とする。
実施形態の一態様によれば、投資対象をユーザの関心に応じて拡張できるという効果を奏する。
図1は、実施形態に係る検索処理の一例を示す図である。 図2は、実施形態に係る検索装置の構成例を示す図である。 図3は、実施形態に係るニュースデータ記憶部の一例を示す図である。 図4は、実施形態に係る検索情報記憶部の一例を示す図である。 図5は、実施形態に係るキーワード記憶部の一例を示す図である。 図6は、実施形態に係るスコア算出情報記憶部の一例を示す図である。 図7は、実施形態に係る検索装置による抽出処理手順を示すフローチャートである。 図8は、実施形態に係る検索装置による検索処理手順を示すフローチャートである。 図9は、検索装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る検索装置、検索方法及び検索プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る検索装置、検索方法及び検索プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.検索処理の概要〕
まず、図1を用いて、実施形態に係る検索処理の一例について説明する。図1は、実施形態に係る検索処理の一例を示す図である。図1では、検索システム1を例に挙げて、本願に係る検索処理の概要について説明する。具体的には、図1では、検索システム1に含まれる検索装置100が、情報媒体に掲載された記事(例えば、ニュース記事)を構成するテキストデータの中から、株式投資銘柄(例えば、上場している企業名など。以下、「銘柄」とのみ表記する)と、銘柄を特徴付けるキーワードとを関連付けて予め抽出しておき、ユーザから検索クエリを受け付けた場合には、検索結果として、キーワードを含む銘柄情報をユーザに応答する処理について説明する。
図1に示すように、検索システム1には、ユーザ端末10と、ニュースデータサーバ20と、検索装置100とが含まれる。検索装置100は、図示しないネットワークN(例えば、インターネット)を介して、ユーザ端末10及びニュースデータサーバ20と通信可能に接続される。なお、検索システム1に含まれるユーザ端末10やニュースデータサーバ20の台数は、図1に示した例に限られない。例えば、検索システム1には、複数台のユーザ端末10や、複数台のニュースデータサーバ20が含まれてもよい。
ユーザ端末10は、一般ユーザによって利用される情報処理装置である。具体的には、ユーザ端末10は、ユーザがウェブページ等を閲覧するために利用される。ユーザ端末10は、例えば、スマートフォンやタブレット端末やPDA(Personal Digital Assistant)等の移動端末や、デスクトップ型PC(Personal Computer)や、ノート型PC等である。
ニュースデータサーバ20は、情報媒体に掲載された記事の一例であるニュース記事40を提供する提供元であるコンテンツプロバイダ(以下、「CP」と表記する場合がある)によって利用されるサーバ装置である。具体的には、ニュースデータサーバ20は、ニュース記事40の利用を希望する検索装置100からの要求に従い、ニュース記事40を検索装置100に入稿する。
検索装置100は、ユーザ端末10からの検索要求を受け付け、検索要求に応じた銘柄情報を検索結果としてユーザに提供するサーバ装置である。具体的には、検索装置100は、ニュースデータサーバ20から取得したニュース記事40の中から、銘柄と、銘柄を特徴付けるキーワードとを互いに関連付けて抽出する。そして、検索装置100は、ユーザから受け付けた検索クエリとキーワードとが一致又は類似する場合に、キーワードに関連付けられている銘柄を検索結果として応答する処理を実行する。以下、図1を用いて、検索システム1による検索処理を流れに沿って説明する。
まず、図1に示した例において、検索装置100は、ニュースデータサーバ20から、ニュース記事40の入稿を受け付ける(ステップS11)。ニュース記事40は、例えば、テキストデータによって構成され、銘柄と銘柄コード(例えば、銘柄を識別するための4桁の数字)とを含む、ファイナンスに関するニュースであるものとする。そして、検索装置100は、入稿されたニュース記事40に含まれるテキストデータを形態素解析することにより、ニュース記事40に係るデータを単語毎に判別可能な状態に分解する。例えば、検索装置100は、ニュース記事40に含まれるテキストデータを名詞に分解する。そして、検索装置100は、ニュース記事40に含まれる名詞のうち、銘柄と、銘柄を特徴付けるキーワードを抽出する(ステップS12)。
このとき、検索装置100は、ニュース記事40に含まれている名詞について、各名詞の注目度に基づいて、所定の名詞が銘柄を特徴付けるキーワードか否かの判定を行う。例えば、検索装置100は、一般ユーザが利用可能な検索サービスにおいて、所定の名詞が一般ユーザによって検索された回数を注目度の指標値とすることができる。言い換えれば、検索装置100は、所定の名詞が検索クエリとして一般ユーザから送信される回数を注目度の指標値とする。
なお、検索装置100は、所定の名詞が一般ユーザによって検索された回数について、検索装置100自身が提供する検索サービスにおいて一般ユーザから受け付けた検索クエリに関する情報を参照してもよいし、外部のウェブ検索サーバから検索クエリに関する情報の提供を受けてもよい。そして、検索装置100は、所定の名詞が検索クエリとして一般ユーザから送信された回数が所定の閾値を超えている場合に、かかる名詞について、同一のニュース記事40内に出現する銘柄を特徴付けるキーワードとして判定する。
そして、検索装置100は、ニュース記事40から抽出した銘柄と、銘柄を特徴付けるキーワードとを関連付けて所定の記憶部に保持する。続いて、検索装置100は、提供する検索サービスにおいて、銘柄に関する情報の提供を希望するユーザから検索クエリを受け付ける。言い換えれば、ユーザ端末10は、検索装置100が提供する検索ページ50において、ユーザが任意に指定した検索クエリを入力することにより、検索装置100に検索クエリを送信する(ステップS13)。
そして、検索装置100は、ユーザ端末10から受け付けた検索クエリによる検索処理を実行する(ステップS14)。検索装置100は、検索処理において、検索クエリと、銘柄又はキーワードとが完全一致又は部分一致するか否かを判定する。そして、検索装置100は、検索クエリと銘柄又はキーワードとが完全一致又は部分一致する場合には、キーワードに関連付けられている銘柄を検索結果としてユーザ端末10に応答する(ステップS15)。
上記のように、検索装置100は、検索処理において、検索クエリが銘柄と異なる場合であっても、検索クエリが銘柄に関連付けられているキーワードと一致することによって、検索結果を応答することができる。これにより、ユーザは、銘柄そのものを知らない場合であっても、自身が関心を持つ任意のキーワードを検索クエリとして検索装置100に送信することによって、キーワードと関連付けられている銘柄を検索することができる。
例えば、図1に示すように、検索装置100は、ユーザ端末10から「インフルエンザ」という検索クエリを受け付ける。そして、検索装置100は、保持するキーワードのうち、「インフルエンザ」が含まれているか否かを判定する。ここで、検索装置100は、保持するキーワードに「インフルエンザ」が含まれている場合には、キーワードである「インフルエンザ」と関連付けられている銘柄を検索結果として応答する。
このとき、検索装置100は、検索クエリに対応する検索結果として、検索ページ50に銘柄を表示させる。図1に示すように、検索ページ50には、検索クエリである「インフルエンザ」に対する検索結果として、銘柄である「薬剤メーカーAAA」や、「空気清浄器メーカーBBB」や、「乳酸菌食料品メーカーCCC」が順に表示される。これらの銘柄は、キーワード「インフルエンザ」に関連付けられた銘柄である。そして、検索ページ50には、銘柄とともに、銘柄に関連付けられているキーワードであって、「インフルエンザ」以外のキーワードも所定数だけ表示される。このため、ユーザは、検索ページ50に表示された銘柄に関する情報として、「インフルエンザ」以外の他のキーワードを知得することができる。
また、検索ページ50に表示されたキーワードには、キーワードの抽出元であるニュース記事40へのリンクが張られる。すなわち、ユーザは、検索ページ50に表示されたキーワードをクリックすることにより、キーワードの抽出元であるニュース記事40を閲覧することができる。このため、ユーザは、どのようなニュースに基づいて、自身が送信した検索クエリにより当該銘柄が応答されたかという理由を知ることができる。
また、検索装置100は、検索ページ50に検索結果を表示させる際には、検索クエリと、銘柄又はキーワードとの関係性に基づいて所定のスコアを算出し、算出されたスコアの順に銘柄を表示させる。すなわち、検索装置100は、特に検索クエリとの関連性が高いと判定される銘柄については、検索結果として上位に表示させる。図1の例では、検索装置100は、検索クエリ「インフルエンザ」に対して、「薬剤メーカーAAA」の方が、「空気清浄器メーカーBBB」や「乳酸菌食料品メーカーCCC」よりも関連性が高いと判定し、「薬剤メーカーAAA」に対して高いスコアを算出している。このため、検索装置100は、検索ページ50における検索結果として、「薬剤メーカーAAA」を、「空気清浄器メーカーBBB」や「乳酸菌食料品メーカーCCC」よりも上位に表示させる。
このように、実施形態に係る検索装置100は、ニュース記事40の中から、キーワードと銘柄とを関連付けて抽出する。そして、検索装置100は、提供する検索サービスにおいて、ユーザが任意に指定可能な検索クエリを受け付ける。そして、検索装置100は、ニュース記事40から抽出された銘柄又はキーワードと、受け付けられた検索クエリの全部又は一部とが一致する場合には、検索クエリに対する検索結果として、キーワードと関連付けられている銘柄をユーザに応答する。
すなわち、実施形態に係る検索装置100は、日々提供されるニュース記事から、注目度の高いキーワードと銘柄とを関連付けて抽出する。そして、検索装置100は、抽出したキーワードと銘柄とを関連付けて所定の記憶部に格納する。これにより、検索装置100は、一般ユーザからの注目度が高いような出来事等の事象と、事象に関連する銘柄とを対応付けて保持することができる。そして、検索装置100は、ユーザが関心を持つ用語を検索クエリとして受け付けることにより、ユーザの関心に適合するような銘柄を検索することができる。このため、検索装置100は、通常、ユーザが検索でたどりつきにくい銘柄をユーザに応答することができる。結果として、検索装置100によれば、投資対象をユーザの関心に応じて有用に拡張することができる。
〔2.検索装置の構成〕
次に、図2を用いて、実施形態に係る検索装置100の構成について説明する。図2は、実施形態に係る検索装置100の構成例を示す図である。図2に示すように、検索装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、検索装置100は、検索装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。かかる通信部110は、ネットワークNと有線又は無線で接続され、ネットワークNを介して、ユーザ端末10やニュースデータサーバ20との間で情報の送受信を行う。
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、ニュースデータ記憶部121と、検索情報記憶部122と、キーワード記憶部123と、スコア算出情報記憶部124とを有する。以下、各記憶部について順に説明する。
(ニュースデータ記憶部121について)
ニュースデータ記憶部121は、ニュースデータサーバ20から入稿されるニュースに関する情報を記憶する。ここで、図3に、実施形態に係るニュースデータ記憶部121の一例を示す。図3に示すように、ニュースデータ記憶部121は、「ニュースID」、「配信期間」、「CP」、「掲載銘柄」、「ニュースデータ」といった項目を有する。
「ニュースID」は、検索装置100に入稿されたニュース記事を識別するための識別情報を示す。「配信期間」は、ニュース記事の配信期間を示す。配信期間が経過したニュースに関しては、ニュースデータを利用できなくなる場合や、当該ニュースへのリンクが無効となる場合がある。
「CP」は、ニュース記事を報道機関等に提供するCPの識別情報を示す。CPにより提供されるニュースは、CP毎に配信期間が異なる場合がある。「掲載銘柄」は、ニュース記事に掲載されている銘柄を示す。ニュース記事によっては、複数の銘柄が含まれる場合がある。「ニュースデータ」は、ニュース記事に含まれるデータを示す。ニュースデータは、例えば、ニュース記事を構成するテキストデータである。図3の例では、ニュースデータをニュースに含まれる名詞で示しているが、この例に限られず、ニュースデータ記憶部121に記憶されるニュースデータは、ニュース記事に含まれる全てのテキストデータであってもよい。
すなわち、図3では、データの一例として、ニュースID「N001」で識別されるニュース記事が、配信期間が「2014年10月8日9時00分〜2014年10月22日9時00分」であり、ニュースの提供元は「CP01」であり、掲載されている銘柄は「AAA」社であり、含まれるニュースデータは「インフルエンザ、特効薬YYY、検査、医療機関、・・・」であることを示している。
(検索情報記憶部122について)
検索情報記憶部122は、検索サービスにおける検索に関する情報を記憶する。ここで、図4に、実施形態に係る検索情報記憶部122の一例を示す。図4に示すように、検索情報記憶部122は、「検索クエリID」、「検索クエリ」、「直近検索回数」といった項目を有する。
「検索クエリID」は、検索クエリを識別するための識別情報を示す。「検索クエリ」は、検索クエリIDに対応する検索クエリを示す。図4の例では、検索クエリが一つの単語である例を示しているが、検索クエリIDに対応する検索クエリは、複数の単語から構成されていてもよい。
「直近検索回数」は、所定の期間内に、検索サービスで検索クエリとして使用された回数を示す。所定の期間は、例えば、検索装置100によって自動的に設定されてもよいし(例えば、直近1週間など)、検索装置100の管理者によって設定されてもよい。
すなわち、図4では、データの一例として、検索クエリID「Q001」で識別される検索クエリが「インフルエンザ」であり、かかる検索クエリの直近検索回数が「13520」回であることを示している。
なお、図4では図示を省略しているが、検索情報記憶部122には、直近検索回数だけではなく、検索回数の累計数が記憶されてもよい。そして、検索装置100は、直近検索回数だけではなく、検索の累積数を用いて、後述する処理を実行してもよい。
(キーワード記憶部123について)
キーワード記憶部123は、ニュース記事から抽出された銘柄とキーワードとを関連付けて記憶する。ここで、図5に、実施形態に係るキーワード記憶部123の一例を示す。図5に示すように、キーワード記憶部123は、「銘柄コード」、「銘柄」、「キーワード」、「出現回数」といった項目を有する。
「銘柄コード」は、株式等の証券の取引に際して銘柄を識別するために付与される番号を示す。一般に、銘柄コードは、4桁の数字によって示される。「銘柄」は、株式等の取引において株式投資の対象となる銘柄名(例えば、企業名)を示す。
「キーワード」は、ニュース記事から抽出される単語であって、銘柄を特徴付けるものとして判定された単語である。例えば、キーワードは、ニュース記事に含まれる名詞であって、検索装置100によって所定の注目度を有すると判定された名詞である。「出現回数」は、検索装置100が保持するニュース記事において、キーワードが出現した回数を示す。ここでは、出現回数は、一つのニュース記事の中に、銘柄とキーワードが共起して出現した回数を「1」として計数する。すなわち、銘柄とキーワードが別々のニュース記事に出現した場合には、かかる銘柄に関連付けられたキーワードとしての出現回数は、計数されないものとする。
すなわち、図5では、データの一例として、銘柄コード「45xx」である銘柄「AAA」社に関連付けられているキーワードは「インフルエンザ」や、「特効薬YYY」や、「処方薬」などであって、それぞれの出現回数は「7」回、「6」回、「2」回であることを示している。
(スコア算出情報記憶部124について)
スコア算出情報記憶部124は、検索結果として表示される銘柄の表示順を決定するためのスコア算出に用いられる情報を記憶する。ここで、図6に、実施形態に係るスコア算出情報記憶部124の一例を示す。図6に示すように、スコア算出情報記憶部124は、「該当条件」、「加算スコア」といった項目を有する。
「該当条件」は、検索サービスにおいて、ユーザから送信された検索クエリにより銘柄が検索結果として表示されるための条件の類型を示す。言い換えれば、該当条件は、銘柄が検索結果として表示されるための、検索クエリと銘柄及びキーワードとが満たす関係性の類型を示す。
「加算スコア」は、検索クエリと、銘柄及びキーワードとが条件に該当した場合に、検索結果として表示される銘柄に加算されるスコアを示す。
すなわち、図6では、データの一例として、該当条件「市場拡張子付き銘柄コードに完全一致」を満たした銘柄には加算スコア「100000」が付与されることを示している。なお、市場拡張子付き銘柄コードとは、取引市場を示す拡張子を含めた銘柄コードのことであり、市場拡張子付き銘柄コードを指定して検索が実行された場合には、該当する銘柄には、他の検索条件と比較して極めて高いスコアが付与される。これは、ユーザにより指定された検索クエリと、銘柄との関連性が極めて高いものであることを示している。
また、図6では、他の例として、該当条件「ニュースキーワード完全一致」を満たした銘柄には、加算スコア「出現回数×100」が付与されることを示している。これにより、例えば、ユーザは、銘柄そのものを検索クエリとして指定しない場合であっても、検索クエリが銘柄に関連付けられているキーワードと一致することにより、検索クエリと関連性のある銘柄を検索結果として得ることができる。なお、図6では図示を省略しているが、該当条件としては、検索クエリがキーワードに完全一致する場合のみにスコアが加算されるのではなく、検索クエリがキーワードと部分一致する場合にもスコアが加算される場合があってもよい。
(制御部130について)
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、検索装置100内部の記憶装置に記憶されている各種プログラム(検索プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
実施形態に係る制御部130は、図2に示すように、取得部131と、抽出部132と、受付部133と、算出部134と、応答部135とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図2に示した接続関係に限られず、他の接続関係であってもよい。
(取得部131について)
取得部131は、ニュース記事の入稿を受け付け、受け付けたニュース記事に含まれるニュースデータを取得する。具体的には、実施形態に係る取得部131は、ニュース記事の提供元であるCPから、各CPが管理するニュースデータサーバ20を介して、ニュース記事を取得する。そして、取得部131は、取得したニュース記事に含まれるニュースデータをニュースデータ記憶部121に格納する。
(抽出部132について)
抽出部132は、ニュース記事の中から、キーワードと銘柄とを関連付けて抽出する。具体的には、実施形態に係る抽出部132は、キーワードの注目度に基づいて、取得部131によって取得されたニュース記事に含まれるテキストデータの中から、銘柄と、銘柄と共起しているキーワードとを抽出する。
例えば、抽出部132は、検索情報に基づいたキーワードの注目度に応じて、共起する銘柄を特徴付けるキーワードとして抽出するか否かを判定する。具体的には、抽出部132は、検索情報記憶部122に記憶されている検索クエリに関する情報を参照する。そして、抽出部132は、直近の検索回数が所定数以上である検索クエリと全体又は一部が一致するキーワードは注目度が高いキーワードであるとして、銘柄に関連付けるキーワードと判定する。これにより、抽出部132は、各ニュースデータに頻出するような一般的な単語についてはキーワードとして抽出せず、銘柄を特徴付ける単語のみをキーワードとして抽出することができる。
なお、抽出部132は、上記のように、検索情報に基づいて自動的にキーワードを抽出することができるので、取得部131がニュース記事を取得するたびに、取得されたニュース記事からキーワードを抽出してもよい。言い換えれば、抽出部132は、取得部131によってニュース記事が取得されたことを契機として、ニュース記事の取得時点におけるキーワードのお度に基づいて、キーワードと銘柄とを関連付けて抽出する。すなわち、抽出部132によれば、人為的な介入を要することなく、ニュース記事を取得した後、速やかに(例えば、ニュース記事を取得して1時間以内など)、ニュース記事の中から銘柄を特徴付けるキーワードを抽出することができる。
また、抽出部132は、ニュース記事の中から、キーワードと銘柄とを関連付けて抽出する処理において、キーワードの抽出処理と銘柄の抽出処理を分散させてもよい。例えば、抽出部132は、取得部131によって取得されたニュース記事のうち、キーワード「インフルエンザ」が含まれるニュース記事を抽出する。その後、抽出部132は、キーワード「インフルエンザ」に基づいて抽出されたニュース記事の中から、銘柄を抽出する。このように、抽出部132は、処理対象とするニュース記事から同時にキーワードと銘柄を抽出するのではなく、個別の処理によって、キーワードと銘柄とを関連付けて抽出してもよい。
また、抽出部132は、「インフルエンザ」のような特定のキーワードではなく、例えば、不特定のキーワードであって注目度の高いキーワードが含まれているニュース記事を抽出する処理を実行し、その後、抽出されたニュース記事に含まれている銘柄を抽出してもよい。これにより、抽出部132は、全てのニュース記事の中から銘柄とキーワードを順次抽出するよりも、効率よくキーワードと銘柄とを関連付けて抽出しうる。
そして、抽出部132は、ニュース記事から抽出した銘柄とキーワードとを関連付けて、キーワード記憶部123に記憶する。
(受付部133について)
受付部133は、ユーザが任意に指定可能な検索クエリを受け付ける。具体的には、実施形態に係る受付部133は、提供する検索ページ50において、ユーザ端末10から任意の検索クエリの入力を受け付ける。
そして、受付部133は、受け付けた検索クエリごとに付与される検索クエリIDに基づいて、検索回数に関する情報を検索情報記憶部122に記憶する。例えば、受付部133は、受け付けた検索クエリに関する情報が検索情報記憶部122に既に記憶されている場合には、かかる検索クエリの検索回数に「1」が加算されるように情報を更新する。
(算出部134について)
算出部134は、検索結果として表示させる銘柄のスコアを算出する。具体的には、実施形態に係る算出部134は、検索クエリと、ニュースデータ記憶部121に記憶されている銘柄及びキーワードとの全体又は一部が一致するか否か等の条件を判定することによって、銘柄毎のスコアを算出した上で、スコア順に列記された銘柄を検索結果として導出する。
例えば、算出部134は、スコア算出情報記憶部124に記憶されている条件と、条件ごとに設定されている加算スコアとに基づいて、銘柄ごとのスコアを算出する。なお、算出部134は、適宜、スコア算出情報記憶部124に記憶されている条件や加算スコアに関する情報を更新してもよい。
(応答部135について)
応答部135は、検索クエリに対する検索結果をユーザに応答する。具体的には、実施形態に係る応答部135は、抽出部132によって抽出されたキーワードと、受付部133によって受け付けられた検索クエリの全部又は一部とが一致する場合には、キーワードと関連付けられている銘柄を検索結果として、検索クエリを送信したユーザに応答する。この場合、応答部135は、例えば外部の株式情報を取り扱うサーバ等と連携することにより、検索結果である銘柄とあわせて、各銘柄の現在状況(例えば、検索処理時点での取引状況)をユーザに応答する。
ここで、応答部135は、算出部134によって算出されたスコアに基づいて選択した銘柄を検索結果として応答する。例えば、応答部135は、銘柄、又は銘柄に関連付けられているキーワードと、検索クエリとの関係性に基づいて算出される指標値であるスコアに基づいて、スコアの高い銘柄ほど優先的にユーザに応答する。言い換えれば、応答部135は、受付部133によって受け付けられた検索クエリに対応する銘柄が検索された場合には、各銘柄のスコアに基づき、スコア順に銘柄が検索ページ50に表示されるように、検索クエリに対する応答をユーザに対して行う。すなわち、応答部135は、スコアが高い銘柄ほど、検索ページ50における検索結果の上位に表示させる。
応答部135が表示させる銘柄順は、スコア算出情報記憶部124に記憶されている条件及び加算スコアを用いて算出部134によって算出されたスコアに基づく。すなわち、応答部135は、検索クエリと銘柄に設定された銘柄コードとが一致すること、検索クエリとキーワードとが一致すること、検索クエリと銘柄又はキーワードとが一致する文字数、検索クエリと一致するキーワードの注目度などの図6に示した該当条件のうち、少なくとも一つに基づいて算出されるスコア順に列記された銘柄をユーザに応答する。この場合、キーワードの注目度は、例えば、キーワードが検索クエリとして用いられた回数や、かかるキーワードがニュース記事に出現した回数により示される。
また、応答部135は、検索クエリに対応する銘柄のみならず、当該銘柄に関連付けられているキーワードを合わせてユーザに応答する。例えば、図1に示すように、検索ページ50には、検索された銘柄とともに、銘柄に関連付けられているキーワードが所定数だけ表示される。応答部135は、銘柄とともに表示させるキーワードについても、キーワードの注目度に基づいて表示順を決定する。例えば、応答部135は、注目度の高いキーワードとして、ニュース記事に出現した回数が多いほど、上位の表示順により応答ページ50に表示させる。応答ページ50において、上位の表示順とは、例えば、画面に向かって左側のことを示す。
この場合、応答部135は、抽出部132によって抽出されたキーワードと、受付部133によって受け付けられた検索クエリの全部又は一部とが一致する場合には、受け付けられた検索クエリを含むキーワードをユーザに応答する。例えば、銘柄に関連付けられているキーワードは、かかるキーワードのニュース記事における出現回数順に検索ページ50に表示されるので、ユーザが送信した検索クエリを含むキーワードが検索ページ50に表示されない場合もありうる。例えば、ユーザが送信した検索クエリが比較的珍しい用語であり、銘柄に関連付けられているキーワードのうち、上位の所定数に該当しないキーワードであった場合、銘柄は検索されたとしても、検索クエリを含むキーワードが検索ページ50に表示されない可能性がある。この場合には、ユーザは、なぜ銘柄が検索されたかの理由を知ることができないことになる。
そこで、応答部135は、上記の場合には、検索クエリを含むキーワードを優先的に表示させることにより、ユーザに対して、なぜ当該銘柄が検索されたのかを明らかにする。例えば、応答部135は、検索クエリに対応するキーワードが所定の銘柄に関連付けられているキーワードであって、かかるキーワードの表示順が6番以下のキーワードであった場合、当該検索クエリに対応するキーワードを他のキーワードよりも優先させて、5番目の表示順に表示させるように調整する。すなわち、表示順位が低いキーワードであっても、かかるキーワードが検索クエリとして銘柄を抽出させた契機となった場合には、応答部135は、かかるキーワードを応答ページ50に表示させるように表示順を調整する。これにより、ユーザは、当該銘柄にどのようなキーワードが関連付けられていたか、また、ユーザは、なぜ当該銘柄が検索されたのかの理由を知ることができる。
また、応答部135は、キーワードの抽出元であるニュース記事へのリンクが設定されたキーワードを、キーワードと関連付けられている銘柄とともにユーザに応答する。これにより、ユーザは、銘柄が表示されるとともに、なぜ当該銘柄が検索結果として表示されることとなったかの根拠となるキーワードや、当該銘柄及びキーワードの抽出元となるニュース記事を確認することができる。
また、応答部135は、検索結果として、銘柄とともに、受付部133によって受け付けられた検索クエリの全部又は一部とが一致しないキーワードであって、銘柄に関連付けられているキーワードのうち、所定数のキーワード(例えば、検索クエリとして用いられたキーワードを含めた5つのキーワード)をユーザに応答してもよい。すなわち、応答部135は、検索処理に用いられなかったキーワードであって、銘柄に関連付けられているキーワードについても、当該銘柄を表示させる場合に、あわせて検索ページ50に表示させることができる。図1の例でいえば、銘柄「薬剤メーカーAAA」が検索クエリ「インフルエンザ」によって検索された場合であっても、応答部135は、銘柄「薬剤メーカーAAA」に関連付けられている他のキーワードである「特効薬YYY」や、「処方薬」などのキーワードも、銘柄とともに表示させる。これにより、ユーザは、ユーザ自身が検索クエリに指定したキーワード以外のキーワードであって、当該銘柄に関連付けられているキーワードを知得することができる。例えば、ユーザは、表示されたキーワードをクリックすることによって、当該銘柄に関係するニュース記事を閲覧することができるので、当該銘柄に関する情報をさらに知得することが可能となる。
〔3.処理手順〕
次に、図7を用いて、実施形態に係る検索装置100による抽出処理の手順について説明する。図7は、実施形態に係る検索装置100による抽出処理手順を示すフローチャートである。
図7に示すように、検索装置100に係る取得部131は、ニュースデータサーバ20からニュースデータを取得する(ステップS101)。そして、抽出部132は、取得されたニュースデータの中から、銘柄と銘柄を特徴付けるキーワードとを抽出する(ステップS102)。
そして、抽出部132は、抽出した銘柄とキーワードとを関連付けて、キーワード記憶部123に格納する(ステップS103)。検索装置100は、かかる処理を繰り返すことにより、ニュースデータから抽出される銘柄とキーワードとに関する情報をキーワード記憶部123に蓄積する。
次に、図8を用いて、実施形態に係る検索装置100による検索処理の手順について説明する。図8は、実施形態に係る検索装置100による検索処理手順を示すフローチャートである。
図8に示すように、検索装置100に係る受付部133は、ユーザ端末10から検索クエリを受け付けたか否かを判定する(ステップS201)。受付部133は、検索クエリを受け付けていない場合には(ステップS201;No)、受け付けるまで待機する。
一方、受付部133によって検索クエリが受け付けられた場合には(ステップS201;Yes)、受付部133は、受け付けた検索クエリに関する情報を算出部134に通知する。
続いて、算出部134は、受付部133によって受け付けられた検索クエリに基づいて、検索処理を実行する。具体的には、算出部134は、検索クエリに対応するキーワードに関連付けられた銘柄を検索する(ステップS202)。そして、算出部134は、検索された銘柄ごとに、検索クエリとの関係に基づいて、スコアを算出する(ステップS203)。
そして、応答部135は、算出部134によって算出されたスコアに基づいて表示順が付与された銘柄情報を、検索結果としてユーザに応答する(ステップS204)。
〔4.変形例〕
上述した実施形態に係る検索装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、上記の検索装置100の他の実施形態について説明する。
〔4−1.関連語の提供〕
応答部135は、検索結果として検索クエリに対応する銘柄を応答する際に、銘柄ごとに予め設定された語句をあわせてユーザに応答してもよい。具体的には、ユーザから送信された検索クエリによって、銘柄「自動車メーカーDDD」が検索されたとする。ここで、自動車メーカーDDDには、予め、関連語句として、「水素エンジン」や、「ブレーキ」や、「自動車照明」などが設定されていたとする。この場合、応答部135は、検索結果としての銘柄「自動車メーカーDDD」とともに、関連語句である「水素エンジン」や、「ブレーキ」や、「自動車照明」を、検索ページ50に表示させる。このとき、応答部135は、かかる関連語句に、関連語句が含まれるニュース記事へのリンクを張ってもよい。これにより、ユーザは、検索された銘柄のみならず、予め設定された関連語句にさらに関連するニュース記事や、ニュース記事に含まれる銘柄を知得できるので、より投資対象を拡張させることができる。
なお、応答部135は、表示する関連語句については、必ずしも予め設定されている語句ではなく、他の語句を表示させてもよい。例えば、ニュース記事としては出現回数が少ないものの、短期間(例えば、直近数時間以内)に極めて多くの回数、一般ユーザから当該銘柄とともに検索された語句などを、当該銘柄の関連語句として表示してもよい。このように、応答部135は、銘柄に関連する語句を種々の手法によってユーザに提示することができるので、ユーザの投資対象を効率良く拡張させることができる。また、応答部135は、関連語句とは別に、例えば、検索された銘柄に対応する企業と資本関係にある企業名などを表示させてもよい。この場合、表示される企業は、上場企業に限られず、非上場企業について表示させてもよい。
〔4−2.注目度〕
上記の実施形態では、抽出部132が、ニュース記事に含まれる単語について、検索クエリとして用いられた回数に基づいて、銘柄に関連付けるキーワードとして抽出するか否かを判定する例を示した。ここで、抽出部132は、キーワードに関する注目度の判定については、上記の例に限らず、他の要素により判定してもよい。
例えば、抽出部132は、所定のキーワードについて、ニュース記事中に出現する回数が多いキーワードほど、銘柄と関連付けられるキーワードとして優先的に抽出してもよい。すなわち、抽出部132は、取得部131によって取得されるニュース記事について、キーワードが出現する回数を計数し、かかる出現回数をキーワードの注目度とする。そして、抽出部132は、各キーワードの注目度を判定し、注目度の高いキーワードから優先的に銘柄に関連付けるキーワードとして抽出する。これにより、抽出部132は、検索サービスに係る情報によらずとも、一般社会において注目されているキーワードを適切に抽出することができる。
〔4−3.CP〕
上記の実施形態では、検索装置100が、各CPから提供されるニュース記事に基づいて銘柄及びキーワードを抽出し、抽出された銘柄及びキーワードを検索処理に用いる例を示した。ここで、検索装置100は、ニュース記事の提供元であるCPに関して、特定のCPから提供されるニュース記事を優先的に用いて検索処理を実行してもよい。
この場合、抽出部132は、ニュース記事を提供した提供元であるCPに関する情報とともに、キーワードと銘柄とを関連付けて抽出する。そして、応答部135は、ニュース記事を提供した提供元であるCPに関する指定を受け付けた場合には、指定されたCPから提供されたニュース記事から抽出された銘柄を優先的に応答する。
CPには、例えば、特定の業界のニュースに関して、他のCPに比べて正確な情報を報道することができる場合がある。また、ユーザによっては、検索に用いられるニュース記事について、CPを指定し、自身の信頼するCPから提供されたニュース記事を用いて銘柄を検索したいという欲求がある場合がある。検索装置100によれば、例えば、ユーザからCPの指定を受け付けることにより、指定されたCPから提供されたニュース記事から抽出された銘柄を優先的に応答する等の対応をとることができるため、ユーザビリティの高い検索サービスを提供することができる。
〔4−4.不適切なキーワード〕
上記の実施形態では、抽出部132が、キーワードの注目度に基づいて、ニュース記事の中から、キーワードと銘柄とを関連付けて抽出する例を示した。ここで、抽出部132は、キーワードの注目度に基づいてキーワードを抽出する場合、検索処理に用いるキーワードとして適切でないキーワードが抽出される場合がある。
例えば、銘柄を特徴付けるキーワードとして不適切なキーワード(例えば、当該銘柄により示される企業を中傷するようなキーワード)が銘柄と関連付けられた場合、不適切なキーワードがユーザから入力されることにより、当該銘柄が検索されることとなり、銘柄により示される企業として受け入れがたい状況を招来しうる。この場合、検索装置100は、予め、銘柄を特徴付けるキーワードとして適切でない単語を設定しておくことで、かかる不適切なキーワードを銘柄に関連付けられるキーワードとしては抽出されないようにすることができる。これにより、検索装置100は、検索される企業側にとっても適切な検索サービスを提供することができる。
〔4−5.注目株〕
応答部135は、検索結果として検索クエリに対応する銘柄を応答する際に、銘柄やキーワードとあわせて、「注目株」を示した情報を応答してもよい。「注目株」の表示は、例えば、直近数日以内に配信されたニュース記事において、特に出現回数が他の銘柄よりも多い銘柄等に付与される。
また、「注目株」の表示は、ニュース記事のみならず、例えば、検索サービスにおける検索クエリ数を用いてもよい。この場合、応答部135は、所定の期間内に、他の期間と比較して、特定の銘柄が検索クエリとして入力された回数が極めて多い場合(例えば、他の期間の数倍など)には、検索結果としてかかる銘柄を表示させる際に、「注目株」の表示をあわせて表示させる。また、応答部135は、外部の株式情報提供サーバなどと連携し、特に、直近数日の間に値動きが激しい銘柄について、「注目株」の表示をあわせて表示させてもよい。これにより、検索装置100は、ユーザにより有用な銘柄情報を提供することができる。
〔4−6.配信期間〕
上記の実施形態では、取得部131が取得するニュース記事については配信期間が存在する例を示した。また、ニュースデータ記憶部121は、ニュース記事に関する配信期間を記憶する例を示した。ここで、ニュース記事の配信期間によっては、1年前のニュース記事などから抽出されるキーワードや銘柄が検索される場合がある。この場合、検索装置100は、例えば、各CPから提供される配信期間の異なるニュース記事について、所定の期間内のニュース記事のみを検索処理に用いるようにしてもよい。例えば、検索装置100は、検索処理の実行時点において、ニュース記事の配信開始から直近2週間以内であるニュース記事のみを検索処理に用いることができる。これにより、検索装置100は、検索処理に用いるニュース記事の新鮮さを担保することができる。なお、検索装置100は、CPごとに、ニュース記事を検索処理に用いる期間を設定してもよい。例えば、検索装置100は、ニュース記事に信頼のおけるCPに関しては、ニュース記事を検索処理に用いる期間を長くするような設定を行ってもよい。
〔4−7.注目度との連動〕
検索装置100は、新しいニュース記事から抽出されたキーワードほど、当該キーワードに関連付けられている銘柄が検索されやすくするような重み付けを設定してもよい。例えば、検索装置100は、配信から24時間以内のニュース記事から抽出されたキーワードについては、上記の算出処理において、検索クエリと一致した場合の加算スコアを、他のキーワードよりも高くすることにより、比較的新しいニュース記事から抽出されたキーワードに重み付けをすることができる。この場合、かかるキーワードに関連付けられた銘柄は、通常よりも高いスコアが算出されるので、検索結果の上位に表示されやすくなる。これにより、ユーザは、現時点で社会的な注目が高まっているキーワードについて検索した場合に、かかるキーワードと関連する銘柄を検索しやすくなる。このため、ユーザは、投資対象を適切に拡張させることができる。
〔4−8.記事〕
上記の実施形態では、取得部131は、情報媒体に掲載された記事の一例として、ニュース記事を取得する例を示した。しかし、情報媒体に掲載された記事は、ニュース記事に限られない。例えば、情報媒体に掲載された記事は、テキストデータによって構成される記事であって、インターネット上のファイナンスに関する掲示板に投稿された記事や、掲示板に類する情報サイトに掲載された記事であってもよい。また、ニュース記事は、最新の情報や出来事の報道のみならず、例えば、ニュースサイトに掲載されるコラムなどであってもよい。なお、情報媒体とは、ネットワークを介して利用されるウェブサイトが想定されるが、記事をテキストデータとして表示可能な媒体であれば、ウェブサイトに限られない。例えば、新聞紙面の内容が表示されるディスプレイや、ニュースが配信される電光掲示板などであれば、テキストデータを表示する情報媒体となりうる。
〔4−9.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
例えば、図2に示したニュースデータ記憶部121や、検索情報記憶部122や、キーワード記憶部123や、スコア算出情報記憶部124は、検索装置100が保持せずに、ストレージサーバ等に保持されてもよい。この場合、検索装置100は、ストレージサーバにアクセスすることで、ニュースデータや、銘柄情報や、検索情報等を取得する。
また、例えば、上述してきた検索装置100は、ニュースデータを取得したり、検索クエリを受け付けたりといった、外部装置とのやりとりを中心に実行するフロントエンドサーバ側と、検索処理などを実行するバックエンドサーバ側に分散されてもよい。
〔5.ハードウェア構成〕
また、上述してきた実施形態に係る検索装置100は、例えば図8に示すような構成のコンピュータ1000によって実現される。図8は、検索装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(ネットワークNに対応する)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が検索装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内の各データが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網500を介してこれらのプログラムを取得してもよい。
〔6.効果〕
上述してきたように、実施形態に係る検索装置100は、ニュース記事の中から、キーワードと銘柄とを関連付けて抽出する抽出部132と、ユーザが任意に指定可能な検索クエリを受け付ける受付部133と、抽出部132によって抽出されたキーワードと、受付部133によって受け付けられた検索クエリの全部又は一部とが一致する場合には、検索クエリに対する検索結果として、キーワードと関連付けられている銘柄をユーザに応答する応答部135と、を有する。
このように、実施形態に係る検索装置100は、日々提供されるニュース記事から、キーワードと銘柄とを関連付けて抽出する。そして、検索装置100は、例えば、ユーザが関心を持つ用語を検索クエリとして受け付けることにより、ユーザの関心に適合するような銘柄を検索することができる。このため、検索装置100は、通常、ユーザが検索によってはたどりつきにくい銘柄をユーザに応答することができる。結果として、検索装置100によれば、投資対象をユーザの関心に応じて有用に拡張することができる。
また、応答部135は、銘柄又はキーワードと検索クエリとの関係性に基づいて算出される指標値であるスコアに基づき選択された銘柄を、ユーザに応答する。例えば、応答部135は、キーワードと検索クエリとが完全一致又は部分一致する場合に、キーワードの注目度が高いほど高く算出されるスコアを用いて、スコアの高い銘柄ほど優先的にユーザに応答する。
これにより、実施形態に係る検索装置100は、検索結果を適切にユーザに提示することができる。例えば、検索装置100は、ユーザから送信された検索クエリとキーワードが一致する場合には、かかるキーワードに関連付けられている銘柄を検索結果の上位に表示させる。このため、検索装置100は、ユーザにとって利便性の高い検索サービスを提供することができる。
また、応答部135は、銘柄とともに、銘柄ごとに予め設定された語句、又は、検索クエリに関連する語句をユーザに応答する。
これにより、実施形態に係る検索装置100は、検索結果を表示する際に、検索結果である銘柄のみならず、銘柄に関連する情報や、検索クエリに関連する情報をユーザに提示することができる。このため、検索装置100は、一般の検索サービスに比べて、ユーザの投資対象を拡張することができる。
また、応答部135は、銘柄とともに、銘柄に関連付けられているキーワードであって、受付部133によって受け付けられた検索クエリを含むキーワードをユーザに応答する。
これにより、実施形態に係る検索装置100は、検索結果を表示する際に、なぜユーザが送信した検索クエリによって当該銘柄が検索されたのかの理由を示すことができる。このため、検索装置100によれば、ユーザが当該銘柄に関する情報を取得しやすくなったり、ユーザの当該銘柄への関心を向上させたりすることができる。
また、応答部135は、銘柄とともに、受付部133によって受け付けられた検索クエリの全部又は一部とが一致しないキーワードであって、銘柄に関連付けられているキーワードのうち、所定数のキーワードをユーザに応答する。
このように、実施形態に係る検索装置100は、検索結果を表示する際に、検索結果である銘柄や、検索クエリを含むキーワードのみならず、銘柄に関連付けられている他のキーワードをユーザに提示する。このため、ユーザは、当該銘柄に関連付けられているキーワードであって、ユーザが知り得なかった情報や、通常想定しえなかった意外なキーワードを知得することができる。これにより、検索装置100は、ユーザにとって投資対象の幅を拡張する契機を与えることができる。
また、応答部135は、銘柄とともに、銘柄に関連付けられているキーワードの抽出元であるニュース記事へのリンクが設定されたキーワードをユーザに応答する。
このように、実施形態に係る検索装置100は、検索結果を表示する際に、リンクの張られたキーワードをユーザに提示する。これにより、ユーザは、検索ページ50において提示されたキーワードをクリックすることのみで、銘柄が検索された根拠となったニュース記事を閲覧することができる。このため、検索装置100によれば、検索サービスを利用するユーザのユーザビリティを向上させることができる。
また、抽出部132は、検索クエリとして用いられた回数、又は、ニュース記事中に出現する回数が多いキーワードほど、銘柄と関連付けられるキーワードとして優先的に抽出する。
このように、実施形態に係る検索装置100は、キーワードの注目度を考慮した上で、銘柄に関連付けられるキーワードを抽出する。このため、検索装置100によれば、社会情勢や、世間の注目度に沿った指標により抽出されたキーワードと、銘柄とを関連付けることができるので、検索サービスにおいて、より適切な銘柄を検索することができる。
また、抽出部132は、ニュース記事を提供した提供元であるCPに関する情報とともに、キーワードと銘柄とを関連付けて抽出する。そして、応答部135は、ニュース記事を提供したCPに関する指定を受け付けた場合には、指定されたCPから提供されたニュース記事から抽出された銘柄を優先的に応答する。
このように、実施形態に係る検索装置100は、特定のCPから提供されるニュース記事から抽出された銘柄及びキーワードを優先的にユーザに応答することができる。このため、例えば、ユーザは、自身の信頼するCPから提供されるニュース記事のみを検索処理に用いたりするといったユーザカスタマイズを実現することができる。また、検索装置100は、例えば、特定の業界に精通したCPから提供されるニュース記事のみを検索処理に用いることなどにより、より信頼性の高い検索サービスをユーザに提供することができる。
また、実施形態に係る検索装置100は、ニュース記事を取得する取得部131をさらに備える。また、抽出部132は、取得部131によってニュース記事が取得されたことを契機として、ニュース記事の取得時点におけるキーワードの注目度に基づいて、キーワードと銘柄とを関連付けて抽出する。
このように、実施形態に係る検索装置100は、ニュース記事が取得されるたびに、自動的にキーワードを抽出することができる。このため、検索装置100によれば、人為的な介入を要することなく、ニュース記事を取得した後、速やかにニュース記事の中から銘柄を特徴付けるキーワードを抽出することができる。このため、検索装置100によれば、随時配信され続けるニュース記事に対して、常に最新のキーワードや銘柄を情報として取得することができるので、ユーザに対して、時事に則した適切な検索サービスを提供することができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述した検索装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
また、特許請求の範囲に記載した「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、応答部は、応答手段や応答回路に読み替えることができる。
1 検索システム
10 ユーザ端末
20 ニュースデータサーバ
100 検索装置
110 通信部
120 記憶部
121 ニュースデータ記憶部
122 検索情報記憶部
123 キーワード記憶部
124 スコア算出情報記憶部
130 制御部
131 取得部
132 抽出部
133 受付部
134 算出部
135 応答部

Claims (12)

  1. 配信される期間が予め設けられる記事であって、情報媒体に掲載された前記記事の中から、キーワードと銘柄とを関連付けて抽出する抽出部と、
    ユーザが任意に指定可能な検索クエリを受け付ける受付部と、
    前記記事が配信される期間において、前記抽出部によって抽出されたキーワードと、前記受付部によって受け付けられた検索クエリの全部又は一部とが一致する場合には、当該検索クエリに対する検索結果として、前記キーワードと関連付けられている銘柄と、当該銘柄に関連付けられているキーワードであって、当該銘柄の検索に用いられたキーワードとは異なる他のキーワードを前記ユーザに応答する応答部と、
    を備えたことを特徴とする検索装置。
  2. 前記応答部は、
    前記キーワードと、前記検索クエリとの関係性に基づいて算出される指標値に基づき選択された当該銘柄を前記ユーザに応答する、
    ことを特徴とする請求項に記載の検索装置。
  3. 前記応答部は、
    前記キーワードと前記検索クエリとが完全一致又は部分一致する場合に、当該キーワードの注目度が高いほど高く算出される前記指標値を用いて、当該指標値の高い銘柄ほど優先的に前記ユーザに応答する、
    ことを特徴とする請求項に記載の検索装置。
  4. 情報媒体に掲載された記事の中から、キーワードと銘柄とを関連付けて抽出する抽出部と、
    ユーザが任意に指定可能な検索クエリを受け付ける受付部と、
    前記抽出部によって抽出されたキーワードと、前記受付部によって受け付けられた検索クエリの全部又は一部とが一致する場合には、当該検索クエリに対する検索結果として、前記キーワードと関連付けられている銘柄であって、当該キーワードと当該検索クエリとの関係性に基づいて算出される指標値に基づき選択される銘柄を前記ユーザに応答する応答部と、
    を備え、
    前記応答部は、
    前記キーワードと前記検索クエリとが完全一致又は部分一致する場合に、当該キーワードの注目度が高いほど高く算出される前記指標値を用いて、当該指標値の高い銘柄ほど優先的に前記ユーザに応答する、
    ことを特徴とする検索装置。
  5. 前記応答部は、
    前記銘柄とともに、前記銘柄ごとに予め設定された語句、又は、前記検索クエリに関連する語句を前記ユーザに応答する、
    ことを特徴とする請求項1〜のいずれか一つに記載の検索装置。
  6. 前記応答部は、
    前記銘柄とともに、前記銘柄に関連付けられているキーワードであって、前記受付部によって受け付けられた検索クエリを含むキーワードを前記ユーザに応答する、
    ことを特徴とする請求項1〜のいずれか一つに記載の検索装置。
  7. 前記応答部は、
    前記銘柄とともに、当該銘柄に関連付けられているキーワードの抽出元である前記情報媒体に掲載された記事へのリンクが設定された当該キーワードを前記ユーザに応答する、
    ことを特徴とする請求項1〜のいずれか一つに記載の検索装置。
  8. 前記抽出部は、
    検索クエリとして用いられた回数、又は、前記情報媒体に掲載された記事中に出現する回数が多いキーワードほど、銘柄と関連付けられるキーワードとして優先的に抽出する、
    ことを特徴とする請求項1〜のいずれか一つに記載の検索装置。
  9. 前記抽出部は、
    前記情報媒体に掲載された記事を提供した提供元に関する情報とともに、前記キーワードと銘柄とを関連付けて抽出し、
    前記応答部は、
    前記提供元に関する指定を受け付けた場合には、指定された提供元から提供された記事から抽出された銘柄を優先的に応答する、
    ことを特徴とする請求項1〜のいずれか一つに記載の検索装置。
  10. 前記情報媒体に掲載された記事を取得する取得部をさらに備え、
    前記抽出部は、
    前記取得部によって情報媒体に掲載された記事が取得されたことを契機として、当該記事の取得時点における前記キーワードの注目度に基づいて、前記キーワードと銘柄とを関連付けて抽出する、
    ことを特徴とする請求項1〜のいずれか一つに記載の検索装置。
  11. コンピュータが実行する検索方法であって、
    配信される期間が予め設けられる記事であって、情報媒体に掲載された前記記事の中から、キーワードと銘柄とを関連付けて抽出する抽出工程と、
    ユーザが任意に指定可能な検索クエリを受け付ける受付工程と、
    前記記事が配信される期間において、前記抽出工程によって抽出されたキーワードと、前記受付工程によって受け付けられた検索クエリの全部又は一部とが一致する場合には、当該検索クエリに対する検索結果として、前記キーワードと関連付けられている銘柄と、当該銘柄に関連付けられているキーワードであって、当該銘柄の検索に用いられたキーワードとは異なる他のキーワードを前記ユーザに応答する応答工程と、
    を含んだことを特徴とする検索方法。
  12. 配信される期間が予め設けられる記事であって、情報媒体に掲載された前記記事の中から、キーワードと銘柄とを関連付けて抽出する抽出手順と、
    ユーザが任意に指定可能な検索クエリを受け付ける受付手順と、
    前記記事が配信される期間において、前記抽出手順によって抽出されたキーワードと、前記受付手順によって受け付けられた検索クエリの全部又は一部とが一致する場合には、当該検索クエリに対する検索結果として、前記キーワードと関連付けられている銘柄と、当該銘柄に関連付けられているキーワードであって、当該銘柄の検索に用いられたキーワードとは異なる他のキーワードを前記ユーザに応答する応答手順と、
    をコンピュータに実行させることを特徴とする検索プログラム。
JP2014213921A 2014-10-20 2014-10-20 検索装置、検索方法及び検索プログラム Active JP5855202B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014213921A JP5855202B1 (ja) 2014-10-20 2014-10-20 検索装置、検索方法及び検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014213921A JP5855202B1 (ja) 2014-10-20 2014-10-20 検索装置、検索方法及び検索プログラム

Publications (2)

Publication Number Publication Date
JP5855202B1 true JP5855202B1 (ja) 2016-02-09
JP2016081388A JP2016081388A (ja) 2016-05-16

Family

ID=55269172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014213921A Active JP5855202B1 (ja) 2014-10-20 2014-10-20 検索装置、検索方法及び検索プログラム

Country Status (1)

Country Link
JP (1) JP5855202B1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6480995B1 (ja) * 2017-09-01 2019-03-13 ヤフー株式会社 情報表示プログラム、情報表示方法、端末装置、および配信装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS641030A (en) * 1987-06-24 1989-01-05 Canon Inc File retrieval system
JP2003030213A (ja) * 2001-07-16 2003-01-31 Hitachi Kokusai Electric Inc 情報表示装置
JP2003162639A (ja) * 2001-11-28 2003-06-06 Fujitsu Ltd 銘柄選択支援装置
JP2008107929A (ja) * 2006-10-23 2008-05-08 Jiji Press Ltd 株式投資銘柄情報提供システム
JP2009122807A (ja) * 2007-11-13 2009-06-04 Nomura Securities Co Ltd 連想検索システム
JP2010282512A (ja) * 2009-06-05 2010-12-16 Hitachi Information & Control Solutions Ltd 株価情報提供装置及び端末装置
JP2013012172A (ja) * 2011-06-03 2013-01-17 Toshiba Corp 株取引知見抽出装置、知見更新装置、及びプログラム
JP2013020411A (ja) * 2011-07-11 2013-01-31 Sony Corp 情報処理装置、情報処理方法及びプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS641030A (en) * 1987-06-24 1989-01-05 Canon Inc File retrieval system
JP2003030213A (ja) * 2001-07-16 2003-01-31 Hitachi Kokusai Electric Inc 情報表示装置
JP2003162639A (ja) * 2001-11-28 2003-06-06 Fujitsu Ltd 銘柄選択支援装置
JP2008107929A (ja) * 2006-10-23 2008-05-08 Jiji Press Ltd 株式投資銘柄情報提供システム
JP2009122807A (ja) * 2007-11-13 2009-06-04 Nomura Securities Co Ltd 連想検索システム
JP2010282512A (ja) * 2009-06-05 2010-12-16 Hitachi Information & Control Solutions Ltd 株価情報提供装置及び端末装置
JP2013012172A (ja) * 2011-06-03 2013-01-17 Toshiba Corp 株取引知見抽出装置、知見更新装置、及びプログラム
JP2013020411A (ja) * 2011-07-11 2013-01-31 Sony Corp 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP2016081388A (ja) 2016-05-16

Similar Documents

Publication Publication Date Title
US10235464B2 (en) Method and apparatus for recommending hashtags
US9965522B2 (en) Mobile application search ranking
US8548996B2 (en) Ranking content items related to an event
US20210232633A1 (en) Indexing and presenting content using latent interests
JP4947477B1 (ja) レコメンド装置、レコメンド方法およびレコメンドプログラム
US20140244532A1 (en) Candidate and job trending in employment system
WO2015002830A1 (en) Social network for employment search
US20140129460A1 (en) Social network for employment search
JP6336189B1 (ja) 決定装置、決定方法及び決定プログラム
US8972398B1 (en) Integrating online search results and social networks
JP5815108B1 (ja) 配信装置、配信方法
JP2012150563A (ja) 商品推薦装置及び方法及びプログラム
JP2008217674A (ja) 情報処理システム、情報処理方法、サーバコンピュータおよびプログラム
JP6111557B2 (ja) 情報提供システム
JP5296745B2 (ja) クエリサジェスチョン提供装置及び方法
JP2016110624A (ja) 配信装置、配信方法
JP5855202B1 (ja) 検索装置、検索方法及び検索プログラム
US10387838B2 (en) Course ingestion and recommendation
JP2017162275A (ja) 情報処理装置、情報処理方法及びプログラム
JP6019156B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP6913596B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2018067193A (ja) 抽出装置、抽出方法および抽出プログラム
JP2008107929A (ja) 株式投資銘柄情報提供システム
JP2012194900A (ja) プロフィールマッチング装置及び方法
JP7413423B2 (ja) 情報処理システム、および情報処理方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151208

R150 Certificate of patent or registration of utility model

Ref document number: 5855202

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350