JP4366062B2 - 連想検索システム - Google Patents
連想検索システム Download PDFInfo
- Publication number
- JP4366062B2 JP4366062B2 JP2002271849A JP2002271849A JP4366062B2 JP 4366062 B2 JP4366062 B2 JP 4366062B2 JP 2002271849 A JP2002271849 A JP 2002271849A JP 2002271849 A JP2002271849 A JP 2002271849A JP 4366062 B2 JP4366062 B2 JP 4366062B2
- Authority
- JP
- Japan
- Prior art keywords
- term
- company
- company name
- occurrence
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
この発明は、検索を行うために入力された用語から、その用語に関連する企業名を検索し、更に検索された企業名の企業と関連する企業の企業名を検索する連想検索システムに関するものである。
【0002】
【従来の技術】
従来、検索は、求める情報を多量の情報の中から探し出すために行われている。従って、正確な検索を行うために、用語間の関係を整理し、用語同士の相互関係及び用語の適用範囲を定義したリスト(シソーラス)等が用いられている。即ち、検索語として入力された用語の同義語・類義語も検索語として検索を行い、検索漏れを防いで検索精度を向上させている(例えば、特許文献1参照)。
【0003】
また、求める情報の内容を的確に表現することが困難な場合や、適当な検索式を作成することができない場合には、概念検索により検索を行うことによって求める情報を探し出すことが行われている。この概念検索による検索においては、曖昧な文章や入力された用語の一部から、概念的、意味的に近い情報を探し出すことができる(例えば、特許文献2参照)。
【0004】
【特許文献1】
特開平9−259139号公報
【特許文献2】
特開2001−92831号公報
【0005】
【発明が解決しようとする課題】
ところで、シソーラスを用いた検索や、概念検索等の検索は、検索語として入力された言葉とその言葉の類義語等、言葉と言葉の意味的な関連や文章の概念に基づいて、求める情報を多量の情報の中から探し出すことを目的として行われるものである。そのため、検索により得られる情報の内容は予め想定された範囲内のものであり、得られる情報の内容を想定せずに検索が行われることは少ない。
【0006】
即ち、例えば、新聞に掲載された記事中の時事用語を検索語として、この時事用語と関連を有する企業を検索し、検索された企業と関連がある企業を検索する、というように、一つの用語を起点として、関連する企業を次々に検索していくということは行われていない。このような検索によれば、言葉と言葉の意味的な関連や文章の概念に基づいて行う検索では行うことができない新たな知識の発見、例えば、時事用語がある企業の事業内容と結びつくという新たな知識を発見することができる。
【0007】
このような発見的検索を行うことができれば、検索された情報を幅広く利用することができる。例えば、話題になっている事業分野の時事用語を検索語として企業の検索を行った場合、検索された企業を投資対象になるか否かの判断資料として利用することができる。
【0008】
この発明の課題は、入力された用語を起点とする発見的検索を行い、入力された用語と検索結果との関連を視覚的に認識できる網構造で表示する連想検索システムを提供することである。
【0009】
【課題を解決するための手段】
請求項1記載の連想検索システムは、一の用語に関連する関連用語を関連用語の種類に対応させて記憶する関連用語記憶手段と、前記一の用語が用いられている文書と同一の文書において、当該一の用語と所定の頻度で共起する企業名と共に、前記一の用語と前記共起する企業名とを関連付ける根拠及び当該文書に関する情報を対応づけて記憶する共起企業名記憶手段と、前記共起企業名記憶手段に記憶されている前記文書に関する情報に対応する前記文書を記憶するデータ記憶手段と、一の前記企業名と該一の企業に関連がある他の企業の企業名を、企業間の関連を示す情報と共に記憶する関連企業記憶手段と、前記関連用語記憶手段に記憶されている前記関連用語の中から、入力された用語の関連用語を検索する関連用語検索手段と、前記共起企業名記憶手段に記憶されている前記企業名の中から、前記入力された用語又は前記関連用語検索手段により検索された前記関連用語と共起する共起企業名を検索する共起企業名検索手段と、前記関連企業記憶手段に記憶されている前記企業名の中から、前記共起企業名検索手段により検索された前記共起企業名の企業と関連を有する関連企業名を検索する関連企業検索手段と、前記入力された用語と前記関連用語、前記入力された用語又は前記関連用語と前記共起企業名、前記共起企業名と前記関連企業名、の各関連性について、前記入力された用語を第1階層とする前記入力された用語からの検索の階層を示す関連の深さと、前記関連用語の種類と前記企業間の関連を示す情報に基づく関連の強さを視覚的に認識できる網構造により表示すると共に、前記関連用語記憶手段に記憶されている前記一の用語に関連する前記関連用語の種類を参照して、前記関連用語の関連付けの根拠を表示し、前記共起企業名記憶手段に記憶されている前記一の用語と前記共起する企業名とを関連付ける根拠を参照して、前記入力された用語又は前記関連用語と前記共起する企業名とが関連付けられている根拠を表示し、前記関連企業記憶手段に記憶されている前記企業間の関連を示す情報を参照して、前記企業間の関連を示す情報を表示する表示手段と、前記表示手段により表示された前記入力された用語又は前記関連用語と前記共起する企業名とを関連付ける根拠が指定された場合、前記共起企業名記憶手段を参照して前記データ記憶手段に記憶されている、指定された前記関連の根拠となる前記文書を読み出して表示する文書表示手段とを備えることを特徴とする。
【0010】
この請求項1記載の連想検索システムによれば、入力された用語(検索語)の関連用語が検索され、検索語又は検索された関連用語と共起する共起企業名が検索される。そして、検索語と関連用語、検索語又は関連用語と共起企業名との関連の深さ及び関連の強さを視覚的に認識できる網構造により表示している。従って、検索語として入力された用語を起点として関連を有する企業名(共起企業名)を検索する発見的検索を行うことができる。また、用語と共起企業名との間の関連の深さ、即ち検索語からの距離及び、関連の強さ、即ち用語と企業名との結びつきの強さを網構造により表示しているため、用語と共起企業名との関連を視覚的に容易に理解することができる。
【0012】
また、検索された共起企業名の企業と関連のある企業名(関連企業名)を更に検索し、共起企業名と関連企業名との間の関連の強さを視覚的に認識できる網構造により表示している。従って、検索された共起企業名の企業と関連を有する企業についても発見的検索を行い、共起企業名と関連企業名との結びつきの強さ(関連の強さ)を視覚的に容易に認識できるように表示することができる。
また、請求項1記載の連想検索システムは、用語と企業名との関連付けの根拠を示す情報を表示すると共に、その根拠を示す情報が指定された場合には、指定に係る用語と企業名とが所定の頻度で共起している文書のテキスト情報を更に表示する。従って、用語と企業名とがどのようにして関連付けられているのかを利用者が確認することができる。
【0013】
また、請求項2記載の連想検索システムは、前記関連用語記憶手段が、前記一の用語の同義語を記憶する同義語記憶領域、前記一の用語の類義語を記憶する類義語記憶領域、前記一の用語の関連語を記憶する関連語記憶領域、前記一の用語の広義語を記憶する広義語記憶領域、前記一の用語の狭義語を記憶する狭義語記憶領域の何れか一つ以上を備えることを特徴とする。
【0014】
この請求項2記載の連想検索システムによれば、検索語として入力された用語の同義語、類義語、関連語、広義語又は狭義語の何れか一つ以上が記憶される。そのため、検索語として入力された用語に関連を有する共起企業名を幅広く検索できると共に、検索語と関連を有する共起企業名についての発見的検索を効果的に行うことができる。
【0015】
また、請求項3記載の連想検索システムは、前記関連企業記憶手段が、資本関係、取引関係又は株価の値動きに相関を有する他の企業の企業名を記憶することを特徴とする。
【0016】
この請求項3記載の連想検索システムによれば、共起企業名の企業と資本関係、取引関係又は株価の値動きに相関を有する企業が関連企業として検索される。従って、言葉と言葉の意味的な関連等に基づく通常の検索では検索されることがない企業、例えば、企業の業績や企業動向において関連を有する企業も検索する発見的検索を行うことができる。
【0017】
また、請求項4記載の連想検索システムは、前記同一の文書が、有価証券報告書、新聞記事、雑誌記事、アナリストレポート及び企業により開示された資料(企業開示資料)の中の少なくとも一つを含むことを特徴とする。
【0018】
この請求項4記載の連想検索システムによれば、有価証券報告書等、開示されているテキスト情報において所定の頻度で用語と企業名とが共起している場合には、その用語と企業名とは関連するものとしている。従って、用語と企業名とが共起している文書が、有価証券報告書や企業開示資料等、企業により作成された文書か新聞記事等のように第三者により作成された文書かにより用語と企業名との関連の強さ(結びつきの強さ)を判断することができる。また、有価証券報告書や企業開示資料を用いることにより、企業の業績や企業動向の観点から用語と共起する企業を検索することができる。
【0021】
また、請求項5記載の連想検索システムは、前記関連用語検索手段により検索される前記関連用語の範囲及び前記共起企業名検索手段により検索される前記共起企業名の範囲を設定する範囲設定手段を更に備えることを特徴とする。
【0022】
この請求項5記載の連想検索システムによれば、検索が行われる関連用語の範囲及び共起企業名の範囲を設定することができる。そのため、検索語として入力された用語から検索される範囲を設定し、適切な範囲で発見的検索を行うことができる。
【0023】
【発明の実施の形態】
以下、図面を参照して、この発明の実施の形態に係る連想検索システムについて説明する。なお、以下においては、時事用語から投資対象となる企業を検索する場合を例として説明する。
【0024】
図1は、実施の形態に係る連想検索システムのブロック構成図である。連想検索システムは、図1に示すように、連想検索システムにおけるデータの制御を行うデータ制御部2を備えている。このデータ制御部2には、キーボード等により構成される入力部4、検索結果等を表示する表示部6及び一の用語に関連する関連用語を記憶する用語情報記憶部8が接続されている。また、データ制御部2には、投資対象となる企業の企業名とこの企業と資本関係等を有する企業の企業名を含む企業情報を記憶する企業情報記憶部10及び同一の文書において所定の頻度で共起する(共に出現する)企業名と用語とを含む共起情報を記憶する共起情報記憶部12が接続されている。更に、データ制御部2には、検索語として入力部4を介して入力された時事用語と検索された共起企業名等との関連の深さ及び関連の強さを表示する際に用いる表示区分テーブルを記憶している表示区分テーブル14及び共起情報記憶部12に記憶される企業名と用語とが共起する文書のテキスト情報等を記憶するデータ記憶部16が接続されている。
【0025】
用語情報記憶部8には、図2に示すように、一の用語の同義語、類義語、関連語、広義語及び狭義語が記憶される。なお、この用語情報記憶部8に記憶されている同義語、類義語、関連語、広義語及び狭義語は、市場に提供されている同義語辞書やシソーラス辞書から得られるものであり、定期的に更新が行われる。
【0026】
また、企業情報記憶部10には、図3に示すように、投資対象となる企業の企業名、株主、取引先、資本関係にある企業(資本関係企業)及び株価の値動きに相関がある企業(株価相関企業)の企業名が記憶される。なお、企業名としては、取引所に上場している企業の正式名称、略式名称、英字表示名称等が記憶される。
【0027】
ここで、有価証券報告書やその他の企業情報開示資料から株主、取引先又は資本関係を有する企業の企業名が企業情報記憶部10に記憶される。有価証券報告書には、上場企業の事業年度毎の営業及び経理の状況や重要な事業内容等が記載されている。この有価証券報告書は、一般に公開されている書類であり、上場企業等、有価証券の発行者が証券取引法に基づき取引所に提出している。従って、この有価証券報告書から、株主、取引先又は資本関係を有する企業の企業名が抽出され、企業情報記憶部10に記憶される。
【0028】
また、株価相関企業としては、過去の株価情報から一の企業と時系列的に株価の値動きが連動している等、一の企業と株価の値動きに関連を有する企業の企業名が記憶される。即ち、市場における企業の評価において一の企業と関連を有する企業の企業名が企業情報記憶部10に記憶される。
【0029】
また、共起情報記憶部12には、図4に示すように、有価証券報告書、アナリストレポート及び企業情報開示資料等の企業業績や企業動向を示すテキスト情報や、新聞記事、雑誌記事等のテキスト情報に所定の処理を施して抽出された企業名、用語、共起頻度及び根拠が記憶される。即ち、まず、有価証券報告書等のテキスト情報から独立して意味を持つ言葉の最小単位を切り出して品詞判定を行い、判定された品詞に基づいて検索に用いることが有効な用語の判定を行う形態素解析処理が行われる。この形態素解析処理においては、主に名詞や固有名詞と判定された言葉が検索に用いることが有効な用語として判定される。次に、形態素解析処理が行われた用語について、用語が含まれる文の構造(係り受け)の解析を行うことによって、検索に用いることが有効な用語を抽出する構文解析処理が行われる。
【0030】
ここで、企業情報記憶部10に記憶されている企業名を参照して、抽出された用語が企業名か否かを判断する。そして、抽出された用語と企業名と判断された用語とが、一つのテキスト情報に同時に現れる(共起する)回数を計測し、一定の回数以上同時に出現する用語と企業名とは関連性を有するとして共起情報記憶部12に記憶する。
【0031】
また、関連性を有する用語と企業名とが一つのテキスト情報に同時に現れる回数を共起頻度として共起情報記憶部12に記憶する。更に、用語と企業名とを関連付ける根拠、例えば、用語と企業名とが有価証券報告書の事業内容に関する記載部分において共起しており、用語と企業名とが事業において関連付けられている等の根拠を示す情報を共起情報記憶部12に記憶する。なお、この共起情報記憶部12に記憶されている用語等は、新たに発行された有価証券報告書、新聞記事、雑誌記事、アナリストレポート及び企業開示情報等を用いて定期的に更新される。
【0032】
また、表示区分テーブル14には、図5(a)に示すように、関連の深さ(階層)を示す色彩のテーブルが記憶されている。即ち、検索語として入力された時事用語は第1の階層に位置するため、時事用語を表示する際には最も濃い色彩を用いる。そして、時事用語から検索された関連用語、関連用語から検索された共起企業名というように、時事用語からの階層を重ねる毎に淡い色彩を用いることを示すテーブルが記憶されている。
【0033】
また、表示区分テーブル14には、図5(b)に示すように、関連の強さ(関係)を示す線種のテーブルが記憶されている。例えば、検索語として入力された時事用語の同義語、広義語及び関連語が関連用語として検索された場合、関連の強さは同義語が最も強く、次に広義語、その次に関連語となる。そのため、時事用語と同義語とを結ぶ線には太実線を用い、時事用語と広義語とを結ぶ線には中実線を用い、時事用語と関連語とを結ぶ線には細実線を用いることを示すテーブルが記憶されている。また、図示は省略するが、用語と企業名、企業名と企業名とを結ぶ際に用いる線種のテーブルもそれぞれ表示区分テーブル14に記憶されている。
【0034】
ここで、関連の深さは、検索語として入力された時事用語からの階層を意味する。即ち、入力された時事用語が第1の階層に位置し、時事用語から直接検索された関連用語や時事用語から直接検索された共起企業名は第2の階層に位置する。そして、関連用語から検索された関連用語や共起企業名が第3の階層に位置する。従って、第3の階層に位置する関連用語や共起企業名に比べて第2の階層に位置する関連用語や共起企業名の方が時事用語との階層に近く、時事用語との関連が深くなっていることを意味する。
【0035】
また、関連の強さは、例えば、時事用語と関連用語、時事用語と共起企業名等とを関連付ける信頼性の強さを示す。即ち、時事用語の関連用語が同義語であれば、時事用語の関連用語が広義語の場合よりも時事用語との関連が強くなる。また、時事用語と共起企業名が有価証券報告書に記載された事業により関連付けられている場合には、新聞記事により関連付けられている場合よりも関連付けの信頼性が高くなり、関連が強くなる。
【0036】
また、データ記憶部16には、有価証券報告書、新聞記事、雑誌記事及びアナリストレポート等、共起情報記憶部12に記憶される情報が抽出されたテキスト情報等が記憶される。
【0037】
次に、図6のフローチャートを参照して、実施の形態に係る連想検索システムにより行われる連想検索の処理について説明する。
【0038】
まず、検索語となる時事用語を入力部4を介して入力する(ステップS10)。例えば、「インターネット」等の時事用語を入力部4を介して入力する。なお、検索語を入力した場合には、検索される関連用語等の範囲を入力する検索範囲設定画面(図示せず)が表示部6に表示される。
【0039】
次に、表示部6に表示される検索範囲設定画面において、検索される関連用語の範囲、検索される共起企業名の範囲及び検索される関連企業名の範囲を設定する(ステップS11)。例えば、まず、検索語として入力された時事用語「インターネット」の同義語、類義語、関連語等の関連用語として検索される関連用語の数の上限及び階層の上限を検索される関連用語の範囲として入力部4を介して入力する。次に、「インターネット」、「インターネット」の同義語、類義語及び関連語等の関連用語と共起するとして検索される共起企業名の数の上限を検索される共起企業名の範囲として入力部4を介して入力する。更に、検索された共起企業名の企業の株主、取引先、資本関係を有する又は株価相関を有するとして検索される関連企業名の数の上限及び階層の上限を検索される関連企業名の範囲として入力部4を介して入力する。
【0040】
次に、ステップS10において入力された検索語の関連用語の検索を、ステップS11において設定された範囲内において行う(ステップS12)。例えば、関連用語の検索を行う場合の範囲として、検索される関連用語の数の上限が「4」、階層の上限が「3」と設定されている場合には、以下のように検索が行われる。
【0041】
まず、用語情報記憶部8に記憶されている用語の中から、例えば、検索語として入力された時事用語「インターネット」の同義語、類義語、関連語、広義語又は狭義語の検索を行う。
【0042】
ここで、検索される関連用語の数の上限が「4」と設定されているため、「インターネット」に関連の強いものから4つの関連用語が検索される。例えば、同義語が4つ検索された場合には、類義語等の検索を行うことなく、その時点で検索を終了する。一方、同義語、類義語、関連語、広義語及び狭義語の全てについて検索を行った場合には、4つの関連用語が検索されていない場合でも「インターネット」の関連用語の検索を終了する。その結果、例えば、「インターネットの」関連用語として「ブロードバンド」、「ネットワーク」、「電子メール」及び「ホームページ」が検索されたとする。
【0043】
次に、例えば、「インターネット」の関連用語として検索された「ブロードバンド」についても関連用語の検索を行う。即ち、用語情報記憶部8に記憶されている用語の中から「ブロードバンド」の同義語等を、関連の強いものから4つを上限として検索を行う。その結果、例えば、「ブロードバンド」の関連用語として「ケーブルテレビ」、「光ファイバ」及び「ADSL」が検索されたとする。
【0044】
この場合、検索語の「インターネット」が第1の階層であるため、「インターネット」の関連用語として検索された「ブロードバンド」、「ネットワーク」、「電子メール」及び「ホームページ」は第2の階層となる。また、「ブロードバンド」の関連用語として検索された「ケーブルテレビ」、「光ファイバ」及び「ADSL」は第3の階層となる。
【0045】
ここで、検索が行われる関連用語の階層の上限が「3」と設定されているため、第3の階層に位置する関連用語が検索された場合には、関連用語の検索を終了する。即ち、第3の階層の「ブロードバンド」の関連用語として検索された「ケーブルテレビ」、「光ファイバ」及び「ADSL」の関連用語についての検索は行われず、関連用語の検索を終了する。
【0046】
次に、ステップS10において入力された検索語又はステップS12において検索された関連用語と共起する共起企業名の検索を、ステップS11において設定された範囲内において行う(ステップS13)。即ち、まず、共起情報記憶部12に記憶されている企業名の中から、検索語と共起する企業名及びステップS12において検索された関連用語と共起する企業名を設定された数の範囲内において検索する。なお、共起情報記憶部12に記憶されている全ての企業名について検索を行った場合には、設定された数に達していない場合であっても検索を終了する。
【0047】
次に、ステップS13において検索された共起企業名の企業と関連を有する関連企業の検索を、ステップS11において設定された数の範囲内において行う(ステップS14)。例えば、関連企業の検索を行う場合の範囲として、検索される関連企業の数の上限が「2」、階層の上限が「3」と設定されている場合には、以下のように検索が行われる。
【0048】
まず、ステップS13において検索された企業の株主、取引先、資本関係を有する又は株価相関を有する企業を、企業情報記憶部10に記憶されている企業の中から設定された数の範囲内において検索する。
【0049】
例えば、関連用語「ネットワーク」と共起する共起企業名として「弥生コミュニケーション」が検索されている場合、この「弥生コミュニケーション」の株主、取引先、資本関係を有する又は株価相関を有する企業を、関連が強いものから2つ検索する。ここで、共起企業名の企業と関連企業との関連の強さは、資本関係を有する企業が最も強く、以下、株主企業、取引先企業等とする。検索を行った結果、例えば、「弥生コミュニケーション」の関連企業として「卯月物産」が検索されたとする。
【0050】
次に、検索された関連企業の株主等の企業を、企業情報記憶部10に記憶されている企業の中から2つを上限として検索する。その結果、例えば、「卯月物産」の関連企業として「皐月ファイナンス」及び「水無月銀行」が検索されたとする。
【0051】
この場合、共起企業名の「弥生コミュニケーション」は第1の階層となり、「弥生コミュニケーション」の関連企業名である「卯月物産」は第2の階層となる。また、「卯月物産」の関連企業である「皐月ファイナンス」と「水無月銀行」は第3の階層となる。検索が行われる関連企業の階層の上限が「3」と設定されているため、第3の階層に位置する「皐月ファイナンス」及び「水無月銀行」の関連企業についての検索は行われず、関連企業の検索を終了する。
【0052】
次に、表示区分テーブル14に記憶されている表示区分を参照して、図7に示す網目図を作成する(ステップS15)。即ち、ステップS10において入力された時事用語を起点としてステップS12において検索された関連用語、ステップS13において検索された共起企業名及びステップS14において検索された関連企業名を網構造で表示する網目図を作成する。この網目図を作成する際に、表示区分テーブル14に記憶されている表示区分テーブルを参照して、時事用語からの階層を色彩で表し、時事用語と関連用語、時事用語と共起企業名、関連用語と関連用語、関連用語と共起企業名、共起企業名と関連企業名及び関連企業名と関連企業名とを結ぶ線の種類により関連の深さを表す。
【0053】
ここで、図7に示すように、時事用語の「インターネット」に近い階層から遠い階層へと淡い色彩を用いることにより、「インターネット」との関連の深さを表す。また、時事用語と関連用語、関連用語と関連用語の間においては実線を用い、この実線の太さにより関連の強さを表す。そして、時事用語又は関連用語と共起企業名、共起企業名と関連企業名の間においては破線を用い、この破線の太さにより関連の強さを示す。
【0054】
また、時事用語と関連用語等を結ぶ線の近傍に関連付けの根拠として、共起情報記憶部12に記憶されている根拠を表示する。例えば、「ホームページ」は「インターネット」の関連語として検索されているため、「ホームページ」と「インターネット」を結ぶ線の近傍に「関連」と表示する。また、「インターネット」と「睦月インターネット」とは有価証券報告書に記載されている事業により関連付けられているため、「インターネット」と「睦月インターネット」を結ぶ線の近傍に「事業」と表示する。なお、図7に示すように、用語は丸で囲って表し、企業名は四角で囲って表す。
【0055】
次に、ステップS15において作成された網目図を表示部6を介して表示する(ステップS16)。ここで、例えば、根拠として表示されている「事業」の部分をマウス等のポインティングデバイスを用いて指定することにより、「インターネット」と「睦月インターネット」とを関連付けたテキスト情報、例えば、有価証券報告書のテキスト情報がデータ記憶部16から読み出され、表示部6に表示される。
【0056】
この実施の形態に係る連想検索システムによれば、検索語として入力された時事用語に関連する関連用語を検索し、時事用語又は関連用語と共起する共起企業名を検索している。そして、検索された共起企業名の企業と関連を有する企業を関連企業として検索し、検索結果を網構造により作成される網目図により表示している。従って、利用者が忘れていた知識や新たな知識、即ち、時事用語と関連することを忘れていた企業名、時事用語と関連することを知らなかった企業名や時事用語と関連を有する企業と関連を有することを知らなかった企業名を検索する発見的検索を行うことができる。
【0057】
また、この実施の形態に係る連想検索システムによれば、新聞記事や雑誌記事等のテキスト情報の他に、有価証券報告書や企業開示資料等の企業業績や企業動向を示すテキスト情報に基づいて用語と共起する企業の企業名を共起情報として記憶している。そして、時事用語又は関連用語と共起する共起企業名を共起情報の中から検索している。従って、言葉と言葉の意味的な関連や文章の概念等からは検索することができない企業名、即ち、企業業績や企業動向の観点から時事用語等と関連を有する企業名を検索することができる。そのため、検索された企業名の企業が投資対象になり得る企業か否かを判断するための投資情報として提供することができる。
【0058】
また、この実施の形態に係る連想検索システムによれば、有価証券報告書や企業開示資料から関連を有するとして抽出された企業や株価相関企業が関連企業として検索される。従って、言葉と言葉の意味的な関連や文章の概念等からでは検索することが困難な企業、即ち、企業業績や企業動向又は市場における評価において関連を有する関連企業も時事用語を起点として検索することができる。
【0059】
また、この実施の形態に係る連想検索システムによれば、検索語として入力された時事用語と検索された関連用語、時事用語又は関連用語と共起企業名、共起企業名と関連企業名との関連の深さ及び関連の強さを視覚的に認識することができる網構造により作成される網目図により表示している。従って、用語間の関連、用語と企業名との関連、企業名間の関連の深さ及び強さを視覚的に容易に理解することができる。
【0060】
また、この実施の形態に係る連想検索システムによれば、検索語として入力された時事用語又は関連用語と企業名とを関連付ける根拠を表示し、更に表示されている根拠をマウス等のポインティングデバイスを用いて指定することにより、根拠となったテキスト情報を表示している。従って、関連付けの根拠を参照することにより、情報としての検索結果の信頼性を向上させることができる。
【0061】
なお、上述の実施の形態に係る連想検索システムにおいては、時事用語から投資対象となる企業を検索する場合を例としているが、投資対象となる企業以外の企業を検索するようにしてもよい。例えば、企業の分析を行うための情報収集を行うために検索を行うようにしてもよい。また、企業名を入力し、入力された企業名と関連する時事用語を検索するようにしてもよい。
【0062】
また、上述の実施の形態に係る連想検索システムにおいては、共起情報記憶部12に記憶される共起情報を定期的に更新しているが、過去の共起情報を時系列で記憶してもよい。この場合には、例えば、企業名を入力し、入力された企業名と関連する用語を検索することにより、入力された企業名の企業が、過去のどの時期に、どのようなトピックで話題になったのかを知ることができる。
【0063】
また、利用者の嗜好や興味を予め記憶し、検索結果の適合率を高めるようにしてもよい。即ち、入力した時事用語から検索された企業名の中から、予め記憶されている利用者の嗜好や興味に合致した企業名のみを表示するようにしてもよい。
【0064】
また、利用者により行われた検索結果や、利用者が参照した根拠を履歴情報として記憶するようにしてもよい。この場合には、記憶されている履歴情報に基づいて検索結果の精緻化を行うことができる。また、履歴情報を記憶することにより、利用者がどのような検索を行い、検索結果に対してどのような行動を行ったか等の統計情報を検索結果に加味することができる。
【0065】
また、上述の実施の形態に係る連想検索システムにおいては、用語と企業名とが共起するテキスト情報として有価証券報告書、新聞記事、雑誌記事、アナリストレポート及び企業開示情報等を用いているが、これら以外のテキスト情報を用いるようにしてもよい。即ち、有価証券報告書やアナリストレポート等をテキスト情報として用いている場合、事業内容等の観点から用語と企業名とを関連付けている。従って、例えば、環境問題に関する新聞記事、雑誌記事、環境団体により作成された報告書及び企業開示情報等をテキスト情報とした場合には、環境問題に対する取り組み等の観点から用語と企業名とを関連付けることができる。
【0066】
また、上述の実施の形態に係る連想検索システムにおいては、有価証券報告書等のテキスト情報において共起する用語と企業名とを記憶しているが、更に、用語と共起する用語、企業名と共起する企業名を記憶するようにしてもよい。例えば、一の用語と他の用語とが一つのテキスト情報に同時に現れる回数を計測し、一定の回数以上同時に出現する一の用語と他の用語とは関連性を有するとして記憶するようにしてもよい。また、一の企業名と他の企業名についても同様にして記憶するようにしてもよい。
【0067】
【発明の効果】
この発明によれば、検索語として入力された用語の関連用語を検索し、検索語又は関連用語と共起する共起企業名を検索している。そして、検索語と関連用語、検索語又は関連用語と共起企業名との関連の深さ及び関連の強さを視覚的に認識できる網構造により表示している。従って、検索語として入力された用語を起点として関連を有する企業名(共起企業名)を検索する発見的検索を行うことができる。
【0068】
また、関連の深さ及び関連の強さを視覚的に認識できる網構造により表示しているため、用語と用語、用語と企業名との間の関連を視覚的に容易に理解することができる。
【図面の簡単な説明】
【図1】この発明の実施の形態に係る連想検索システムのブロック構成図である。
【図2】この発明の実施の形態に係る用語情報記憶部に記憶される用語情報の一例を示す図である。
【図3】この発明の実施の形態に係る企業情報記憶部に記憶される企業情報の一例を示す図である。
【図4】この発明の実施の形態に係る共起情報記憶部に記憶される共起情報の一例を示す図である。
【図5】(a)は、この発明の実施の形態に係る表示区分テーブルに記憶される関連の深さを示す際に用いる色彩のテーブルの一例であり、(b)は、関連の強さを示す際に用いる線種のテーブル一例である。
【図6】この発明の実施の形態に係る連想検索システムによる検索の処理を説明するためのフローチャートである。
【図7】この発明の実施の形態に係る連想検索システムにより検索された結果の一表示例を示す図である。
【符号の説明】
2…データ制御部、4…入力部、6…表示部、8…用語情報記憶部、10…企業情報記憶部、12…共起情報記憶部、14…表示区分テーブル、16…データ記憶部。
Claims (5)
- 一の用語に関連する関連用語を関連用語の種類に対応させて記憶する関連用語記憶手段と、
前記一の用語が用いられている文書と同一の文書において、当該一の用語と所定の頻度で共起する企業名と共に、前記一の用語と前記共起する企業名とを関連付ける根拠及び当該文書に関する情報を対応づけて記憶する共起企業名記憶手段と、
前記共起企業名記憶手段に記憶されている前記文書に関する情報に対応する前記文書を記憶するデータ記憶手段と、
一の前記企業名と該一の企業に関連がある他の企業の企業名を、企業間の関連を示す情報と共に記憶する関連企業記憶手段と、
前記関連用語記憶手段に記憶されている前記関連用語の中から、入力された用語の関連用語を検索する関連用語検索手段と、
前記共起企業名記憶手段に記憶されている前記企業名の中から、前記入力された用語又は前記関連用語検索手段により検索された前記関連用語と共起する共起企業名を検索する共起企業名検索手段と、
前記関連企業記憶手段に記憶されている前記企業名の中から、前記共起企業名検索手段により検索された前記共起企業名の企業と関連を有する関連企業名を検索する関連企業検索手段と、
前記入力された用語と前記関連用語、前記入力された用語又は前記関連用語と前記共起企業名、前記共起企業名と前記関連企業名、の各関連性について、前記入力された用語を第1階層とする前記入力された用語からの検索の階層を示す関連の深さと、前記関連用語の種類と前記企業間の関連を示す情報に基づく関連の強さを視覚的に認識できる網構造により表示すると共に、
前記関連用語記憶手段に記憶されている前記一の用語に関連する前記関連用語の種類を参照して、前記関連用語の関連付けの根拠を表示し、
前記共起企業名記憶手段に記憶されている前記一の用語と前記共起する企業名とを関連付ける根拠を参照して、前記入力された用語又は前記関連用語と前記共起する企業名とが関連付けられている根拠を表示し、
前記関連企業記憶手段に記憶されている前記企業間の関連を示す情報を参照して、前記企業間の関連を示す情報を表示する表示手段と、
前記表示手段により表示された前記入力された用語又は前記関連用語と前記共起する企業名とを関連付ける根拠が指定された場合、前記共起企業名記憶手段を参照して前記データ記憶手段に記憶されている、指定された前記関連の根拠となる前記文書を読み出して表示する文書表示手段と
を備えることを特徴とする連想検索システム。 - 前記関連用語記憶手段は、
前記一の用語の同義語を記憶する同義語記憶領域、
前記一の用語の類義語を記憶する類義語記憶領域、
前記一の用語の関連語を記憶する関連語記憶領域、
前記一の用語の広義語を記憶する広義語記憶領域、
前記一の用語の狭義語を記憶する狭義語記憶領域の何れか一つ以上を備えることを特徴とする請求項1記載の連想検索システム。 - 前記関連企業記憶手段は、資本関係、取引関係又は株価の値動きに相関を有する他の企業の企業名を記憶することを特徴とする請求項1又は請求項2記載の連想検索システム。
- 前記同一の文書は、有価証券報告書、新聞記事、雑誌記事、アナリストレポート及び企業により開示された資料の中の少なくとも一つを含むことを特徴とする請求項1〜請求項3の何れか一項に記載の連想検索システム。
- 前記関連用語検索手段により検索される前記関連用語の範囲及び前記共起企業名検索手段により検索される前記共起企業名の範囲を設定する範囲設定手段を更に備えることを特徴とする請求項1〜請求項4の何れか一項に記載の連想検索システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002271849A JP4366062B2 (ja) | 2002-09-18 | 2002-09-18 | 連想検索システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002271849A JP4366062B2 (ja) | 2002-09-18 | 2002-09-18 | 連想検索システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004110386A JP2004110386A (ja) | 2004-04-08 |
JP4366062B2 true JP4366062B2 (ja) | 2009-11-18 |
Family
ID=32269043
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002271849A Expired - Fee Related JP4366062B2 (ja) | 2002-09-18 | 2002-09-18 | 連想検索システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4366062B2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0423879D0 (en) * | 2004-10-28 | 2004-12-01 | Koninkl Philips Electronics Nv | Data processing system and method |
JP2008171109A (ja) * | 2007-01-10 | 2008-07-24 | Nec Corp | 情報検索システム及び情報検索方法並びにプログラム |
JP2009086773A (ja) * | 2007-09-27 | 2009-04-23 | Nomura Research Institute Ltd | 検索サービス装置 |
JP2009086771A (ja) * | 2007-09-27 | 2009-04-23 | Nomura Research Institute Ltd | 検索サービス装置 |
JP5149581B2 (ja) * | 2007-09-27 | 2013-02-20 | 株式会社野村総合研究所 | 検索サービス装置 |
JP2009086903A (ja) * | 2007-09-28 | 2009-04-23 | Nomura Research Institute Ltd | 検索サービス装置 |
JP2009122807A (ja) * | 2007-11-13 | 2009-06-04 | Nomura Securities Co Ltd | 連想検索システム |
JP5219890B2 (ja) * | 2009-03-06 | 2013-06-26 | ヤフー株式会社 | 商品情報提供装置、商品情報の提供方法及びプログラム |
JP2010218216A (ja) * | 2009-03-17 | 2010-09-30 | Chugoku Electric Power Co Inc:The | 類似文書検索システム、方法及びプログラム |
JP4820888B2 (ja) * | 2009-05-13 | 2011-11-24 | デジタル・アドバタイジング・コンソーシアム株式会社 | 広告支援システム及び広告支援方法 |
JP5256273B2 (ja) * | 2010-11-24 | 2013-08-07 | ヤフー株式会社 | 意図抽出装置、方法及びプログラム |
WO2014010913A1 (ko) * | 2012-07-10 | 2014-01-16 | O Young-Joo | 야구용어 연계 투자평가 및 특성분석 방법 및 그 시스템 |
JP6679682B2 (ja) * | 2018-09-20 | 2020-04-15 | ヤフー株式会社 | 特定装置、特定方法及び特定プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2806867B2 (ja) * | 1995-03-13 | 1998-09-30 | 株式会社トレンディ | ドキュメントデータベースの構築方法、表示方法、及び表示装置 |
JP2000200281A (ja) * | 1999-01-05 | 2000-07-18 | Matsushita Electric Ind Co Ltd | 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体 |
JP2001117935A (ja) * | 1999-10-19 | 2001-04-27 | Fujitsu Ltd | テキスト情報アクセス装置、その方法、及び記録媒体 |
JP2001344247A (ja) * | 2000-06-05 | 2001-12-14 | Nippon Telegr & Teleph Corp <Ntt> | 分野用語辞書構築方法、分野用語辞書構築装置および分野用語辞書構築プログラムを記録した記録媒体 |
-
2002
- 2002-09-18 JP JP2002271849A patent/JP4366062B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004110386A (ja) | 2004-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8977953B1 (en) | Customizing information by combining pair of annotations from at least two different documents | |
CN101622618B (zh) | 具有基于概念的搜索和分级的信息检索系统、方法和软件 | |
US7065483B2 (en) | Computer method and apparatus for extracting data from web pages | |
US20090119268A1 (en) | Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis | |
US8868562B2 (en) | Identification of semantic relationships within reported speech | |
KR101524889B1 (ko) | 간접 화법 내에서의 시맨틱 관계의 식별 | |
US20070027672A1 (en) | Computer method and apparatus for extracting data from web pages | |
US20060053154A1 (en) | Method and system for retrieving information based on manually-input keyword and automatically-selected keyword | |
JP4366062B2 (ja) | 連想検索システム | |
WO2011080899A1 (ja) | 情報推薦方法 | |
US8560518B2 (en) | Method and apparatus for building sales tools by mining data from websites | |
US11281678B2 (en) | Continuous evaluation and adjustment of search engine results | |
US20060036461A1 (en) | Active relationship management | |
WO2007105202A2 (en) | Automatic reusable definitions identification (rdi) method | |
Wei | Examining corporate communications of environmental responsibility on corporate websites: Main themes, linguistic features, and text reuse | |
Strzelecki et al. | Direct answers in Google search results | |
EP2075748A1 (en) | System and method for creating a database | |
KR20000050225A (ko) | 문서 자동 요약에 의한 인터넷 정보 검색 시스템 및 방법 | |
KR20100034140A (ko) | 인터넷을 이용한 의견 검색 시스템 및 그 방법 | |
Wang et al. | A bibliometrics study of library and information science doctoral dissertations in China from 2011 to 2020 | |
Jokić et al. | A Twitter Corpus and lexicon for abusive speech detection in Serbian | |
CN114741627A (zh) | 面向互联网的辅助信息搜索方法 | |
JP2002278982A (ja) | 情報抽出方法および情報検索方法 | |
Fuertes-Olivera et al. | The accounting dictionaries | |
Stolk | Evoke: Exploring and extending a thesaurus of old english using a linked data approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050909 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060207 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080826 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081023 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090421 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090603 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090818 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090824 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120828 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130828 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |