JP2017173910A - 検索サーバー、検索システム、検索情報配信システム、検索プログラム、検索情報配信プログラム - Google Patents

検索サーバー、検索システム、検索情報配信システム、検索プログラム、検索情報配信プログラム Download PDF

Info

Publication number
JP2017173910A
JP2017173910A JP2016056021A JP2016056021A JP2017173910A JP 2017173910 A JP2017173910 A JP 2017173910A JP 2016056021 A JP2016056021 A JP 2016056021A JP 2016056021 A JP2016056021 A JP 2016056021A JP 2017173910 A JP2017173910 A JP 2017173910A
Authority
JP
Japan
Prior art keywords
search
site
information
keyword
storage file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016056021A
Other languages
English (en)
Other versions
JP6510452B2 (ja
Inventor
孝利 石井
Takatoshi Ishii
孝利 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JCC KK
Original Assignee
JCC KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JCC KK filed Critical JCC KK
Priority to JP2016056021A priority Critical patent/JP6510452B2/ja
Publication of JP2017173910A publication Critical patent/JP2017173910A/ja
Application granted granted Critical
Publication of JP6510452B2 publication Critical patent/JP6510452B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】有益な情報を迅速に得ることができる検索サーバー、検索システム、検索情報配信システム、検索プログラム及び検索情報配信プログラムを提供する。【解決手段】検索サーバー14は、ウェブサイト11の中から予め選定した分野に適合したウェブサイトを検索対象サイト11aとしてデータベース19の検索対象格納ファイルに格納する検索対象格納手段26と、検索対象サイトのサイト構造を解析するサイト構造解析手段27と、解析したサイト構造に基づいて検索対象サイトを巡回し、記述されたサイト情報を取得するサイト情報取得手段28と、取得したサイト情報を取得情報格納ファイルに格納するサイト情報格納手段28と、サイト情報における検索キーワードに対応する語句の出現回数が検索重み付けパラメータ以上である場合に、検索キーワードに関連する情報を取得情報格納ファイルに格納されたサイト情報から抽出する情報抽出手段31と、を有している。【選択図】図1

Description

本発明は、インターネット上に存在するコンテンツを検索するための検索サーバー、検索システム、検索情報配信システム、検索プログラム、及び、検索情報配信プログラムに関するものである。
近年、インターネットに接続されたコンピューター、スマートフォン等からウェブサイトにアクセスして、世界中のあらゆる情報を容易に得ることができるようになっている。
一般に、ウェブサイト及びウェブサーバーを介して入手可能な情報には、コンピューターやスマートフォン上で実行するウェブブラウザを介してアクセスする。例えば、ユーザーは、ウェブブラウザのアドレスバーにウェブサイトのURL(ユニフォームリソースロケータ)を入力することで、ウェブサイトにアクセスすることができる。
実際には、ユーザーはアクセスしたいサイトのURLを知らないことが多いため、キーワードに基づいて特定のサイトを容易に探し出せるようにする検索機能を使用している。
現在、検索機能には、キーワードに関連するサイトについてWWW(ワールドワイドウェブ)全体を検索する一般の検索機能と、特定のドメインまたはサイトに限定して検索するドメイン限定検索機能とがある。
一般の検索機能を有する検索エンジンは、WWW全体を検索対象とするため、検索速度が遅いという不具合があった。また、一般の検索エンジンは、ユーザーが必要とする情報が掲載されたウェブサイト以外にも無関係なウェブサイトを大量に検索結果に表示してしまうため、ユーザーはその検索結果からさらに精査をして、必要な情報を選別しなければならないという事態を生じていた。
また、ドメイン限定検索機能を有する検索エンジンは、検索速度が速い一方で、検索範囲が所定のドメインを有するサイトに限定されてしまうという不具合を生じていた。
そこで、例えば、特許文献1には、検索を容易にするシステムであって、項目の集まりにわたって検索を行うために、関連性によって重み付けされた前記項目の様々なサブセットにそれぞれ関連付けられている複数のサブウェブを提示する表示コンポーネントと、前記サブウェブの少なくとも1つの全体にわたる検索クエリを受信する入力コンポーネントとを備えたことを特徴とするシステムが開示されている。
しかしながら、特許文献1に記載の検索システムにあっては、ユーザーが検索を実行するごとにインターネットを介してサブウェブ内のサイトを検索する必要があるため、検索速度が遅くなるという不具合が生じていた。
特に、時事情報に関するニュースは、大手新聞社、地方新聞社、ニュース配信会社、テレビ会社等により構成される報道機関のウェブサイトに掲載される。このような様々なサイトから網羅的に、時事情報に関するニュースを正確かつ迅速に取得することは、従来の検索サイトを使用したキーワード検索では困難である。
また、キーワードに基づいて特定のサイトを探し出せた場合であっても、その特定のサイトにおいて、検索対象としたキーワードがどの程度の重要性をもって使用されているかどうかを判断するのは、読んではじめて分かることが多く、たとえキーワードが使用されていても見る必要性の低いサイトを検索の段階で選別することは困難であった。
特開2005−209210号公報
本発明は、以上のような従来の不具合を解決するためのものであって、その課題は、有益な情報を迅速に得ることができる検索サーバー、検索システム、検索情報配信システム、検索プログラム、及び、検索情報配信プログラムを提供することにある。
前記課題を解決するために、請求項1に記載の発明にあっては、複数のウェブサイトにインターネットを介して接続可能であり、前記ウェブサイトから取得した情報から所望の情報を抽出する検索サーバーであって、前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして検索対象格納ファイルに格納する検索対象格納手段と、前記検索対象格納ファイルに格納された検索対象サイトについて、各検索対象サイトのサイト構造を解析するサイト構造解析手段と、前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得するサイト情報取得手段と、前記各検索対象サイトから取得した前記サイト情報を取得情報格納ファイルに格納するサイト情報格納手段と、検索キーワードと検索重み付けパラメータとが格納された検索キーワード格納ファイルを有し、前記サイト情報における前記検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連する情報を前記取得情報格納ファイルに格納された前記サイト情報から抽出する情報抽出手段とを有することを特徴とする。
ここで、「検索重み付けパラメータ」とは、前記検索キーワードに対応する語句が前記各検索対象サイトにおいて、どの程度の重要性で使用されているかを数値化したものであって、前記各検索対象サイトにおける前記サイト情報に含まれる語句の出現回数と比較することによって、重要性の高い検索対象サイトのみを抽出し、前記抽出した検索対象サイトから情報を取得することが可能となる。
従って、請求項1に記載の発明にあっては、前記検索対象格納手段によって、前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして前記検索対象格納ファイルに格納した場合には、前記検索サーバーは、前記サイト構造解析手段によって、前記検索対象格納ファイルに格納された検索対象サイトに基づいて、各検索対象サイトのサイト構造を解析し、前記サイト情報取得手段によって、前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得し、前記サイト情報格納手段によって、前記各検索対象サイトから取得した前記サイト情報が取得情報格納ファイルに格納される。
その後、検索キーワードと検索重み付けパラメータとを前記検索キーワード格納ファイルに格納した場合には、前記情報抽出手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連する情報が、前記取得情報格納ファイルに格納された前記サイト情報から抽出される。
請求項2に記載の発明にあっては、ユーザー端末に接続されており、前記ユーザー端末は、検索キーワードと検索重み付けパラメータとを入力するキーワード入力手段と、前記入力された検索キーワードと検索重み付けパラメータとを前記検索サーバーへ送信するキーワード送信手段とを有し、前記検索サーバーは、前記送信された検索キーワードと検索重み付けパラメータとを前記検索キーワード格納ファイルに格納する検索キーワード格納手段を有し、前記ユーザー端末から入力された検索キーワードと検索重み付けパラメータとに基づいて前記情報抽出手段により抽出された前記情報を前記ユーザー端末に出力することを特徴とする。
従って、前記ユーザー端末において、前記キーワード入力手段によって、検索キーワードと検索重み付けパラメータとを入力した場合には、前記キーワード送信手段によって、前記入力された検索キーワードと検索重み付けパラメータとが前記検索サーバーへ送信される。
その後、前記検索サーバーにおいて、前記検索キーワード格納手段によって、前記送信された検索キーワードと検索重み付けパラメータとが前記検索キーワード格納ファイルに格納され、前記情報抽出手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連する情報が、前記取得情報格納ファイルに格納された前記サイト情報から抽出され、前記ユーザー端末に出力される。
請求項3に記載の発明にあっては、ユーザー端末に接続されており、前記ユーザー端末は、検索キーワードを入力するキーワード入力手段と、前記入力された検索キーワードと検索重み付けパラメータとを前記検索サーバーへ送信するキーワード送信手段とを有し、前記検索サーバーは、前記送信された検索キーワードと検索重み付けパラメータとを前記検索キーワード格納ファイルに格納する検索キーワード格納手段と、前記ユーザー端末からの要求に応じて前記取得情報格納ファイルに格納された前記サイト情報を前記ユーザー端末に配信する配信手段と、を有し、前記ユーザー端末から入力された検索キーワードと検索重み付けパラメータとに基づいて前記情報抽出手段により抽出された前記情報を前記ユーザー端末に配信することを特徴とする。
従って、前記ユーザー端末において、前記キーワード入力手段によって、検索キーワードと検索重み付けパラメータとを入力した場合には、前記キーワード送信手段によって、前記入力された検索キーワードと検索重み付けパラメータとが前記検索サーバーへ送信される。
その後、前記検索サーバーにおいて、前記検索キーワード格納手段によって、前記送信された検索キーワードと検索重み付けパラメータとが前記検索キーワード格納ファイルに格納され、前記情報抽出手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連する情報が、前記取得情報格納ファイルに格納された前記サイト情報から抽出される。
さらに、前記ユーザー端末から要求した場合には、前記検索サーバーにおいて、前記配信手段によって、前記情報抽出手段により抽出された前記情報が前記ユーザー端末に配信される。
請求項4に記載の発明にあっては、前記検索対象格納ファイルには、前記各検索対象サイトのドキュメントルートのURLが格納され、前記サイト構造解析手段により解析された前記各検索対象サイトのサイト構造に基づいて、前記各検索対象サイトに含まれるウェブページのURLを取得し、前記ウェブページのURLを前記検索対象格納ファイルに格納する検索対象更新手段を有していることを特徴とする。
従って、前記検索対象更新手段によって、前記各検索対象サイトのサイト構造に基づいて取得された前記各検索対象サイトに含まれるウェブページのURLが前記検索対象格納ファイルに格納される。
請求項5に記載の発明にあっては、前記選定した分野はニュースであって、前記検索対象サイトは新聞社又は放送局により構成される報道機関のウェブサイトであることを特徴とする。
従って、前記検索対象格納手段によって、ニュースの分野に適合した新聞社又は放送局により構成される報道機関のウェブサイトが検索対象サイトとして前記検索対象格納ファイルに格納される。
請求項6に記載の発明にあっては、検索キーワードと広告価値パラメータとを前記検索キーワード格納ファイルに格納する検索キーワード格納手段と、前記サイト情報の広告価値を評価する広告価値評価手段と、前記検索キーワードに対応する語句が出現する前記サイト情報の広告価値が前記広告価値パラメータ以上である場合に、前記検索キーワードに関連する情報を前記取得情報格納ファイルに格納された前記サイト情報から抽出する情報抽出手段とを有していることを特徴とする。
ここで、「広告価値パラメータ」とは、前記各検索対象サイトに掲載する広告の費用を基に、前記検索キーワードに対応する語句が出現する前記サイト情報の広告的な価値を関数化したものである。
すなわち、「広告価値パラメータ」を前記各検索対象サイトにおける前記サイト情報の広告価値と比較することによって、広告価値が高い検索対象サイトのみを抽出し、前記抽出した検索対象サイトから情報を取得することが可能となる。
従って、検索キーワードと広告価値パラメータとを前記検索キーワード格納ファイルに格納した場合には、前記広告価値評価手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句が出現する前記サイト情報の広告価値が評価され、前記情報抽出手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句が出現する前記サイト情報の広告価値が前記広告価値パラメータ以上である場合に、前記検索キーワードに関連する情報が、前記取得情報格納ファイルに格納された前記サイト情報から抽出される。
請求項7記載の発明にあっては、前記広告価値評価手段は、前記情報が表示される前記検索対象サイト上のページにおける広告料金に基づいて広告価値を定めることを特徴とする。
請求項8に記載の発明にあっては、検索キーワードとニュアンスパラメータとを前記検索キーワード格納ファイルに格納する検索キーワード格納手段と、前記サイト情報のニュアンスを評価するニュアンス評価手段と、前記検索キーワードに対応する語句が出現する前記サイト情報のニュアンスが前記ニュアンスパラメータ以下である場合に、前記検索キーワードに関連する情報を前記取得情報格納ファイルに格納された前記サイト情報から抽出する情報抽出手段とを有していることを特徴とする。
ここで、「ニュアンスパラメータ」とは、前記検索キーワードに対応する語句が出現する前記サイト情報のニュアンス(印象)を人工知能等のような自動システムや人間の判断により、数値化したものである。
すなわち、情報が良い内容(good)であれば高く(プラス評価)、悪い内容(bad)であれば低く(マイナス評価)、事実を述べただけの中立的な内容(neutral)であれば0(ゼロ評価)とするものとする。
その結果、「ニュアンスパラメータ」を前記各検索対象サイトにおける前記サイト情報のニュアンスと比較することによって、ニュアンスが低い検索対象サイトのみを抽出し、前記抽出した検索対象サイトから情報を取得することが可能となる。
従って、検索キーワードとニュアンスパラメータとを前記検索キーワード格納ファイルに格納した場合には、前記ニュアンス評価手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句が出現する前記サイト情報のニュアンスが評価され、前記情報抽出手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句が出現する前記サイト情報のニュアンスが前記ニュアンスパラメータ以下である場合に、前記検索キーワードに関連する情報が、前記取得情報格納ファイルに格納された前記サイト情報から抽出される。
請求項9に記載の発明にあっては、前記ニュアンス評価手段は、過去に蓄積されたビッグデータ及びナレッジマネジメントに基づいて評価することを特徴とする。
請求項10に記載の発明にあっては、検索キーワードと検索期間パラメータとを前記検索キーワード格納ファイルに格納する検索キーワード格納手段と、前記検索キーワードに対応する語句が出現する前記サイト情報を取得したタイムスタンプが前記検索期間パラメータ内である場合に、前記検索キーワードに関連する情報を前記取得情報格納ファイルに格納された前記サイト情報から抽出する情報抽出手段とを有していることを特徴とする。
ここで、「検索期間パラメータ」とは、検索の対象とする期間を指定するための関数である。
従って、検索キーワードと検索期間パラメータとを前記検索キーワード格納ファイルに格納した場合には、前記情報抽出手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句が出現する前記サイト情報のタイムスタンプが前記検索期間パラメータ内である場合に、前記検索キーワードに関連する情報が、前記取得情報格納ファイルに格納された前記サイト情報から抽出される。
請求項11に記載の発明にあっては、複数のウェブサイト及びユーザー端末にインターネットを介して接続された検索サーバーを備えた検索システムであって、前記ユーザー端末は、検索キーワードと検索重み付けパラメータとを入力するキーワード入力手段と、前記入力された検索キーワードと検索重み付けパラメータとを前記検索サーバーへ送信するキーワード送信手段とを有し、前記検索サーバーは、前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして検索対象格納ファイルに格納する検索対象格納手段と、前記検索対象格納ファイルに格納された検索対象サイトについて、各検索対象サイトのサイト構造を解析するサイト構造解析手段と、前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得するサイト情報取得手段と、前記各検索対象サイトから取得した前記サイト情報を取得情報格納ファイルに格納するサイト情報格納手段と、前記ユーザー端末から送信された検索キーワードと検索重み付けパラメータとを検索キーワード格納ファイルに格納する検索キーワード格納手段と、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連する情報を前記取得情報格納ファイルに格納されたサイト情報から抽出する情報抽出手段と、を有し、前記ユーザー端末から入力された検索キーワードと検索重み付けパラメータとに基づいて前記情報抽出手段により抽出された前記情報を前記ユーザー端末に出力することを特徴とする。
従って、前記検索対象格納手段によって、前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして前記検索対象格納ファイルに格納した場合には、前記検索サーバーは、前記サイト構造解析手段によって、前記検索対象格納ファイルに格納された検索対象サイトに基づいて、各検索対象サイトのサイト構造を解析し、前記サイト情報取得手段によって、前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得し、前記サイト情報格納手段によって、前記各検索対象サイトから取得した前記サイト情報が取得情報格納ファイルに格納される。
その後、前記ユーザー端末において、前記キーワード入力手段によって、検索キーワードと検索重み付けパラメータとを入力した場合には、前記キーワード送信手段によって、前記入力された検索キーワードと検索重み付けパラメータとが前記検索サーバーへ送信される。
その後、前記検索サーバーにおいて、前記検索キーワード格納手段によって、前記送信された検索キーワードと検索重み付けパラメータとが前記検索キーワード格納ファイルに格納され、前記情報抽出手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連する情報が、前記取得情報格納ファイルに格納された前記サイト情報から抽出され、前記ユーザー端末に出力される。
請求項12に記載の発明にあっては、複数のウェブサイト及びユーザー端末にインターネットを介して接続された検索サーバーを備え、前記検索サーバーから抽出した情報のうち前記ユーザー端末が要求する情報を配信する検索情報配信システムであって、前記ユーザー端末は、検索キーワードを入力するキーワード入力手段と、前記入力された検索キーワードを前記検索サーバーへ送信するキーワード送信手段とを有し、前記検索サーバーは、前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして検索対象格納ファイルに格納する検索対象格納手段と、前記検索対象格納ファイルに格納された検索対象サイトについて、各検索対象サイトのサイト構造を解析するサイト構造解析手段と、前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得するサイト情報取得手段と、前記各検索対象サイトから取得した前記サイト情報を取得情報格納ファイルに格納するサイト情報格納手段と、前記ユーザー端末から送信された検索キーワードと検索重み付けパラメータとを検索キーワード格納ファイルに格納する検索キーワード格納手段と、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連する情報を前記取得情報格納ファイルに格納されたサイト情報から抽出する情報抽出手段と、前記ユーザー端末からの要求に応じて前記取得情報格納ファイルに格納された前記サイト情報を前記ユーザー端末に配信する配信手段と、を有し、前記検索サーバーは、前記ユーザー端末から入力された検索キーワードと検索重み付けパラメータとに基づいて前記情報抽出手段により抽出された前記情報を前記ユーザー端末に配信することを特徴とする。
従って、前記検索対象格納手段によって、前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして前記検索対象格納ファイルに格納した場合には、前記検索サーバーは、前記サイト構造解析手段によって、前記検索対象格納ファイルに格納された検索対象サイトに基づいて、各検索対象サイトのサイト構造を解析し、前記サイト情報取得手段によって、前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得し、前記サイト情報格納手段によって、前記各検索対象サイトから取得した前記サイト情報が取得情報格納ファイルに格納される。
その後、前記ユーザー端末において、前記キーワード入力手段によって、検索キーワードと検索重み付けパラメータとを入力した場合には、前記キーワード送信手段によって、前記入力された検索キーワードと検索重み付けパラメータとが前記検索サーバーへ送信される。
その後、前記検索サーバーにおいて、前記検索キーワード格納手段によって、前記送信された検索キーワードと検索重み付けパラメータとが前記検索キーワード格納ファイルに格納され、前記情報抽出手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連する情報が、前記取得情報格納ファイルに格納された前記サイト情報から抽出される。
さらに、前記ユーザー端末から要求した場合には、前記検索サーバーにおいて、前記配信手段によって、前記情報抽出手段により抽出された前記情報が前記ユーザー端末に配信される。
請求項13に記載の発明にあっては、複数のウェブサイトと通信可能であると共に、ユーザー端末と通信可能な検索サーバーが実行する検索プログラムであって、前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして検索対象格納ファイルに格納するステップと、前記検索対象格納ファイルに格納された検索対象サイトについて、各検索対象サイトのサイト構造を解析するステップと、前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得するステップと、前記各検索対象サイトから取得した前記サイト情報を取得情報格納ファイルに格納するステップと、前記ユーザー端末から送信された検索キーワードと検索重み付けパラメータとを検索キーワード格納ファイルに格納するステップと、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連する情報を前記取得情報格納ファイルに格納されたサイト情報から抽出するステップと、抽出された前記情報を前記ユーザー端末に出力するステップとを、前記検索サーバーに実行させることを特徴とする。
従って、前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして前記検索対象格納ファイルに格納した場合には、前記検索サーバーにおいて、前記検索対象格納ファイルに格納された検索対象サイトに基づいて、各検索対象サイトのサイト構造を解析し、前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得し、前記各検索対象サイトから取得した前記サイト情報が取得情報格納ファイルに格納される。
その後、前記ユーザー端末において、検索キーワードと検索重み付けパラメータとを入力した場合には、前記入力された検索キーワードと検索重み付けパラメータとが前記検索サーバーへ送信される。
その後、前記検索サーバーにおいて、前記送信された検索キーワードと検索重み付けパラメータとが前記検索キーワード格納ファイルに格納され、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連する情報が、前記取得情報格納ファイルに格納された前記サイト情報から抽出され、前記ユーザー端末に出力される。
請求項14に記載の発明にあっては、複数のウェブサイトと通信可能であると共に、ユーザー端末と通信可能な検索サーバーが実行する検索情報配信プログラムであって、前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして検索対象格納ファイルに格納するステップと、前記検索対象格納ファイルに格納された検索対象サイトについて、各検索対象サイトのサイト構造を解析するステップと、前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得するステップと、前記各検索対象サイトから取得した前記サイト情報を取得情報格納ファイルに格納するステップと、前記ユーザー端末から送信された検索キーワードと検索重み付けパラメータとを検索キーワード格納ファイルに格納するステップと、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連する情報を前記取得情報格納ファイルに格納された前記サイト情報から抽出するステップと、抽出された前記情報を前記ユーザー端末に配信するステップとを、前記検索サーバーに実行させることを特徴とする。
従って、前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして前記検索対象格納ファイルに格納した場合には、前記検索サーバーにおいて、前記検索対象格納ファイルに格納された検索対象サイトに基づいて、各検索対象サイトのサイト構造を解析し、前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得し、前記各検索対象サイトから取得した前記サイト情報が取得情報格納ファイルに格納される。
その後、前記ユーザー端末において、検索キーワードと検索重み付けパラメータとを入力した場合には、前記入力された検索キーワードと検索重み付けパラメータとが前記検索サーバーへ送信される。
その後、前記検索サーバーにおいて、前記送信された検索キーワードと検索重み付けパラメータとが前記検索キーワード格納ファイルに格納され、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連する情報が、前記取得情報格納ファイルに格納された前記サイト情報から抽出される。
さらに、前記ユーザー端末から要求した場合には、前記検索サーバーにおいて、抽出された前記サイト情報が前記ユーザー端末に配信される。
請求項1及び2に記載の検索サーバー、請求項11に記載の検索システム、請求項13に記載の検索プログラムにあっては、前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして前記検索対象格納ファイルに格納した場合には、前記検索サーバーは、前記検索対象格納ファイルに格納された検索対象サイトに基づいて、各検索対象サイトのサイト構造を解析し、前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得し、前記各検索対象サイトから取得した前記サイト情報が取得情報格納ファイルに格納されるので、前記各検索対象サイトに記述されたサイト情報を予め前記検索サーバーの前記取得情報格納ファイルに格納しておくことができる。
その後、検索キーワードと検索重み付けパラメータとを前記検索キーワード格納ファイルに格納した場合には、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連する情報が、前記取得情報格納ファイルに格納された前記サイト情報から抽出されるので、前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトに限定すると共に、前記検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上のウェブサイトに限定して検索することができる。
従って、従来の一般の検索エンジンにあっては、無関係なウェブサイトを大量に検索結果に表示してしまうため、ユーザーはその検索結果からさらに精査をして、必要な情報を選別しなければならないという事態を生じていたのに対し、請求項1及び2に記載の検索サーバー、請求項11に記載の検索システム、請求項13に記載の検索プログラムにあっては、前記事態を生じることがなく、その結果、有益な情報を正確かつ迅速に得ることができる。
また、前記検索キーワードに関連する情報は、前記検索サーバーに格納された前記取得情報格納ファイルに格納された前記サイト情報から抽出されるので、検索する毎に前記各検索対象サイトを巡回する必要がなく、有益な情報をさらに迅速に得ることができる。
特に、前記検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上のウェブサイトに限定して検索することができるので、検索キーワードが使用されていても見る必要性の低いサイトを検索の段階で予め排除することができ、その結果、有益な情報をさらに正確に得ることができる。
請求項3に記載の検索サーバー、請求項12に記載の検索情報配信システム、請求項14に記載の検索情報配信プログラムにあっては、前記ユーザー端末から要求した場合には、前記情報抽出手段により抽出された情報が前記ユーザー端末に配信されるので、ユーザーが能動的に検索することなく、前記検索キーワードに関連する情報を得ることができる。
具体的には、例えば、ある特定の会社の動向を調べるために、当該特定の「会社名」を検索キーワードとして入力した場合には、予め選定した分野に適合したウェブサイトに記載された、その会社に関する評判等の最新情報を1時間ごとに自動的に配信することができる。
請求項4に記載の検索サーバーにあっては、前記検索対象更新手段によって、前記各検索対象サイトのサイト構造に基づいて取得された前記各検索対象サイトに含まれるウェブページのURLが前記検索対象格納ファイルに格納されるので、前記各検索対象サイトのサイト構造を再び解析することなく、前記サイト情報取得手段によって、前記各検索対象サイトに記述されたサイト情報を取得することができる。
また、前記各検索対象サイトのウェブサイトの更新等により、前記各検索対象サイトのサイト構造が変更された場合であっても、前記検索対象格納ファイルに格納されている前記各検索対象サイトのドキュメントルートのURLに基づいて、再び前記サイト構造解析手段により前記各検索対象サイトのサイト構造が解析され、前記検索対象更新手段によって、変更後の各検索対象サイトのサイト構造に基づいて取得された前記各検索対象サイトに含まれるウェブページのURLが前記検索対象格納ファイルに格納されるので、変更後の前記各検索対象サイトを巡回し、前記各検索対象サイトに記述されたサイト情報を確実に取得することができる。
請求項5に記載の検索サーバーにあっては、前記検索対象格納手段によって、ニュースの分野に適合した新聞社又は放送局により構成される報道機関のウェブサイトが検索対象サイトとして前記検索対象格納ファイルに格納されるので、ユーザーは前記報道機関のウェブサイトに限定して検索することができる。
その結果、請求項5に記載の検索システムにあっては、大手新聞社、地方新聞社、ニュース配信会社、テレビ会社等により構成される報道機関のウェブサイトに掲載された時事情報に関するニュースを、このような様々なサイトから網羅的に正確かつ迅速に取得することができる。
請求項6に記載の検索サーバーにあっては、検索キーワードと広告価値パラメータとを前記検索キーワード格納ファイルに格納した場合には、前記広告価値評価手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句が出現する前記サイト情報の広告価値が評価され、前記情報抽出手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句が出現する前記サイト情報の広告価値が前記広告価値パラメータ以上である場合に、前記検索キーワードに関連する情報が、前記取得情報格納ファイルに格納された前記サイト情報から抽出される。
その結果、前記検索キーワードに関連する情報の内、前記サイト情報の広告価値が高い、すなわち記事への信頼性が高い情報に限定して検索することができる。
請求項7に記載の検索サーバーにあっては、前記広告価値評価手段は、前記情報が表示される前記検索対象サイト上のページにおける広告料金に基づいて広告価値を定めるので、広告価値を客観的な基準に基づいて評価することができる。
請求項8に記載の検索サーバーにあっては、検索キーワードとニュアンスパラメータとを前記検索キーワード格納ファイルに格納した場合には、前記ニュアンス評価手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句が出現する前記サイト情報のニュアンスが評価され、前記情報抽出手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句が出現する前記サイト情報のニュアンスが前記ニュアンスパラメータ以下である場合に、前記検索キーワードに関連する情報が、前記取得情報格納ファイルに格納された前記サイト情報から抽出される。
その結果、例えば、ある特定の「会社名」を検索キーワードとして入力した場合には、ウェブサイトに記載されたその会社に関する評判等の情報の内、ニュアンスの低い情報、すなわちその会社にとって悪い情報に限定して検索することができる。従って、検索された情報を基にその会社の企業価値やブランディング、リスク管理を行なうことができる。
請求項9に記載の検索サーバーにあっては、前記ニュアンス評価手段は、過去に蓄積されたビッグデータ及びナレッジマネジメントに基づいて評価するので、ニュアンスを自動的に、かつ、客観的に評価することができる。
請求項10に記載の検索サーバーにあっては、検索キーワードと検索期間パラメータとを前記検索キーワード格納ファイルに格納した場合には、前記情報抽出手段によって、前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句が出現する前記サイト情報のタイムスタンプが前記検索期間パラメータ内である場合に、前記検索キーワードに関連する情報が、前記取得情報格納ファイルに格納された前記サイト情報から抽出されるので、特定の期間に限定して検索することができる。その結果、古い情報やリンク切れの情報を除外して、最新の情報のみを抽出することができ、高い精度で検索することができる。
図1は、本発明に係る検索サーバー及び検索情報配信システムの一実施の形態を示すブロック図である。 図2は、本発明に係る検索サーバー及び検索情報配信システムの一実施の形態において、検索サーバー及び検索情報配信システムの動作を示す模式図である。 図3は、本発明に係る検索サーバーの一実施の形態において、検索サーバー内のデータベースの構成を示すブロック図である。 図4は、本発明に係る検索サーバー及び検索情報配信システムの一実施の形態において、検索サーバー及び検索情報配信システムにおける処理の流れを示すフローチャートである。 図5は、本発明に係る検索サーバー及び検索情報配信システムの一実施の形態において、ユーザー端末における検索画面を表す模式図である。
以下、添付図面に示す実施の形態に基づき、本発明を詳細に説明する。
(1)本実施の形態に係る検索情報配信システムの構成
図1及び図2に示すように、本発明の一実施の形態に係る検索情報配信システム10は、複数のウェブサイト11、11・・・及びユーザー端末12にインターネット13を介して接続された検索サーバー14を備えている。
なお、図1では、作図の都合により検索サーバー14及びウェブサイト11、11・・・を接続するインターネット13と、検索サーバー14及びユーザー端末12、12・・・を接続するインターネット13とを個別のものとして描いているが、両者は同一のものである。
図1に示すように、本実施の形態に係るユーザー端末12は、検索キーワードと検索重み付けパラメータとを入力するキーワード入力手段15と、入力された検索キーワードと検索重み付けパラメータとを検索サーバー14へ送信するキーワード送信手段16とを有している。
図1及び図2に示すように、本実施の形態に係る検索サーバー14は、ウェブサイト11、11・・・を巡回してサイト情報を取得する情報取得部17と、取得したサイト情報から検索キーワードに関するサイト情報を抽出する情報検索部18と、検索対象サイト、取得したサイト情報及び検索キーワードを格納するデータベース19と、検索対象サイトのサイト構造を更新する検索対象更新手段20とを有している。
また、図1に示すように、本実施の形態に係る検索サーバー14は、ウェブサイト11、11・・・をインターネット13経由で接続するウェブサイト接続手段21と、ユーザー端末12、12・・・をインターネット13経由で接続するユーザー端末接続手段22とを有している。
図3に示すように、本実施の形態に係るデータベース19は、ウェブサイト11、11・・・のURLを格納する検索対象格納ファイル23と、ウェブサイト11、11・・・から取得したサイト情報を格納する取得情報格納ファイル24と、検索キーワードと検索重み付けパラメータとを格納する検索キーワード格納ファイル25とを有している。
図1に示すように、本実施の形態に係る情報取得部17は、複数のウェブサイト11、11・・・の中から予め選定した分野に適合したウェブサイトを検索対象サイト11a、11a・・・として、データベース19内の検索対象格納ファイル23に格納する検索対象格納手段26と、検索対象格納ファイル23に格納された検索対象サイト11a、11a・・・について、各検索対象サイト11a、11a・・・のサイト構造を解析するサイト構造解析手段27と、各検索対象サイト11a、11a・・・を巡回し、解析したサイト構造に基づいて各検索対象サイト11a、11a・・・に記述されたサイト情報を取得するサイト情報取得手段28と、各検索対象サイト11a、11a・・・から取得したサイト情報を取得情報格納ファイル24に格納するサイト情報格納手段29と、を有している。
また、図1に示すように、本実施の形態に係る情報検索部18は、ユーザー端末12、12・・・から送信された検索キーワードと検索重み付けパラメータとを検索キーワード格納ファイル25に格納する検索キーワード格納手段30と、検索キーワード格納ファイル25に格納された検索キーワードに対応する語句の出現回数が検索重み付けパラメータ以上である場合に、検索キーワードに関連する情報を取得情報格納ファイル24に格納されたサイト情報から抽出する情報抽出手段31と、ユーザー端末12、12・・・からの要求に応じて取得情報格納ファイル24に格納されたサイト情報をユーザー端末12、12・・・に配信する情報配信手段32と、サイト情報の広告価値を評価する広告価値評価手段33と、サイト情報のニュアンスを評価するニュアンス評価手段34とを有している。
図1に示すように、本実施の形態に係る検索対象格納手段26は、インターネット13に接続された多数のウェブサイト11、11・・・を網羅的に調査して予め選定した分野に適合した検索対象サイト11a、11a・・・のドキュメントルートのURLを格納する。
ここでドキュメントルートとは、ウェブサイトが設置されたサーバーにアクセスした際の最上位フォルダ/ディレクトリを指す概念である。
また、本実施の形態においては、検索対象サイト11a、11a・・・として、ニュースに関する報道機関のウェブサイトのURLを格納する。
このようなサイトの抽出については、予めニュースサイトと判断されるサイトを選定しておいたリストによる他、自動的にウェブサイトを巡回して新たな検索対象サイトを検出することにより行うことができる。また、オペレーターによる判断によって行うことができる。
また、報道機関のウェブサイトとしては、大手新聞社、地方新聞社、ニュース配信会社、テレビ局、ラジオ局、ポータルサイト、ニュースまとめサイト等が挙げられる。これらのサイトは定期的に選定を見直すことが望ましい。
本実施の形態に係るサイト構造解析手段27は、検索対象格納ファイル23に格納された各検索対象サイト11a、11a・・・のドキュメントルートのURLに基づいて各検索対象サイト11a、11a・・・にアクセスし、検索対象サイト11a、11a・・・の構造を解析する。
解析は、対象とする検索対象サイトのサイトマップに基づいて行うことの他、対象とする検索対象サイトを自動的又はオペレーターによって判断することにより行う。このようなサイトの構造解析は、定期的又は随時行い、検索対象サイトの最新の構造を取得しておく。なお、構造の解析は、構造が定型であれば、ソフトウエアにより自動的に行う。また、定型でないものについては個別に解析を行う。
図1及び図2に示すように、本実施の形態に係る検索対象更新手段20は、サイト構造解析手段27により解析された各検索対象サイト11a、11a・・・のサイト構造に基づいて、各検索対象サイト11a、11a・・・に含まれるウェブページのURLを取得し、ウェブページのURLを検索対象格納ファイル23に格納する。
従って、検索対象格納ファイル23には、当初、検索対象サイト11a、11a・・・のドキュメントルートのURLのみ(例えば、http://www.xxx.yyy/)が格納されていたのに対して、サイト構造解析手段27が各検索対象サイト11a、11a・・・のサイト構造を解析した後は、検索対象格納ファイル23にはドキュメントルートのURLに加えて、各検索対象サイト11a、11a・・・に含まれるウェブページのURL(例えば、http://www.xxx.yyy/page1.html、http://www.xxx.yyy/page2.html、・・・)が格納される。
その結果、サイト構造解析手段27によって解析された検索対象サイト11a、11a・・・のサイト構造が、各検索対象サイト11a、11a・・・に含まれるウェブページのURLとして、検索対象格納ファイル23に格納されることになる。
図1に示すように、本実施の形態に係るサイト情報取得手段28は、検索対象サイト11a、11a・・・の全てを定期的、例えば1時間に1回、又は必要に応じて随時巡回し、巡回した検索対象サイト11a、11a・・・に記述された新規サイト情報を収集する。
本実施の形態においては、各巡回に際して、各検索対象サイト11a、11a・・・に新たなサイト情報が記述されているかを、検索対象格納ファイル23に格納された各検索対象サイト11a、11a・・・に含まれるウェブページのURLに基づいて取得していくことができる。
このような巡回は自動的に行われ、新規サイト情報の収集は、新規であるとして記述されているものを取得する他、前回の巡回時の記録と比較して異なる内容のものを取得することができる。また、巡回の頻度は検索対象サイトにおける更新の頻度に応じて変更することができる。
図3に示すように、本実施の形態に係るサイト情報格納手段29は、取得したサイト情報を、検索対象サイトにおける記述時刻、収集時刻、検索キーワード等に基づいて検索可能に整理した状態で取得情報格納ファイル24に格納する。サイト情報の格納形式は、必要に応じて適宜選択することができる。データ量がなるべく少なく効率的に格納でき、迅速に検索できる形式が望ましい。
図1に示すように、本実施の形態に係る検索キーワード格納手段30は、ユーザー端末12、12・・・から送信された検索キーワードと検索重み付けパラメータとを検索キーワード格納ファイル25に格納する。
例えば、図5に示すように、ユーザー端末12において、キーワード入力フォーム36に「原発(3)」と入力された場合には、検索キーワード格納手段30は、検索キーワードが「原発」、検索重み付けパラメータが「3」であると判断して検索キーワード格納ファイル25に格納する。
図1に示すように、本実施の形態に係る情報抽出手段31は、検索キーワード格納ファイル25に格納された検索キーワードと検索重み付けパラメータとに基づいて取得情報格納ファイル24を検索する。このとき、検索対象サイトに記述された時期、サイト情報が取得された時期を選択することができる。選択できる時期は任意であり、一定期間前から現在まで、過去における一定期間等が指定できる。
特に、本実施の形態に係る情報抽出手段31は、取得情報格納ファイル24内において、検索キーワードに対応する語句を含むサイト情報のうち、当該語句の出現回数と、検索キーワード格納ファイル25に格納された検索重み付けパラメータとを比較する。
その結果、当該語句の出現回数が検索重み付けパラメータ以上の値を有している場合には、当該サイト情報を抽出する。一方、当該語句の出現回数が検索重み付けパラメータ未満の値であった場合には、当該サイト情報を抽出しない。
例えば、検索キーワード格納ファイル25には検索キーワード「原発」、検索重み付けパラメータ「3」が格納され、取得情報格納ファイル24に格納されたサイト情報として、検索対象サイトα(http://www.xxx.yyy/page1.html)及び検索対象サイトβ(http://www.xxx.yyy/page2.html)が格納されているとする。
ここで、検索対象サイトα(http://www.xxx.yyy/page1.html)には、語句「原発」が「5」回出現し、検索対象サイトβ(http://www.xxx.yyy/page2.html)には、語句「原発」が「2」回出現しているものとする。
この場合、まず検索キーワード「原発」を含む検索対象サイトα及びβが抽出され、夫々のサイトにおける「原発」の出現回数と、検索重み付けパラメータとを比較することになる。
その結果、検索対象サイトαでは、「原発」の出現回数が「5」であり、検索重み付けパラメータの「3」以上であることから、検索対象サイトαのサイト情報は抽出される。
一方、検索対象サイトβでは、「原発」の出現回数が「2」であり、検索重み付けパラメータの「3」未満であることから、検索対象サイトβのサイト情報は抽出されない。
図1に示すように、本実施の形態に係る情報配信手段32は、ユーザー端末12にデータベース19内の取得情報格納ファイル24に格納されたサイト情報を配信する。情報配信手段32は、ユーザー端末12から送信された検索キーワードに関する情報を取得した場合、その旨、及びその情報をユーザー端末12に配信することができる。この場合も情報取得を行う任意の期間、即ち現在から特定日時まで、未来の一定期間等の指定ができる。
また、図1に示すように、広告価値評価手段33は、情報、例えば商品についてのニュースの広告価値を評価する。評価は、ニュースの掲載サイトの広告換算値に基づいて行われる。広告換算値は、例えば当該ニュースが表示されているページにおける広告掲載料金を参考にして決定することができる。広告掲載料金が高い大手新聞サイトの第1面に情報が記述されている場合には、広告換算値が大きく、広告価値が高くなる。
また、図1に示すように、ニュアンス評価手段34は、情報のニュアンス(印象)を評価する。この評価は、情報、例えば商品や会社についての記述が良い内容(good)であれば高く(プラス評価)、悪い内容(bad)であれば低く(マイナス評価)、事実を述べただけの中立的な内容(neutral)であれば0(ゼロ評価)とするものとする。
ニュアンス評価は、過去に蓄積されたビッグデータ及びナレッジマネジメントに基づいて自動的に行うことができる。この場合には、過去に蓄積した膨大な記事についてのデータに基づいてその傾向を計算する。また、オペレーターの判断により評価を行うことができる。
図5は、本実施の形態に係るユーザー端末12において、検索画面を表す模式図である。
図5に示すように、期間選択メニュー35は、検索対象サイトに記述された時期、サイト情報が取得された時期を選択するためのメニューである。選択できる時期は任意であり、一定期間前から現在まで、過去における一定期間等が指定できる。また、キーワード入力フォーム36は、検索キーワードを入力するためのフォームである。
図5に示すように、広告価値メニュー37は、広告価値に基づいて検索される情報を限定するためのメニューである。サイトジャンルボタン38は、予め選定しておいたリストに基づいて、検索対象サイトを限定するためのボタンである。
図5に示すように、同一記事省略ボタン39は、ある通信社が各地方紙へ同一タイトルの記事を配信した場合に、各地方紙への配信記事を検索対象から除外し一つに絞るためのボタンである。
また、図5に示すように、ニュアンス選択ボタン40は、ニュアンスに基づいて検索される情報を限定するためのボタンである。
本実施の形態に係る検索サーバー14は、コンピューターとして構成されている。図示しないが、検索サーバー14は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)、ハードディスクドライブ(hard Disc Drive)、インターネット13に接続するための通信制御手段、キーボード、マウス等の入力手段、プリンタ、モニター等の出力手段をバスで接続して構成されている。
本実施の形態に係るデータベース19は、ハードディスクドライブ内に構築してもよいし、外部の記憶媒体に構築することもできる。
本実施の形態に係る検索サーバー14は、本発明の実施形態に係る検索情報配信プログラムを、RAMをワークエリアとしてCPUで実行することにより本実施の形態に係る各機能を実現する。
(2)本実施の形態に係る検索情報配信システムの処理の流れ
図4に示すように、本実施の形態に係る検索情報配信システム10は以下の工程に従って処理を行う。まず、検索対象格納手段26によってインターネット13に接続された複数のウェブサイト11、11・・・の中から予め選定した分野、例えばニュースに関する報道機関のウェブサイトを検索対象サイト11a、11a・・・として選定し、検索対象サイト11a、11a・・・のドキュメントルートのURLを、データベース19内の検索対象格納ファイル23に格納する(S1)。
これにより、巡回対象となる検索対象サイトが選択され、不必要な情報収集のために使用される無駄な時間や、ノイズ情報の収集がなくなり、高精度となる。
次いで、抽出した検索対象サイト11a、11a・・・のサイト構造をサイト構造解析手段27で解析し、各検索対象サイト11a、11a・・・のサイト構造を把握する(S2)。
この状態で、検索対象更新手段20によって、各検索対象サイト11a、11a・・・のサイト構造に基づいて取得された各検索対象サイト11a、11a・・・に含まれるウェブページのURLをデータベース19内の検索対象格納ファイル23に格納する(S3)。
これにより、巡回対象となる検索対象サイトに含まれるウェブページを把握することができ、次に巡回する際にサイト構造の解析時間を短縮することができる。
次いで、サイト情報取得手段28によって各検索対象サイト11a、11a・・・を定期的、あるいは順次巡回し、各検索対象サイト11a、11a・・・に記述されたサイト情報を取得する(S4)。
その後、サイト情報格納手段29によって、取得されたサイト情報をデータベース19内の取得情報格納ファイル24に検索可能に格納する(S5)。
ここで、ユーザー端末12、12・・・において、キーワード入力手段15によって検索キーワードと検索重み付けパラメータとが入力されることにより、情報配信の要求があった場合には、ユーザー端末接続手段22がユーザー端末12と検索サーバー14とを接続し、キーワード送信手段16によって検索キーワードと検索重み付けパラメータとがユーザー端末12、12・・・から検索サーバーに送信される。
その後、検索キーワード格納手段30によって検索キーワードと検索重み付けパラメータとがデータベース19内の検索キーワード格納ファイル25に格納される。
次いで、情報抽出手段31によって、検索キーワード格納ファイル25に格納された検索キーワードに関連する情報を、取得情報格納ファイル24を検索して抽出する。
特に、本実施の形態に係る情報抽出手段31は、取得情報格納ファイル24内において、検索キーワードに対応する語句を含むサイト情報のうち、当該語句の出現回数と、検索キーワード格納ファイル25に格納された検索重み付けパラメータとを比較する。
その結果、当該語句の出現回数が検索重み付けパラメータ以上の値を有している場合に限り、当該情報を抽出する(S6)。
これにより、たとえ検索キーワードが使用されていても、検索キーワードの出現回数が少なく重要性が低いと判断されるサイト情報が抽出されなくなるので、検索キーワードの出現回数が多く重要性が高いと判断されるサイト情報のみを抽出することができる。
最後に、情報配信手段32によって、抽出された情報を、ユーザー端末接続手段22を介して、ユーザー端末12、12・・・に配信する(S7)。
このとき、ユーザー端末12は、情報を取得するタイミングを選択することができる。例えば、ユーザー端末12は、検索キーワードを入力した直後に検索キーワードに関連する情報を配信するように検索サーバー14に要求することで、リアルタイムの検索が可能となる。
また、一方で、ユーザー端末12は、検索キーワードの入力のみを行い、所定の時間毎に検索キーワードに関連する情報を配信するように検索サーバー14に要求することもできる。例えば、ユーザー端末12から1時間毎に配信するように要求した場合には、検索キーワードに関連する最新の情報を定期的に入手することができる。
ここで、広告価値に基づいて情報を抽出する場合には、図4中、S5まで処理した後に、S6に代えて以下の処理を行なう。
ユーザー端末12、12・・・において、キーワード入力手段15によって検索キーワードと広告価値パラメータとが入力されることにより、情報配信の要求があった場合には、ユーザー端末接続手段22がユーザー端末12と検索サーバー14とを接続し、キーワード送信手段16によって検索キーワードと広告価値パラメータとがユーザー端末12、12・・・から検索サーバーに送信され、その後、検索キーワード格納手段30によって検索キーワードと広告価値パラメータとがデータベース19内の検索キーワード格納ファイル25に格納される。
次いで、広告価値評価手段33によって、検索キーワード格納ファイル23に格納された検索キーワードに対応する語句が出現するサイト情報の広告価値が評価される。
さらに、情報抽出手段31によって、検索キーワード格納ファイル25に格納された検索キーワードに関連する情報を、取得情報格納ファイル24を検索して抽出する。
特に、本実施の形態に係る情報抽出手段31は、取得情報格納ファイル24内において、検索キーワードに対応する語句が出現するサイト情報の広告価値と、検索キーワード格納ファイル25に格納された広告価値パラメータとを比較する。
その結果、当該サイト情報の広告価値が広告価値パラメータ以上の値を有している場合に限り、当該情報を抽出する。
これにより、検索キーワードに関連する情報の内、サイト情報の広告価値が高い、すなわち記事への信頼性が高い情報のみを抽出することができる。
ここで、ニュアンスに基づいて情報を抽出する場合には、図4中、S5まで処理した後に、S6に代えて以下の処理を行なう。
ユーザー端末12、12・・・において、キーワード入力手段15によって検索キーワードとニュアンスパラメータとが入力されることにより、情報配信の要求があった場合には、ユーザー端末接続手段22がユーザー端末12と検索サーバー14とを接続し、キーワード送信手段16によって検索キーワードとニュアンスパラメータとがユーザー端末12、12・・・から検索サーバーに送信され、その後、検索キーワード格納手段30によって検索キーワードとニュアンスパラメータとがデータベース19内の検索キーワード格納ファイル25に格納される。
次いで、ニュアンス評価手段34によって、検索キーワード格納ファイル23に格納された検索キーワードに対応する語句が出現するサイト情報のニュアンスが評価される。
さらに、情報抽出手段31によって、検索キーワード格納ファイル25に格納された検索キーワードに関連する情報を、取得情報格納ファイル24を検索して抽出する。
特に、本実施の形態に係る情報抽出手段31は、取得情報格納ファイル24内において、検索キーワードに対応する語句が出現するサイト情報のニュアンスと、検索キーワード格納ファイル25に格納されたニュアンスパラメータとを比較する。
その結果、当該サイト情報のニュアンスがニュアンスパラメータ以下の値を有している場合に限り、当該情報を抽出する。
これにより、例えば、ある特定の「会社名」を検索キーワードとして入力した場合には、ウェブサイトに記載されたその会社に関する評判等の情報の内、ニュアンスの低い情報のみを抽出することができる。
また、期間を限定して情報を抽出する場合には、図4中、S5まで処理した後に、S6に代えて以下の処理を行なう。
ユーザー端末12、12・・・において、キーワード入力手段15によって検索キーワードと検索期間パラメータとが入力されることにより、情報配信の要求があった場合には、ユーザー端末接続手段22がユーザー端末12と検索サーバー14とを接続し、キーワード送信手段16によって検索キーワードと検索期間パラメータとがユーザー端末12、12・・・から検索サーバーに送信され、その後、検索キーワード格納手段30によって検索キーワードとニュアンスパラメータとがデータベース19内の検索キーワード格納ファイル25に格納される。
さらに、情報抽出手段31によって、検索キーワード格納ファイル25に格納された検索キーワードに関連する情報を、取得情報格納ファイル24を検索して抽出する。
特に、本実施の形態に係る情報抽出手段31は、取得情報格納ファイル24内において、検索キーワードに対応する語句が出現するサイト情報を取得したタイムスタンプと、検索キーワード格納ファイル25に格納された検索期間パラメータとを比較する。
その結果、当該サイト情報を取得したタイムスタンプが検索期間パラメータ内の値を有している場合に限り、当該情報を抽出する。これにより、特定の期間に限定して検索することができる。
(3)本実施の形態に係る検索情報配信システムの効果
図1及び図2に示すように、本実施の形態に係る検索情報配信システム10にあっては、複数のウェブサイト11、11・・・の中から予め選定した分野に適合したウェブサイトを検索対象サイト11a、11a・・・として検索対象格納ファイル23に格納した場合には、検索サーバー14は、検索対象格納ファイル23に格納された検索対象サイト11a、11a・・・に基づいて、各検索対象サイト11a、11a・・・のサイト構造を解析し、各検索対象サイト11a、11a・・・を巡回し、解析したサイト構造に基づいて各検索対象サイト11a、11a・・・に記述されたサイト情報を取得し、各検索対象サイト11a、11a・・・から取得したサイト情報に含まれる語句が、語句重み付けパラメータと共に、取得情報格納ファイル24に格納されるので、各検索対象サイト11a、11a・・・に記述されたサイト情報を予め検索サーバー14の取得情報格納ファイル24に格納しておくことができる。
その後、検索キーワードと検索重み付けパラメータとを検索キーワード格納ファイル25に格納した場合には、検索キーワード格納ファイル25に格納された検索キーワードに対応する語句を含むサイト情報のうち、語句重み付けパラメータが検索重み付けパラメータ以上である場合に、検索キーワードに関連するサイト情報が、取得情報格納ファイル24に格納されたサイト情報から抽出されるので、複数のウェブサイト11、11・・・の中から予め選定した分野に適合したウェブサイトに限定すると共に、語句重み付けパラメータが検索重み付けパラメータ以上のウェブサイトに限定して検索することができる。
従って、従来の一般の検索エンジンにあっては、無関係なウェブサイトを大量に検索結果に表示してしまうため、ユーザーはその検索結果からさらに精査をして、必要な情報を選別しなければならないという事態を生じていたのに対し、本実施の形態に係る検索情報配信システム10にあっては、前記事態を生じることがなく、その結果、有益な情報を正確かつ迅速に得ることができる。
また、検索キーワードに関連する情報は、検索サーバー14に格納された取得情報格納ファイル24に格納された情報から抽出されるので、検索する毎に各検索対象サイト11a、11a・・・を巡回する必要がなく、有益な情報をさらに迅速に得ることができる。
特に、語句重み付けパラメータが検索重み付けパラメータ以上のウェブサイトに限定して検索することができるので、検索キーワードが使用されていても見る必要性の低いサイトを検索の段階で予め排除することができ、その結果、有益な情報をさらに正確に得ることができる。
また、図1及び図2に示すように、本実施の形態に係る検索情報配信システム10にあっては、ユーザー端末12、12・・・から要求した場合には、情報抽出手段31により抽出されたサイト情報がユーザー端末12、12・・・に配信されるので、ユーザーが能動的に検索することなく、検索キーワードに関連する情報を得ることができる。
具体的には、例えば、ある特定の会社の動向を調べるために、当該特定の「会社名」を検索キーワードとして入力した場合には、予め選定した分野に適合したウェブサイト11a、11a・・・に記載された、その会社に関する評判等の最新情報を1時間ごとに自動的に配信することができる。
また、図1及び図2に示すように、本実施の形態に係る検索情報配信システム10にあっては、検索対象更新手段20によって、各検索対象サイト11a、11a・・・のサイト構造に基づいて取得された各検索対象サイト11a、11a・・・に含まれるウェブページのURLが検索対象格納ファイル23に格納されるので、各検索対象サイト11a、11a・・・のサイト構造を再び解析することなく、サイト情報取得手段28によって、各検索対象サイト11a、11a・・・に記述されたサイト情報を取得することができる。
また、各検索対象サイト11a、11a・・・のウェブサイトの更新等により、各検索対象サイト11a、11a・・・のサイト構造が変更された場合であっても、検索対象格納ファイル23に格納されている各検索対象サイト11a、11a・・・のドキュメントルートのURLに基づいて、再びサイト構造解析手段27により各検索対象サイト11a、11a・・・のサイト構造が解析され、検索対象更新手段20によって、変更後の各検索対象サイト11a、11a・・・のサイト構造に基づいて取得された各検索対象サイト11a、11a・・・に含まれるウェブページのURLが検索対象格納ファイル23に格納されるので、変更後の各検索対象サイト11a、11a・・・を巡回し、各検索対象サイト11a、11a・・・に記述されたサイト情報を確実に取得することができる。
また、本実施の形態に係る検索情報配信システム10にあっては、検索対象格納手段26によって、ニュースの分野に適合した新聞社又は放送局により構成される報道機関のウェブサイトが検索対象サイト11a、11a・・・として検索対象格納ファイル23に格納されるので、ユーザーは報道機関のウェブサイトに限定して検索することができる。
その結果、本実施の形態に係る検索情報配信システム10にあっては、大手新聞社、地方新聞社、ニュース配信会社、テレビ会社等により構成される報道機関のウェブサイトに掲載された時事情報に関するニュースを、このような様々なサイトから網羅的に正確かつ迅速に取得することができる。
また、本実施の形態に係る検索情報配信システム10にあっては、検索キーワードと広告価値パラメータとを検索キーワード格納ファイル23に格納した場合には、広告価値評価手段33によって、検索キーワード格納ファイル23に格納された検索キーワードに対応する語句が出現するサイト情報の広告価値が評価され、情報抽出手段31によって、検索キーワード格納ファイル23に格納された検索キーワードに対応する語句が出現するサイト情報の広告価値が広告価値パラメータ以上である場合に、検索キーワードに関連する情報が、取得情報格納ファイル24に格納されたサイト情報から抽出される。
その結果、検索キーワードに関連する情報の内、サイト情報の広告価値が高い、すなわち記事への信頼性が高い情報に限定して検索することができる。
また、本実施の形態に係る検索情報配信システム10にあっては、広告価値評価手段33は、当該情報が表示される検索対象サイト上のページにおける広告料金に基づいて広告価値を定めるので、広告価値を客観的な基準に基づいて評価することができる。
また、本実施の形態に係る検索情報配信システム10にあっては、検索キーワードとニュアンスパラメータとを検索キーワード格納ファイル23に格納した場合には、ニュアンス評価手段34によって、検索キーワード格納ファイル23に格納された検索キーワードに対応する語句が出現するサイト情報のニュアンスが評価され、情報抽出手段31によって、検索キーワード格納ファイル23に格納された検索キーワードに対応する語句が出現するサイト情報のニュアンスがニュアンスパラメータ以下である場合に、検索キーワードに関連する情報が、取得情報格納ファイル24に格納されたサイト情報から抽出される。
その結果、例えば、ある特定の「会社名」を検索キーワードとして入力した場合には、ウェブサイトに記載されたその会社に関する評判等の情報の内、ニュアンスの低い情報に限定して検索することができる。従って、検索された情報を基にその会社の企業価値やブランディング、リスク管理を行なうことができる。
また、本実施の形態に係る検索情報配信システム10にあっては、ニュアンス評価手段34は、過去に蓄積されたビッグデータ及びナレッジマネジメントに基づいて評価するので、ニュアンスを自動的に、かつ、客観的に評価することができる。
また、本実施の形態に係る検索情報配信システム10にあっては、検索キーワードと検索期間パラメータとを検索キーワード格納ファイル23に格納した場合には、情報抽出手段31によって、検索キーワード格納ファイル23に格納された検索キーワードに対応する語句が出現するサイト情報のタイムスタンプが検索期間パラメータ内である場合に、検索キーワードに関連する情報が、取得情報格納ファイル24に格納されたサイト情報から抽出されるので、特定の期間に限定して検索することができる。その結果、古い情報やリンク切れの情報を除外して、最新の情報のみを抽出することができ、高い精度で検索することができる。
本実施の形態に係る検索情報配信システム10にあっては、選定した検索対象サイトとして一般的なニュースを配信する報道機関のウェブサイトである場合を例に説明したが、例えば、産業、芸能、スポーツに関するものとすることや、まとめサイトや、投稿サイト、掲示板サイトにすることもできる。
本発明は、検索サーバー、検索システム、検索情報配信システム、検索プログラム、検索情報配信プログラムに広く適用可能であり、産業上利用可能性を有している。
10…検索情報配信システム
11…ウェブサイト
11a…検索対象サイト
12…ユーザー端末
13…インターネット
14…検索サーバー
15…キーワード入力手段
16…キーワード送信手段
17…情報取得部
18…情報検索部
19…データベース
20…検索対象更新手段
21…ウェブサイト接続手段
22…ユーザー端末接続手段
23…検索対象格納ファイル
24…取得情報格納ファイル
25…検索キーワード格納ファイル
26…検索対象格納手段
27…サイト構造解析手段
28…サイト情報取得手段
29…サイト情報格納手段
30…検索キーワード格納手段
31…情報抽出手段
32…情報配信手段
33…広告価値評価手段
34…ニュアンス評価手段
35…期間選択メニュー
36…キーワード入力フォーム
37…広告価値メニュー
38…サイトジャンルボタン
39…同一記事省略ボタン
40…ニュアンス選択ボタン

Claims (14)

  1. 複数のウェブサイトにインターネットを介して接続可能であり、前記ウェブサイトから取得した情報から所望の情報を抽出する検索サーバーであって、
    前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして検索対象格納ファイルに格納する検索対象格納手段と、
    前記検索対象格納ファイルに格納された検索対象サイトについて、各検索対象サイトのサイト構造を解析するサイト構造解析手段と、
    前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得するサイト情報取得手段と、
    前記各検索対象サイトから取得した前記サイト情報を取得情報格納ファイルに格納するサイト情報格納手段と、
    検索キーワードと検索重み付けパラメータとが格納された検索キーワード格納ファイルを有し、前記サイト情報における前記検索キーワードに対応する語句の出現回数が前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連する情報を前記取得情報格納ファイルに格納された前記サイト情報から抽出する情報抽出手段とを有することを特徴とする検索サーバー。
  2. ユーザー端末に接続されており、
    前記ユーザー端末は、検索キーワードと検索重み付けパラメータとを入力するキーワード入力手段と、
    前記入力された検索キーワードと検索重み付けパラメータとを前記検索サーバーへ送信するキーワード送信手段とを有し、
    前記検索サーバーは、前記送信された検索キーワードと検索重み付けパラメータとを前記検索キーワード格納ファイルに格納する検索キーワード格納手段を有し、
    前記ユーザー端末から入力された検索キーワードと検索重み付けパラメータとに基づいて前記情報抽出手段により抽出された前記情報を前記ユーザー端末に出力することを特徴とする請求項1に記載の検索サーバー。
  3. ユーザー端末に接続されており、
    前記ユーザー端末は、検索キーワードを入力するキーワード入力手段と、
    前記入力された検索キーワードと検索重み付けパラメータとを前記検索サーバーへ送信するキーワード送信手段とを有し、
    前記検索サーバーは、前記送信された検索キーワードと検索重み付けパラメータとを前記検索キーワード格納ファイルに格納する検索キーワード格納手段と、
    前記ユーザー端末からの要求に応じて前記取得情報格納ファイルに格納された前記サイト情報を前記ユーザー端末に配信する配信手段と、を有し、
    前記ユーザー端末から入力された検索キーワードと検索重み付けパラメータとに基づいて前記情報抽出手段により抽出された前記情報を前記ユーザー端末に配信することを特徴とする請求項1に記載の検索サーバー。
  4. 前記検索対象格納ファイルには、前記各検索対象サイトのドキュメントルートのURLが格納され、前記サイト構造解析手段により解析された前記各検索対象サイトのサイト構造に基づいて、前記各検索対象サイトに含まれるウェブページのURLを取得し、前記ウェブページのURLを前記検索対象格納ファイルに格納する検索対象更新手段を有していることを特徴とする請求項1記載の検索サーバー。
  5. 前記選定した分野はニュースであって、前記検索対象サイトは新聞社又は放送局により構成される報道機関のウェブサイトであることを特徴とする請求項1記載の検索サーバー。
  6. 検索キーワードと広告価値パラメータとを前記検索キーワード格納ファイルに格納する検索キーワード格納手段と、前記サイト情報の広告価値を評価する広告価値評価手段と、前記検索キーワードに対応する語句が出現する前記サイト情報の広告価値が前記広告価値パラメータ以上である場合に、前記検索キーワードに関連する情報を前記取得情報格納ファイルに格納された前記サイト情報から抽出する情報抽出手段とを有していることを特徴とする請求項1記載の検索サーバー。
  7. 前記広告価値評価手段は、前記情報が表示される前記検索対象サイト上のページにおける広告料金に基づいて広告価値を定めることを特徴とする請求項6記載の検索サーバー。
  8. 検索キーワードとニュアンスパラメータとを前記検索キーワード格納ファイルに格納する検索キーワード格納手段と、前記サイト情報のニュアンスを評価するニュアンス評価手段と、前記検索キーワードに対応する語句が出現する前記サイト情報のニュアンスが前記ニュアンスパラメータ以下である場合に、前記検索キーワードに関連する情報を前記取得情報格納ファイルに格納された前記サイト情報から抽出する情報抽出手段とを有していることを特徴とする請求項1記載の検索サーバー。
  9. 前記ニュアンス評価手段は、過去に蓄積されたビッグデータ及びナレッジマネジメントに基づいて評価することを特徴とする請求項8記載の検索サーバー。
  10. 検索キーワードと検索期間パラメータとを前記検索キーワード格納ファイルに格納する検索キーワード格納手段と、前記検索キーワードに対応する語句が出現する前記サイト情報を取得したタイムスタンプが前記検索期間パラメータ内である場合に、前記検索キーワードに関連する情報を前記取得情報格納ファイルに格納された前記サイト情報から抽出する情報抽出手段とを有していることを特徴とする請求項1記載の検索サーバー。
  11. 複数のウェブサイト及びユーザー端末にインターネットを介して接続された検索サーバーを備えた検索システムであって、
    前記ユーザー端末は、
    検索キーワードと検索重み付けパラメータとを入力するキーワード入力手段と、前記入力された検索キーワードと検索重み付けパラメータとを前記検索サーバーへ送信するキーワード送信手段とを有し、
    前記検索サーバーは、
    前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして検索対象格納ファイルに格納する検索対象格納手段と、
    前記検索対象格納ファイルに格納された検索対象サイトについて、各検索対象サイトのサイト構造を解析するサイト構造解析手段と、
    前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得するサイト情報取得手段と、
    前記各検索対象サイトから取得した前記サイト情報に含まれる語句を、語句重み付けパラメータと共に、取得情報格納ファイルに格納するサイト情報格納手段と、
    前記ユーザー端末から送信された検索キーワードと検索重み付けパラメータとを検索キーワード格納ファイルに格納する検索キーワード格納手段と、
    前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句を含むサイト情報のうち、前記語句重み付けパラメータが前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連するサイト情報を前記取得情報格納ファイルに格納されたサイト情報から抽出する情報抽出手段と、を有し、前記ユーザー端末から入力された検索キーワードと検索重み付けパラメータとに基づいて前記情報抽出手段により抽出されたサイト情報を前記ユーザー端末に出力することを特徴とする検索システム。
  12. 複数のウェブサイト及びユーザー端末にインターネットを介して接続された検索サーバーを備え、前記検索サーバーから抽出した情報のうち前記ユーザー端末が要求する情報を配信する検索情報配信システムであって、
    前記ユーザー端末は、
    検索キーワードを入力するキーワード入力手段と、前記入力された検索キーワードを前記検索サーバーへ送信するキーワード送信手段とを有し、
    前記検索サーバーは、
    前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして検索対象格納ファイルに格納する検索対象格納手段と、
    前記検索対象格納ファイルに格納された検索対象サイトについて、各検索対象サイトのサイト構造を解析するサイト構造解析手段と、
    前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得するサイト情報取得手段と、
    前記各検索対象サイトから取得した前記サイト情報に含まれる語句を、語句重み付けパラメータと共に、取得情報格納ファイルに格納するサイト情報格納手段と、
    前記ユーザー端末から送信された検索キーワードと検索重み付けパラメータとを検索キーワード格納ファイルに格納する検索キーワード格納手段と、
    前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句を含むサイト情報のうち、前記語句重み付けパラメータが前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連するサイト情報を前記取得情報格納ファイルに格納されたサイト情報から抽出する情報抽出手段と、
    前記ユーザー端末からの要求に応じて前記取得情報格納ファイルに格納された前記サイト情報を前記ユーザー端末に配信する配信手段と、を有し、
    前記検索サーバーは、前記ユーザー端末から入力された検索キーワードと検索重み付けパラメータとに基づいて前記情報抽出手段により抽出されたサイト情報を前記ユーザー端末に配信することを特徴とする検索情報配信システム。
  13. 複数のウェブサイトと通信可能であると共に、ユーザー端末と通信可能な検索サーバーが実行する検索プログラムであって、
    前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして検索対象格納ファイルに格納するステップと、
    前記検索対象格納ファイルに格納された検索対象サイトについて、各検索対象サイトのサイト構造を解析するステップと、
    前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得するステップと、
    前記各検索対象サイトから取得した前記サイト情報に含まれる語句を、語句重み付けパラメータと共に、取得情報格納ファイルに格納するステップと、
    前記ユーザー端末から送信された検索キーワードと検索重み付けパラメータとを検索キーワード格納ファイルに格納するステップと、
    前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句を含むサイト情報のうち、前記語句重み付けパラメータが前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連するサイト情報を前記取得情報格納ファイルに格納されたサイト情報から抽出するステップと、前記抽出されたサイト情報を前記ユーザー端末に出力するステップとを、
    前記検索サーバーに実行させることを特徴とする検索プログラム。
  14. 複数のウェブサイトと通信可能であると共に、ユーザー端末と通信可能な検索サーバーが実行する検索情報配信プログラムであって、
    前記複数のウェブサイトの中から予め選定した分野に適合したウェブサイトを検索対象サイトとして検索対象格納ファイルに格納するステップと、
    前記検索対象格納ファイルに格納された検索対象サイトについて、各検索対象サイトのサイト構造を解析するステップと、
    前記各検索対象サイトを巡回し、前記解析したサイト構造に基づいて前記各検索対象サイトに記述されたサイト情報を取得するステップと、
    前記各検索対象サイトから取得した前記サイト情報に含まれる語句を、語句重み付けパラメータと共に、取得情報格納ファイルに格納するステップと、
    前記ユーザー端末から送信された検索キーワードと検索重み付けパラメータとを検索キーワード格納ファイルに格納するステップと、
    前記検索キーワード格納ファイルに格納された検索キーワードに対応する語句を含むサイト情報のうち、前記語句重み付けパラメータが前記検索重み付けパラメータ以上である場合に、前記検索キーワードに関連するサイト情報を前記取得情報格納ファイルに格納されたサイト情報から抽出するステップと、
    前記抽出されたサイト情報を前記ユーザー端末に配信するステップとを、
    前記検索サーバーに実行させることを特徴とする検索情報配信プログラム。
JP2016056021A 2016-03-18 2016-03-18 検索サーバー、検索システム、検索情報配信システム、検索プログラム、検索情報配信プログラム Active JP6510452B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016056021A JP6510452B2 (ja) 2016-03-18 2016-03-18 検索サーバー、検索システム、検索情報配信システム、検索プログラム、検索情報配信プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016056021A JP6510452B2 (ja) 2016-03-18 2016-03-18 検索サーバー、検索システム、検索情報配信システム、検索プログラム、検索情報配信プログラム

Publications (2)

Publication Number Publication Date
JP2017173910A true JP2017173910A (ja) 2017-09-28
JP6510452B2 JP6510452B2 (ja) 2019-05-08

Family

ID=59972027

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016056021A Active JP6510452B2 (ja) 2016-03-18 2016-03-18 検索サーバー、検索システム、検索情報配信システム、検索プログラム、検索情報配信プログラム

Country Status (1)

Country Link
JP (1) JP6510452B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020106988A (ja) * 2018-12-26 2020-07-09 Jcc株式会社 公開情報の配信告知方法、サーバ装置、公開情報の配信告知システム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143530A (ja) * 1996-11-15 1998-05-29 Omron Corp 文書検索システムおよび文書検索方法
JP2006189978A (ja) * 2004-12-28 2006-07-20 Web Do Japan Co Ltd 情報検索システム、情報検索サーバ、情報検索方法、及び情報検索プログラム
JP2009015407A (ja) * 2007-07-02 2009-01-22 Sony Corp 情報処理装置、コンテンツの評判検索方法およびコンテンツの評判検索システム
WO2010041517A1 (ja) * 2008-10-08 2010-04-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報収集装置、検索エンジン、情報収集方法およびプログラム
JP2010108363A (ja) * 2008-10-31 2010-05-13 Yahoo Japan Corp クリックログを利用して専門検索用クローラのシード選択を行う検索処理装置、検索処理方法及びプログラム
JP2010118021A (ja) * 2008-11-14 2010-05-27 Yahoo Japan Corp トピックグラフを利用したドキュメント検索サーバ及び方法
JP2011039766A (ja) * 2009-08-11 2011-02-24 Ricoh Co Ltd 情報配信サーバ、情報配信システム、情報配信プログラム、及び情報配信方法
JP2013109513A (ja) * 2011-11-18 2013-06-06 Ntt Communications Kk 情報表示制御装置、情報表示制御方法、及びプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143530A (ja) * 1996-11-15 1998-05-29 Omron Corp 文書検索システムおよび文書検索方法
JP2006189978A (ja) * 2004-12-28 2006-07-20 Web Do Japan Co Ltd 情報検索システム、情報検索サーバ、情報検索方法、及び情報検索プログラム
JP2009015407A (ja) * 2007-07-02 2009-01-22 Sony Corp 情報処理装置、コンテンツの評判検索方法およびコンテンツの評判検索システム
WO2010041517A1 (ja) * 2008-10-08 2010-04-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報収集装置、検索エンジン、情報収集方法およびプログラム
JP2010108363A (ja) * 2008-10-31 2010-05-13 Yahoo Japan Corp クリックログを利用して専門検索用クローラのシード選択を行う検索処理装置、検索処理方法及びプログラム
JP2010118021A (ja) * 2008-11-14 2010-05-27 Yahoo Japan Corp トピックグラフを利用したドキュメント検索サーバ及び方法
JP2011039766A (ja) * 2009-08-11 2011-02-24 Ricoh Co Ltd 情報配信サーバ、情報配信システム、情報配信プログラム、及び情報配信方法
JP2013109513A (ja) * 2011-11-18 2013-06-06 Ntt Communications Kk 情報表示制御装置、情報表示制御方法、及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田澤 和彦,他: ""検索ロボットにより実現したサーチサービス:InfoNavigator"", FUJITSU, vol. 第48巻,第2号, JPN6017015505, 10 March 1997 (1997-03-10), pages 187 - 193, ISSN: 0003549341 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020106988A (ja) * 2018-12-26 2020-07-09 Jcc株式会社 公開情報の配信告知方法、サーバ装置、公開情報の配信告知システム

Also Published As

Publication number Publication date
JP6510452B2 (ja) 2019-05-08

Similar Documents

Publication Publication Date Title
US20220164401A1 (en) Systems and methods for dynamically creating hyperlinks associated with relevant multimedia content
US9639622B2 (en) Image processing system, image processing method, program, and non-transitory information storage medium
US20090282013A1 (en) Algorithmically generated topic pages
CN103685604B (zh) 一种域名预解析方法及装置
CN101382954B (zh) 提供网址收藏名称的方法及系统
US20080177774A1 (en) Systems, methods, and articles of manufacture for displaying user-selection controls associated with clusters on a gui
CN103823907B (zh) 一种整合在线视频资源地址的方法、装置及引擎
KR20100112512A (ko) 검색 장치 및 검색 방법
US20160117398A1 (en) Systems and methods for extracting similar group elements
US10346414B2 (en) Information collection method and device
JP2006099341A (ja) 更新履歴生成装置及びプログラム
JP2007256992A (ja) コンテンツ特定方法及び装置
US8150878B1 (en) Device method and computer program product for sharing web feeds
CN103049497A (zh) 用于网址导航的方法和装置
US7617215B2 (en) Method and arrangement for setting up and updating a user interface for accessing information pages in a data network
US9053197B2 (en) Suggesting websites
KR100273775B1 (ko) 정보 서비스 장치 및 그 방법
US20220050885A1 (en) Favorites management and information search service providing system and favorites management and information search service providing method using same
KR20150045236A (ko) 스크랩 정보 관리 방법 및 장치
CN101344892A (zh) 信息处理设备、信息处理方法及计算机可读信息记录介质
JP2017173910A (ja) 検索サーバー、検索システム、検索情報配信システム、検索プログラム、検索情報配信プログラム
CN106991117B (zh) 快照处理方法、快照显示方法、服务器、浏览器和系统
Behfarshad et al. Hidden-web induced by client-side scripting: An empirical study
Shen et al. A Catalogue Service for Internet GIS ervices Supporting Active Service Evaluation and Real‐Time Quality Monitoring
JP5002631B2 (ja) 単語情報収集装置、単語情報収集方法および単語情報収集プログラム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20171113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20180213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190404

R150 Certificate of patent or registration of utility model

Ref document number: 6510452

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250