JP2010009546A - Information processor and retrieval device - Google Patents
Information processor and retrieval device Download PDFInfo
- Publication number
- JP2010009546A JP2010009546A JP2008171533A JP2008171533A JP2010009546A JP 2010009546 A JP2010009546 A JP 2010009546A JP 2008171533 A JP2008171533 A JP 2008171533A JP 2008171533 A JP2008171533 A JP 2008171533A JP 2010009546 A JP2010009546 A JP 2010009546A
- Authority
- JP
- Japan
- Prior art keywords
- search
- document data
- genre
- information processing
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 claims description 76
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000010586 diagram Methods 0.000 description 11
- 238000000034 method Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
Images
Abstract
Description
本発明は、イントラネット、インターネット等のネットワーク上の文書データの収集に関し、特にユーザーの検索方向性にあった文書データを効率的に収集する情報処理装置、及び、ユーザーの検索方向性にあった文書データを効率的に提供する検索装置に関する。 The present invention relates to collection of document data on a network such as an intranet or the Internet, and in particular, an information processing apparatus that efficiently collects document data suitable for a user search direction, and a document suitable for a user search direction The present invention relates to a search device that efficiently provides data.
近年、イントラネットやインターネット等のネットワーク上において、閲覧可能な文書データを提供するサービスが広く普及している。このようなサービスにおいては、ユーザーは情報処理装置(パーソナルコンピュータなど)によって、閲覧を希望する文書を提供している文書データ提供装置(サーバなど)のURL(Uniform Resource Locator)によって指定し、文書データ提供装置にネットワークを介してアクセスして、前記文書データ提供装置が提供している文書データを取得し、ディスプレイなどの表示部に表示させる構成となっている。 In recent years, services for providing document data that can be browsed have become widespread on networks such as intranets and the Internet. In such a service, the user designates the document data by using a URL (Uniform Resource Locator) of a document data providing apparatus (such as a server) that provides a document desired to be browsed by an information processing apparatus (such as a personal computer). The document data provided by the document data providing apparatus is obtained by accessing the providing apparatus via a network and displayed on a display unit such as a display.
ところで、上記のサービスにおいては、ユーザーは、所望する文書データを提供する文書データ提供装置の指定先が分からない、ということがしばしばある。これに対処するために、ユーザーが所望する文書データ提供装置の指定先を検索するサービスも一般的となっている。このようなサービスを行うものが検索装置(検索エンジン)であり、このような検索装置を利用して、ユーザーが所望する文書データを効率良く検索するための技術が提案されている。 By the way, in the above services, the user often does not know the designated destination of the document data providing apparatus that provides the desired document data. In order to cope with this, a service for searching for a designation destination of a document data providing apparatus desired by a user is also common. A device that provides such a service is a search device (search engine), and a technique for efficiently searching for document data desired by a user using such a search device has been proposed.
例えば、特許文献1(特開2008−117351号公報)には、検索語とこれに関連の深い他の用語を含む情報を抽出するための技術が開示されている。
特許文献1記載の発明においては、検索キーワードに類するキーワードを事前に抽出しておく必要があるので、前記類するキーワードが事前に的確に抽出されていない場合には効率的に検索することができない、という問題もあった。
In the invention described in
上記問題点を解決するために、請求項1に係る発明は、アクセス先の文書データを解析することによって前記文書データが属するジャンルを解析するジャンル解析手段と、前記文書データを閲覧していた時間を算定する閲覧時間算定手段と、現在時刻を計時する計時手段と、前記ジャンル解析手段によって解析された前記文書データのジャンルと前記閲覧時間算定手段によって算定された閲覧時間と前記計時手段によって計時された前記文書データに対するアクセス時刻とを組み合わせて検索指向データとして蓄積する検索指向データベースと、所定のキーワードを入力するキーワード入力手段と、前記キーワード入力手段によって入力されたキーワードと、前記検索指向データベースに蓄積される最新の検索指向データのジャンルを最新キーワードとして、ネットワークを介して閲覧可能な文書データを検索する検索装置に対して検索指示を行う検索指示手段と、を有することを特徴とする情報処理装置である。
In order to solve the above problem, the invention according to
また、請求項2に係る発明は、アクセス先の文書データを解析することによって前記文書データが属するジャンルを解析するジャンル解析手段と、前記文書データを閲覧していた時間を算定する閲覧時間算定手段と、前記ジャンル解析手段によって解析された前記文書データのジャンルと前記閲覧時間算定手段によって算定された閲覧時間とを組み合わせて検索指向データとして蓄積する検索指向データベースと、前記検索指向データベースに蓄積された検索指向データをジャンル別の総閲覧時間数に応じてソートする第1ソート手段と、所定のキーワードを入力するキーワード入力手段と、前記キーワード入力手段によって入力されたキーワードと、前記第1ソート手段によってソートされた総閲覧時間数が最も長いジャンルを最頻出キーワードとして、ネットワークを介して閲覧可能な文書データを検索する検索装置に対して検索指示を行う検索指示手段と、を有することを特徴とする情報処理装置である。 According to a second aspect of the present invention, there is provided a genre analyzing unit for analyzing a genre to which the document data belongs by analyzing the document data of an access destination, and a browsing time calculating unit for calculating a time during which the document data was browsed. A search-oriented database that stores search-oriented data by combining the genre of the document data analyzed by the genre analysis unit and the browsing time calculated by the browsing time calculation unit, and stored in the search-oriented database. First sort means for sorting the search-oriented data according to the total browsing time by genre, keyword input means for inputting a predetermined keyword, keyword input by the keyword input means, and the first sort means The most frequently used genre with the longest total browsing time As over de, an information processing apparatus characterized by comprising: a search instruction means for performing a search instruction to the search unit for searching the document data viewable via the network.
また、請求項3に係る発明は、請求項2に記載の情報処理装置において、検索指示を行った前記検索装置から、閲覧可能な文書データの候補を受領する検索結果受領手段と、前記検索結果受領手段によって受領された文書データの候補を、前記最頻出キーワードの文書データ中の出現回数に応じてソートする第2ソート手段と、を有することを特徴とする。 According to a third aspect of the present invention, there is provided an information processing apparatus according to the second aspect, wherein a search result receiving means for receiving a browseable document data candidate from the search device that has issued a search instruction; Document data candidates received by the receiving means include second sorting means for sorting according to the number of appearances of the most frequently occurring keyword in the document data.
また、請求項4に係る発明は、請求項1乃至請求項3のいずれかに記載の情報処理装置において、前記閲覧時間算定手段によって算定された閲覧時間が所定閲覧時間以上の前記文書データのジャンルのみを検索指向データとして前記検索指向データベースに蓄積することを特徴とする。 According to a fourth aspect of the present invention, in the information processing device according to any one of the first to third aspects, the genre of the document data whose browsing time calculated by the browsing time calculating means is equal to or longer than a predetermined browsing time. Are stored as search-oriented data in the search-oriented database.
また、請求項5に係る発明は、情報処理装置とネットワークを介して接続され、前記情報処理装置からのキーワードに基づいて閲覧可能な文書データを検索し、閲覧可能な文書データの候補を前記情報処理装置に回答する検索装置であって、前記情報処理装置からの複数のキーワードに基づいて閲覧可能な文書データの候補を抽出したとき、抽出した文書データにおける前記複数のキーワードのうちの一つのキーワードの出現回数に応じてソートを行った上で、前記情報処理装置に閲覧可能な文書データの候補を回答することを特徴とする検索装置である。
Further, the invention according to
また、請求項6に係る発明は、アクセス先の文書データを解析することによって前記文書データが属するジャンルを解析するジャンル解析手段と、前記文書データを閲覧していた時間を算定する閲覧時間算定手段と、前記ジャンル解析手段によって解析された前記文書データのジャンルと前記閲覧時間算定手段によって算定された閲覧時間とを組み合わせて検索指向データとして蓄積する検索指向データベースと、を有することを特徴とする情報処理装置である。 According to a sixth aspect of the present invention, there is provided a genre analyzing unit for analyzing a genre to which the document data belongs by analyzing the document data of an access destination, and a browsing time calculating unit for calculating a time for browsing the document data. And a search-oriented database that stores the genre of the document data analyzed by the genre analyzing means and the browsing time calculated by the browsing time calculating means in combination as search-oriented data. It is a processing device.
また、請求項7に係る発明は、請求項6に記載の情報処理装置において、所定のキーワードを入力するキーワード入力手段と、前記キーワード入力手段によって入力されたキーワードと、前記検索指向データベースに蓄積される検索指向データのジャンルをキーワードとして、ネットワークを介して閲覧可能な文書データを検索する検索装置に対して検索指示を行う検索指示手段と、を有することを特徴とする。
The invention according to
また、本発明の請求項1に記載の情報処理装置によれば、ユーザーの負担を要することなく、ユーザーの最新の興味の動向に沿った精度の高い検索を実行することが可能となる。 Further, according to the information processing apparatus of the first aspect of the present invention, it is possible to execute a highly accurate search according to the latest trend of interest of the user without requiring the user's burden.
また、本発明の請求2に記載の情報処理装置によれば、ユーザーの負担を要することなく、ユーザーの全般的な興味に沿った精度の高い検索を実行することが可能となる。
In addition, according to the information processing apparatus described in
また、本発明の請求項3に記載の情報処理装置によれば、ユーザーの興味に沿った検索結果を提示することができる。
Moreover, according to the information processing apparatus of
また、本発明の請求項4に記載の情報処理装置によれば、ノイズとなり得る情報を検索指向データベースに蓄積することを防止できる。 In addition, according to the information processing apparatus of the fourth aspect of the present invention, it is possible to prevent information that may be noise from being stored in the search-oriented database.
また、本発明の請求項5に記載の検索装置によれば、ユーザーの興味に沿った検索結果を提示することができる。
Moreover, according to the search device of
本発明の請求項6及び7に記載の情報処理装置によれば、ユーザーの負担を要することなくより精度の高い検索を実行することが可能となる。
According to the information processing apparatus described in
以下、本発明の実施の形態を図面を参照しつつ説明する。図1は本発明の実施の形態に係る情報処理装置の概念を説明する図である。図1において、50はネットワーク、100は情報処理装置、108はネットワーク通信制御部、111は表示部、120は入力部、130は文書データ受領部、135はジャンル解析用辞書データベース、140はジャンル解析部、141は閲覧時間算定部、142は計時部、150は検索指向データベース、160は検索指示部、161は文書データ取得要求部、200a〜200fは文書データ提供装置、300は検索装置をそれぞれ示している。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram for explaining the concept of an information processing apparatus according to an embodiment of the present invention. In FIG. 1, 50 is a network, 100 is an information processing apparatus, 108 is a network communication control unit, 111 is a display unit, 120 is an input unit, 130 is a document data receiving unit, 135 is a dictionary database for genre analysis, and 140 is genre analysis. , 141 is a browsing time calculation unit, 142 is a timing unit, 150 is a search-oriented database, 160 is a search instruction unit, 161 is a document data acquisition request unit, 200a to 200f are document data providing devices, and 300 is a search device. ing.
本実施形態に係る情報処理装置100は、イントラネット、インターネット等のネットワーク50に通信可能に接続される。このネットワーク50上には、情報処理装置100と共に、文書データ提供装置200a〜200f及び検索装置300が接続されている。
The
文書データ提供装置200a〜200fは一般的にはサーバと呼ばれるものであり、ホームページなどによってhtml形式などの文書データをネットワーク50上で公開しているものである。図1においては、この文書データ提供装置は模式的に示されるものである。
The document
検索装置300は検索エンジンであり、情報処理装置100から検索のためのキーワードと共に検索指示を受けると、ネットワーク50上の文書データ提供装置200a〜200fで提供される文書データを検索する。検索装置300は、基本的には、文書データ提供装置によって提供される文書データ中に含まれている語に、当該キーワードが含まれているか否かによって検索を実行する。検索が完了すると、検索装置300は当該キーワードが含まれている文書データを保持する文書データ提供装置の指定先(URLなど)を、検索指示を受けた情報処理装置100に対して回答する。
The
情報処理装置100は、検索のためのキーワードを指定することで、検索装置300に検索指示を行う。そして、検索装置300から検索結果を受領した情報処理装置100のユーザーは、候補となる文書データ提供装置の指定先の中から希望するものを選択して、当該文書データ提供装置にアクセスする。なお、本実施例においては、上記及び図1に記載するようなクライアントサーバーモデルで説明するが、本実施例のクライアントサーバーモデルに限定されるものではない。例えば、検索装置300は検索用のサーバーであって、ロボット型の検索エンジンである場合が考えられる。この場合、検索装置300は、クライアントである情報処理装置100から検索のためのキーワードとともに検索指示を受けると、まずその検索エンジンで予め24時間常に情報収集して蓄えた情報データベースの中からキーワードに該当する情報の指定先(URL等)を検索する。そして、該当する情報が検索できた場合には、情報の指定先である所定のサーバーへアクセスするように設定されたプログラム(CGI等)を伴ったリンクを情報処理装置100に回答として送信する。情報処理装置100では、検索装置300から送信されたリンクを操作者に提示し、操作者によってそのリンクが選択された場合には、検索装置300を介さずに情報の指定先である所定のサーバーへアクセスするというようなクライアントサーバモデルが考えられる。
The
図1において、情報処理装置100のイメージ図から引き出されているのは、情報処理装置100内の機能ブロック図である。
In FIG. 1, a functional block diagram in the
ここで、本発明の実施の形態に係る情報処理装置のハードウエア構成について説明する。図2は本発明の実施の形態に係る情報処理装置がシステム構成を示す図である。図2において、50はネットワーク、101はCPU、102はROM、103はRAM、104はシステムバス、105は入力制御部、106は表示出力制御部、107は記憶媒体制御部、108はネットワーク通信制御部、109はキーボード、110はマウス、111は表示部、112はハードディスクドライブ、113はフレキシブルディスクドライブ、114は光学ディスクドライブをそれぞれ示している。 Here, the hardware configuration of the information processing apparatus according to the embodiment of the present invention will be described. FIG. 2 is a diagram showing a system configuration of the information processing apparatus according to the embodiment of the present invention. In FIG. 2, 50 is a network, 101 is a CPU, 102 is a ROM, 103 is a RAM, 104 is a system bus, 105 is an input control unit, 106 is a display output control unit, 107 is a storage medium control unit, and 108 is network communication control. , 109 is a keyboard, 110 is a mouse, 111 is a display unit, 112 is a hard disk drive, 113 is a flexible disk drive, and 114 is an optical disk drive.
図2は、情報処理装置100の構成の一例を示したブロック図であり、これは汎用のパーソナルコンピュータと同様の構成から成っている。同図において、100はドライバなどのソフトウエアが稼動する情報処理装置全体を表わしている。情報処理装置100は、ROM102もしくはハードディスクドライブ112に記憶された、あるいはフレキシブルディスクや光学ディスクにより供給される、本発明のドライバソフトウエアを実行するCPU101を備え、このCPU101は、システムバス104に接続される各デバイスを総括的に制御する。
FIG. 2 is a block diagram showing an example of the configuration of the
103はRAMで、CPU101の主メモリ、ワークエリア等として機能する。105は入力制御部で、キーボード109やマウス110などのポインティングデバイス等からの指示入力機器を制御する。このようなキーボード109やマウス110を総じて入力部120として、情報処理装置100の入力インターフェイスの役割を果たす。なお、なお、特許請求の範囲における「キーワード入力手段」は、この入力部120を上位概念的に示したものである。
106は表示出力制御部で、液晶パネルやELパネルなどの表示部111の表示を制御する。ユーザーはこの表示部111によって、検索された閲覧可能文書データを参照することができる。107は記憶媒体制御部で、ブートプログラム、種々のアプリケーション、編集ファイル、ユーザファイルそしてネットワーク管理プログラム等を記憶するハードディスクドライブ112、フレキシブルディスクドライブ113、光学ディスクドライブ114とのアクセスを制御する。108はネットワーク通信制御部で、ローカルエリアネットワークネットワークやインターネットなどのネットワーク50を介して、検索装置200や文書データ提供装置300などの他のネットワーク機器と双方向にデータをやりとりするときにおける通信制御を司る。文書データ提供装置300は、汎用のサーバなどによって構成されるものである。
A display
本発明の実施の形態に係る情報処理装置100の動作を司るプログラムは、例えば、上記のような構成の情報処理装置のハードディスクドライブ112等の記憶部に記憶されており、本発明の情報処理装置は、当該プログラムが情報処理装置上で実行されることによって実現することができるものである。
The program that controls the operation of the
再び図1に戻り、情報処理装置100内の機能ブロック図について説明する。文書データ受領部130は、アクセス先の文書データ提供装置から文書データを受領するものである。文書データ受領部130は、ユーザーに対して文書データを表示部111で提示する一方、同じ文書データをジャンル解析部140に引き渡す。
Returning to FIG. 1 again, a functional block diagram in the
ジャンル解析部140は、文書データ中の単語を解析することによって、当該文書データがどのようなジャンルに属するものであるのかを解析する。ジャンル解析部140で解析されるジャンルの概念を図3に示す。図3は本発明の実施の形態に係る情報処理装置で扱うジャンルの概念を模式的に示す図である。
The
図3に示すように、情報処理装置100で扱うジャンルは大項目から徐々に枝分かれしつつ、より詳細なジャンルに進むようになっている。ジャンル解析部140は、文書データの内容を解析するが、詳細なジャンルの特定ができない場合には、大項目に近い項目のジャンル(例えば、「球技」など)に解析を留め、より詳細なジャンルが特定できるような場合には大項目から離れたより詳細な項目(例えば、「球技」→「野球」→「メジャーリーグ」など)のジャンルを特定する。
As shown in FIG. 3, the genre handled by the
情報処理装置100のジャンル解析部140は、文書データのジャンル解析に用いるジャンル解析用辞書データベース135を有している。ジャンル解析部140は、所定の文書を解析するときには、当該文書データ中から単語をピックアップし、ピックアップされた単語との関連性によって文書データが属するジャンルを決定する。単語とジャンルとの関連性がデータベース化されたものがジャンル解析用辞書データベース135である。なお、ジャンル解析部140のジャンル解析のためのアルゴリズムについては従来周知の種々のものを用いることができる。
なお、特許請求の範囲における「ジャンル解析手段」は、ジャンル解析部140を上位概念的に示したものである。
The
The “genre analysis unit” in the claims is a conceptual representation of the
閲覧時間算定部141は、所定の文書データ提供装置を閲覧した時間を算定するものである。また、情報処理装置100の計時部142は現在時刻を計時するものであり、情報処理装置100が所定の文書データ提供装置にアクセスした時刻情報を提供する。なお、特許請求の範囲における「閲覧時間算定手段」は、閲覧時間算定部141を上位概念的に示したものであり、特許請求の範囲における「計時手段」は、この計時部142を上位概念的に示したものである。
The browsing
情報処理装置100が所定の文書データ提供装置にアクセスしたときにおいては、ジャンル解析部140によって解析された「ジャンル」及び閲覧時間算定部141によって算定された「閲覧時間」及び計時部142によって計時された「アクセス時刻」をひとまとまりの「検索指向データ」として、検索指向データベース150に蓄積する。
When the
このような検索指向データベース150へのデータ蓄積について図4も参照しつつより具体的に説明する。図4は本発明の実施の形態に係る情報処理装置における検索指向データの収集過程を模式的に示す図である。情報処理装置100のユーザーが、例えば文書データ提供装置200cに対してアクセスした場合を考える。このとき、上述のジャンル解析部140によって、文書データ提供装置200cが提供する文書データが属するジャンルは「デジタルカメラ」であることを解析したとする。また、閲覧時間算定部141によって、文書データ提供装置200cが提供する文書データを閲覧した時間が「10分30秒」であると算定されたとする。また、計時部142によって計時されたアクセス時刻が「2008/6/19 15:00:00」であったものとする。このような場合には、検索指向データベース150には、図4の(1)に示されるようなデータが蓄積される。
The accumulation of data in the search-oriented
次に、例えば文書データ提供装置200dに対してアクセスした場合を考える。このとき、上述のジャンル解析部140によって、文書データ提供装置200dが提供する文書データが属するジャンルは「日本酒」であることを解析したとする。また、閲覧時間算定部141によって、文書データ提供装置200cが提供する文書データを閲覧した時間が「20秒」であると算定されたとする。また、計時部142によって計時されたアクセス時刻が「2008/6/19 15:11:00」であったものとする。このような場合には、検索指向データベース150には、図4の(2)に示されるようなデータの蓄積が基本的には行われるが、ただ、閲覧時間算定部141によって算定された閲覧時間20秒と比較的短く、図4の(2)に示すデータは、検索指向データベース150を利用する上でのノイズとなる可能性もあるので、このデータ(2)を破棄するようにしてもよい。特許請求の範囲における「前記閲覧時間算定手段によって算定された閲覧時間が所定閲覧時間以上の前記文書データのジャンルのみを検索指向データとして前記検索指向データベースに蓄積する」ことは、このようなデータ破棄のことを上位概念的に表現したものである。なお、閲覧時間算定部141は、所定の文書データ提供装置を閲覧した時間を算定するが、本実施例に限定されるものではない。例えば、操作者が検索装置300から送信されたリンクを選択した場合に閲覧時刻の計測開始を検索装置300に報知し、操作者がそのリンクから他のリンク先にアクセスしたときを計測終了を検索装置300に報知することで、検索装置300は閲覧時刻の計測開始から計測終了までの閲覧時間として算定することが出来る。すなわち、閲覧時刻の計測は、クライアントまたはサーバーのいずれで計測しても良く、情報にアクセスするためのブラウザによって計測しても良い。
Next, for example, consider a case where the document
次に、情報処理装置100のユーザーが、例えば文書データ提供装置200fに対してアクセスした場合を考える。このとき、上述のジャンル解析部140によって、文書データ提供装置200fが提供する文書データが属するジャンルは「ペット」であることを解析したとする。また、閲覧時間算定部141によって、文書データ提供装置200cが提供する文書データを閲覧した時間が「7分00秒」であると算定されたとする。また、計時部142によって計時されたアクセス時刻が「2008/6/19 15:13:00」であったものとする。このような場合には、検索指向データベース150には、図4の(3)に示されるようなデータの蓄積が実行される。
Next, consider a case where the user of the
以上のようにして検索指向データベース150に蓄積されたデータの利用方法の一例について次に説明する。
Next, an example of how to use the data accumulated in the search-oriented
検索指示部160は検索装置300に対して、所定のキーワードを検索語として検索指示要求を行う構成である。ここで、本発明の情報処理装置100において特徴的であるのは、ユーザーによって入力部120から入力されたキーワードに加えて、検索指向データベース150から選択された検索指向データの「ジャンル」についてもキーワードとして、検索装置300に対して検索指示要求を行うことである。このような「ジャンル」キーワードを加味して、検索装置300に対して検索指示をすることによって、本発明の情報処理装置100によれば、ユーザーの負担を要することなくより精度の高い検索を実行することが可能となる。なお、特許請求の範囲における「検索指示手段」は、この検索指示部160を上位概念的に示したものである。
The
検索指向データベース150から選択された「ジャンル」キーワードをどのようなものとするかは任意であるが、一例としては最新の検索指向データの「ジャンル」を最新キーワードとして、用いることができる。このような最新の検索指向データの「ジャンル」キーワードを、ユーザー入力されたキーワードと併用することで、ユーザーの最新の関心事項が加味された検索指示を検索装置300に送信することとなるので、本発明の情報処理装置100によれば、ユーザーの負担を要することなく、ユーザーの最新の興味の動向に沿った精度の高い検索を実行することが可能となる。
The “genre” keyword selected from the search-oriented
なお、特許請求の範囲における「最新キーワード」は、上記の最新の検索指向データの「ジャンル」キーワードを上位概念的に示したものである。 The “latest keyword” in the claims is a high-level conception of the “genre” keyword of the latest search-oriented data.
入力部120を構成するキーボード109やマウス110などから入力された文書データ提供装置の指定先(URLなど)は、文書データ取得要求部161に送られ、この文書データ取得要求部161は、ユーザーが指定した文書データ提供装置に対して、文書データの送信を要求する。
A document data providing device designation destination (such as a URL) input from the
次に、本発明の他の実施形態について説明する。図5は本発明の他の実施の形態に係る情報処理装置の概念を説明する図である。図5において、図1と同様の参照符号が付された構成は、同様のものであり、同じ機能を果たすものである。 Next, another embodiment of the present invention will be described. FIG. 5 is a diagram for explaining the concept of an information processing apparatus according to another embodiment of the present invention. In FIG. 5, configurations denoted by the same reference numerals as those in FIG. 1 are the same and perform the same functions.
本実施形態が先の実施形態と異なる点は、先の実施形態の構成に加え、2つのソート部―第1ソート部171及び第2ソート部172―を備える点である。
The present embodiment is different from the previous embodiment in that in addition to the configuration of the previous embodiment, two sort units—a
第1ソート部171は、検索指向データベース150に蓄積された検索指向データをジャンル別の総閲覧時間数に応じてソートするものである。この第1ソート部171のソート処理についてより詳しく説明する。図6は本発明の他の実施の形態に係る情報処理装置100の第1ソート部171による処理を説明する図である。
The
既に説明したように、検索指向データは「ジャンル」、「閲覧時間」、「アクセス時刻」が組み合わされて一つのデータとされている。この中で、同一「ジャンル」の検索指向データの「閲覧時間」を全て足し合わせたものが総閲覧時間数である。第1ソート部171によるソート処理によれば、例えば図6に示されたようなソート結果となる。すなわち、検索指向データベース150を第1ソート部171によってソートすることによって、例えば、ジャンルキーワード「デジタルカメラ」が総閲覧時間数75時間25分00秒で第1位に、ジャンルキーワード「イタリア料理」が総閲覧時間数68時間38分00秒で第2位に、・・・・・というような結果を得ることが可能となる。
As already described, the search-oriented data is combined with “genre”, “browsing time”, and “access time” as one data. Among these, the total browsing time is the sum of all “viewing times” of search-oriented data of the same “genre”. According to the sorting process by the
総閲覧時間数が長いほど(すなわち、第1ソート部171によってソートで順位が高いほど)、ユーザーの興味が高い、と言う予想を立てることができる。本実施形態においては、検索指向データベース150からピックアップされ、検索指示部160で用いられる「ジャンル」キーワードとして、第1ソート部171によってソートされて最も順位が高いジャンルをキーワードとして用いる。すなわち、本実施形態においては、総閲覧時間数が長くユーザーの興味が高い可能性があるキーワード―最頻出キーワードともいう―を、ユーザー入力されたキーワードと併用する。これによれば、ユーザーが最も関心のある事項が加味された検索指示を検索装置300に送信することとなるので、本実施形態の情報処理装置100によれば、ユーザーの負担を要することなく、ユーザーの全般的な興味に沿った精度の高い検索を実行することが可能となる。なお、特許請求の範囲における「最頻出キーワード」は、第1ソート部171によってソートされた総閲覧時間数が最も長いジャンルキーワードを上位概念的に示したものである。また、特許請求の範囲における「第1ソート手段」は、この第1ソート部171を上位概念的に示したものである。
It can be predicted that the longer the total browsing time (that is, the higher the ranking by the first sorting unit 171), the higher the user's interest. In the present embodiment, as the “genre” keyword picked up from the search-oriented
次に、第2ソート部172について説明する。検索装置300に検索された結果、すなわち、文書データの候補(文書データ提供装置の候補)を受領する構成が検索結果受領部180であるが、この検索結果受領部180で受領された文書データの候補をソートする構成が第2ソート部172である。
Next, the
より具体的には、第2ソート部172は、先の最頻出キーワードの文書データ中の出現回数に応じて、候補となる文書データをソートするものである。このようなソートによって、検索結果受領部180においては、文書データの候補が、ユーザー最関心事項の順に並び替えられることとなる。そして、第2ソート部172で並び替えられた結果を、表示部111に表示することによって、ユーザーの興味に沿った検索結果を提示することができる。
More specifically, the
なお、特許請求の範囲における「第2ソート手段」は、第2ソート部172を上位概念的に示したものである。
The “second sort means” in the claims is a conceptual representation of the
なお、第2ソート部172の機能を検索装置300の側に持たせることも可能である。すなわち、検索装置300において、情報処理装置100からの複数のキーワードに基づいて閲覧可能な文書データの候補を抽出したとき、抽出した文書データにおける複数のキーワードのうちの一つのキーワードの出現回数に応じてソートを行った上で、情報処理装置100に閲覧可能な文書データの候補を回答する構成とするわけである。この場合、何らかの方法によって、検索指向データベース150を情報処理装置100から得るか、それに相当するものを検索装置300に保持しておくかする。
Note that the function of the
このような検索装置300によれば、ユーザーの興味に沿った検索結果を提示することができることとなる。
According to such a
以上、本明細書においては、種々の実施形態について説明したが、それぞれの実施形態の構成同士を、任意に組み合わせて構成した発明も本発明の範疇となり得ることを付記しておく。 As described above, in the present specification, various embodiments have been described. However, it should be noted that an invention configured by arbitrarily combining the configurations of the respective embodiments can also be included in the scope of the present invention.
50・・・ネットワーク、100・・・情報処理装置、101・・・CPU、102・・・ROM、103・・・RAM、104・・・システムバス、105・・・入力制御部、106・・・表示出力制御部、107・・・記憶媒体制御部、108・・・ネットワーク通信制御部、109・・・キーボード、110・・・マウス、111・・・表示部、112・・・・・・ドディスクドライブ、113・・・フレキシブルディスクドライブ、114・・・光学ディスクドライブ、120・・・入力部、130・・・文書データ受領部、135・・・ジャンル解析用辞書データベース、140・・・ジャンル解析部、141・・・閲覧時間算定部、142・・・計時部、150・・・検索指向データベース、160・・・検索指示部、161・・・文書データ取得要求部、171・・・第1ソート部、172・・・第2ソート部、180・・・検索結果受領部、200a〜200f・・・文書データ提供装置、300・・・検索装置
DESCRIPTION OF
Claims (7)
前記文書データを閲覧していた時間を算定する閲覧時間算定手段と、
現在時刻を計時する計時手段と、
前記ジャンル解析手段によって解析された前記文書データのジャンルと前記閲覧時間算定手段によって算定された閲覧時間と前記計時手段によって計時された前記文書データに対するアクセス時刻とを組み合わせて検索指向データとして蓄積する検索指向データベースと、
所定のキーワードを入力するキーワード入力手段と、
前記キーワード入力手段によって入力されたキーワードと、前記検索指向データベースに蓄積される最新の検索指向データのジャンルを最新キーワードとして、ネットワークを介して閲覧可能な文書データを検索する検索装置に対して検索指示を行う検索指示手段と、を有することを特徴とする情報処理装置。 Genre analysis means for analyzing the genre to which the document data belongs by analyzing the document data of the access destination;
Browsing time calculation means for calculating the time when the document data was browsed;
A time measuring means for measuring the current time;
Retrieval in which the genre of the document data analyzed by the genre analyzing means, the browsing time calculated by the browsing time calculating means, and the access time for the document data timed by the time measuring means are combined and stored as search-oriented data An oriented database,
A keyword input means for inputting a predetermined keyword;
A search instruction for a search device that searches document data that can be browsed through a network, with the keyword input by the keyword input means and the genre of the latest search-oriented data stored in the search-oriented database as the latest keyword An information processing apparatus comprising: search instruction means for performing
前記文書データを閲覧していた時間を算定する閲覧時間算定手段と、
前記ジャンル解析手段によって解析された前記文書データのジャンルと前記閲覧時間算定手段によって算定された閲覧時間とを組み合わせて検索指向データとして蓄積する検索指向データベースと、
前記検索指向データベースに蓄積された検索指向データをジャンル別の総閲覧時間数に応じてソートする第1ソート手段と、
所定のキーワードを入力するキーワード入力手段と、
前記キーワード入力手段によって入力されたキーワードと、前記第1ソート手段によってソートされた総閲覧時間数が最も長いジャンルを最頻出キーワードとして、ネットワークを介して閲覧可能な文書データを検索する検索装置に対して検索指示を行う検索指示手段と、を有することを特徴とする情報処理装置。 Genre analysis means for analyzing the genre to which the document data belongs by analyzing the document data of the access destination;
Browsing time calculation means for calculating the time when the document data was browsed;
A search-oriented database that accumulates search-oriented data by combining the genre of the document data analyzed by the genre analysis means and the browsing time calculated by the browsing time calculation means;
First sorting means for sorting the search-oriented data stored in the search-oriented database according to the total browsing time by genre;
A keyword input means for inputting a predetermined keyword;
For a search device for searching document data that can be browsed via a network, with the keyword input by the keyword input means and the genre with the longest total browsing time sorted by the first sorting means as the most frequently used keywords. An information processing apparatus comprising: search instruction means for issuing a search instruction.
前記検索結果受領手段によって受領された文書データの候補を、前記最頻出キーワードの文書データ中の出現回数に応じてソートする第2ソート手段と、を有することを特徴とする請求項2に記載の情報処理装置。 Search result receiving means for receiving candidates for viewable document data from the search device that has issued the search instruction;
The document data candidates received by the search result receiving means include second sorting means for sorting according to the number of appearances of the most frequently occurring keyword in the document data. Information processing device.
前記情報処理装置からの複数のキーワードに基づいて閲覧可能な文書データの候補を抽出したとき、抽出した文書データにおける前記複数のキーワードのうちの一つのキーワードの出現回数に応じてソートを行った上で、前記情報処理装置に閲覧可能な文書データの候補を回答することを特徴とする検索装置。 A search device connected to an information processing device via a network, searching for document data that can be browsed based on a keyword from the information processing device, and responding to the information processing device with candidates for viewable document data. ,
When candidates for document data that can be browsed are extracted based on a plurality of keywords from the information processing apparatus, sorting is performed according to the number of appearances of one of the keywords in the extracted document data. The search apparatus is characterized in that a candidate for document data that can be browsed is answered to the information processing apparatus.
前記文書データを閲覧していた時間を算定する閲覧時間算定手段と、
前記ジャンル解析手段によって解析された前記文書データのジャンルと前記閲覧時間算定手段によって算定された閲覧時間とを組み合わせて検索指向データとして蓄積する検索指向データベースと、を有することを特徴とする情報処理装置。 Genre analysis means for analyzing the genre to which the document data belongs by analyzing the document data of the access destination;
Browsing time calculation means for calculating the time when the document data was browsed;
An information processing apparatus comprising: a search-oriented database that stores the genre of the document data analyzed by the genre analysis means and the browsing time calculated by the browsing time calculation means in combination as search-oriented data. .
前記キーワード入力手段によって入力されたキーワードと、前記検索指向データベースに蓄積される検索指向データのジャンルをキーワードとして、ネットワークを介して閲覧可能な文書データを検索する検索装置に対して検索指示を行う検索指示手段と、を有することを特徴とする請求項6に記載の情報処理装置。 A keyword input means for inputting a predetermined keyword;
A search for instructing a search device for searching document data that can be browsed via a network, using the keyword input by the keyword input means and the genre of search-oriented data stored in the search-oriented database as keywords. The information processing apparatus according to claim 6, further comprising an instruction unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008171533A JP5196150B2 (en) | 2008-06-30 | 2008-06-30 | Information processing apparatus, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008171533A JP5196150B2 (en) | 2008-06-30 | 2008-06-30 | Information processing apparatus, information processing method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010009546A true JP2010009546A (en) | 2010-01-14 |
JP5196150B2 JP5196150B2 (en) | 2013-05-15 |
Family
ID=41589907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008171533A Expired - Fee Related JP5196150B2 (en) | 2008-06-30 | 2008-06-30 | Information processing apparatus, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5196150B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002073677A (en) * | 2000-09-05 | 2002-03-12 | Zenrin Co Ltd | Device for collecting personal preference information on reader and information reading support device using the information collecting device |
JP2005301432A (en) * | 2004-04-07 | 2005-10-27 | Nippon Telegr & Teleph Corp <Ntt> | Latest information providing method, system, and program |
JP2006319799A (en) * | 2005-05-13 | 2006-11-24 | Pioneer Electronic Corp | Information processing apparatus, system thereof, method thereof, program thereof, and recording medium with the program recorded thereon |
JP2007507801A (en) * | 2003-09-30 | 2007-03-29 | グーグル インコーポレイテッド | Personalized web search |
-
2008
- 2008-06-30 JP JP2008171533A patent/JP5196150B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002073677A (en) * | 2000-09-05 | 2002-03-12 | Zenrin Co Ltd | Device for collecting personal preference information on reader and information reading support device using the information collecting device |
JP2007507801A (en) * | 2003-09-30 | 2007-03-29 | グーグル インコーポレイテッド | Personalized web search |
JP2005301432A (en) * | 2004-04-07 | 2005-10-27 | Nippon Telegr & Teleph Corp <Ntt> | Latest information providing method, system, and program |
JP2006319799A (en) * | 2005-05-13 | 2006-11-24 | Pioneer Electronic Corp | Information processing apparatus, system thereof, method thereof, program thereof, and recording medium with the program recorded thereon |
Also Published As
Publication number | Publication date |
---|---|
JP5196150B2 (en) | 2013-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5727512B2 (en) | Cluster and present search suggestions | |
US8612435B2 (en) | Activity based users' interests modeling for determining content relevance | |
JP5638031B2 (en) | Rating method, search result classification method, rating system, and search result classification system | |
US8645390B1 (en) | Reordering search query results in accordance with search context specific predicted performance functions | |
CN103699700B (en) | A kind of generation method of search index, system and associated server | |
US20100153371A1 (en) | Method and apparatus for blending search results | |
US20070271255A1 (en) | Reverse search-engine | |
EP2136302A1 (en) | Method and device for generating updating parameter, and method and device for showing related keyword | |
KR100859918B1 (en) | Method and apparatus for evaluating searched contents by using user feedback and providing search result by utilizing evaluation result | |
US20090287645A1 (en) | Search results with most clicked next objects | |
US20070239692A1 (en) | Logo or image based search engine for presenting search results | |
JP2007140973A (en) | Page reranking device, and page reranking program | |
JP4453437B2 (en) | Search keyword ranking method, apparatus and program | |
WO2007042840A1 (en) | Search using changes in prevalence of content items on the web | |
US8234584B2 (en) | Computer system, information collection support device, and method for supporting information collection | |
JP2007256992A (en) | Content specifying method and device | |
JP2005107688A (en) | Information display method and system and information display program | |
JP2011039625A (en) | Information retrieval system and information retrieval method | |
US20100332491A1 (en) | Method and system for utilizing user selection data to determine relevance of a web document for a search query | |
JP5321258B2 (en) | Information collecting system, information collecting method and program thereof | |
JP5196150B2 (en) | Information processing apparatus, information processing method, and program | |
JP2007183903A (en) | Trend information analyzer | |
KR101120040B1 (en) | Apparatus for recommending related query and method thereof | |
JP4088164B2 (en) | Document score calculation method, apparatus, and program | |
EP2662785A2 (en) | A method and system for non-ephemeral search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120822 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121022 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130122 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160215 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5196150 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |