JP2010009546A - Information processor and retrieval device - Google Patents

Information processor and retrieval device Download PDF

Info

Publication number
JP2010009546A
JP2010009546A JP2008171533A JP2008171533A JP2010009546A JP 2010009546 A JP2010009546 A JP 2010009546A JP 2008171533 A JP2008171533 A JP 2008171533A JP 2008171533 A JP2008171533 A JP 2008171533A JP 2010009546 A JP2010009546 A JP 2010009546A
Authority
JP
Japan
Prior art keywords
search
document data
genre
information processing
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008171533A
Other languages
Japanese (ja)
Other versions
JP5196150B2 (en
Inventor
Hideo Yamada
山田英夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Equos Research Co Ltd
Original Assignee
Equos Research Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Equos Research Co Ltd filed Critical Equos Research Co Ltd
Priority to JP2008171533A priority Critical patent/JP5196150B2/en
Publication of JP2010009546A publication Critical patent/JP2010009546A/en
Application granted granted Critical
Publication of JP5196150B2 publication Critical patent/JP5196150B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide an information processor for carrying out highly precise retrieval without requiring a burden on a user. <P>SOLUTION: This information processor has a genre analytical part 140 for analyzing a genre with a document data belonging thereto, by analyzing the document data in an accessing side, a browsing time calculating part 141 for calculating a document data browsed time, a clocking part 142 for clocking a current time, a retrieval directive database 150 for combining the genre of the document data, the browsed time and an access time to the document data, to be accumulated as a retrieval directive data, an input part 120 for inputting a prescribed keyword, and a retrieval indicating part 160 for indicating the retrieval to a retrieval device 300 for retrieving the document data browsable via a network 50, using the keyword input by the input part 120, and the genre of the up-to-date retrieval directive data accumulated into the retrieval directive database 150, as the up-to-date keywords. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、イントラネット、インターネット等のネットワーク上の文書データの収集に関し、特にユーザーの検索方向性にあった文書データを効率的に収集する情報処理装置、及び、ユーザーの検索方向性にあった文書データを効率的に提供する検索装置に関する。   The present invention relates to collection of document data on a network such as an intranet or the Internet, and in particular, an information processing apparatus that efficiently collects document data suitable for a user search direction, and a document suitable for a user search direction The present invention relates to a search device that efficiently provides data.

近年、イントラネットやインターネット等のネットワーク上において、閲覧可能な文書データを提供するサービスが広く普及している。このようなサービスにおいては、ユーザーは情報処理装置(パーソナルコンピュータなど)によって、閲覧を希望する文書を提供している文書データ提供装置(サーバなど)のURL(Uniform Resource Locator)によって指定し、文書データ提供装置にネットワークを介してアクセスして、前記文書データ提供装置が提供している文書データを取得し、ディスプレイなどの表示部に表示させる構成となっている。   In recent years, services for providing document data that can be browsed have become widespread on networks such as intranets and the Internet. In such a service, the user designates the document data by using a URL (Uniform Resource Locator) of a document data providing apparatus (such as a server) that provides a document desired to be browsed by an information processing apparatus (such as a personal computer). The document data provided by the document data providing apparatus is obtained by accessing the providing apparatus via a network and displayed on a display unit such as a display.

ところで、上記のサービスにおいては、ユーザーは、所望する文書データを提供する文書データ提供装置の指定先が分からない、ということがしばしばある。これに対処するために、ユーザーが所望する文書データ提供装置の指定先を検索するサービスも一般的となっている。このようなサービスを行うものが検索装置(検索エンジン)であり、このような検索装置を利用して、ユーザーが所望する文書データを効率良く検索するための技術が提案されている。   By the way, in the above services, the user often does not know the designated destination of the document data providing apparatus that provides the desired document data. In order to cope with this, a service for searching for a designation destination of a document data providing apparatus desired by a user is also common. A device that provides such a service is a search device (search engine), and a technique for efficiently searching for document data desired by a user using such a search device has been proposed.

例えば、特許文献1(特開2008−117351号公報)には、検索語とこれに関連の深い他の用語を含む情報を抽出するための技術が開示されている。
特開2008−117351号公報
For example, Patent Document 1 (Japanese Patent Application Laid-Open No. 2008-117351) discloses a technique for extracting information including a search term and other terms closely related thereto.
JP 2008-117351 A

特許文献1記載の発明においては、検索キーワードに類するキーワードを事前に抽出しておく必要があるので、前記類するキーワードが事前に的確に抽出されていない場合には効率的に検索することができない、という問題もあった。   In the invention described in Patent Document 1, since it is necessary to extract a keyword similar to the search keyword in advance, if the similar keyword is not accurately extracted in advance, it cannot be efficiently searched, There was also a problem.

上記問題点を解決するために、請求項1に係る発明は、アクセス先の文書データを解析することによって前記文書データが属するジャンルを解析するジャンル解析手段と、前記文書データを閲覧していた時間を算定する閲覧時間算定手段と、現在時刻を計時する計時手段と、前記ジャンル解析手段によって解析された前記文書データのジャンルと前記閲覧時間算定手段によって算定された閲覧時間と前記計時手段によって計時された前記文書データに対するアクセス時刻とを組み合わせて検索指向データとして蓄積する検索指向データベースと、所定のキーワードを入力するキーワード入力手段と、前記キーワード入力手段によって入力されたキーワードと、前記検索指向データベースに蓄積される最新の検索指向データのジャンルを最新キーワードとして、ネットワークを介して閲覧可能な文書データを検索する検索装置に対して検索指示を行う検索指示手段と、を有することを特徴とする情報処理装置である。   In order to solve the above problem, the invention according to claim 1 is directed to genre analysis means for analyzing the genre to which the document data belongs by analyzing the document data of the access destination, and the time during which the document data was browsed Viewing time calculating means for calculating the time, current time measuring means, genre of the document data analyzed by the genre analyzing means, browsing time calculated by the browsing time calculating means and time measuring means In addition, a search-oriented database that stores the access time for the document data as search-oriented data, a keyword input unit that inputs a predetermined keyword, a keyword that is input by the keyword input unit, and a storage in the search-oriented database The latest search-oriented data genre As the word is an information processing apparatus characterized by comprising: a search instruction means for performing a search instruction to the search unit for searching the document data viewable via the network.

また、請求項2に係る発明は、アクセス先の文書データを解析することによって前記文書データが属するジャンルを解析するジャンル解析手段と、前記文書データを閲覧していた時間を算定する閲覧時間算定手段と、前記ジャンル解析手段によって解析された前記文書データのジャンルと前記閲覧時間算定手段によって算定された閲覧時間とを組み合わせて検索指向データとして蓄積する検索指向データベースと、前記検索指向データベースに蓄積された検索指向データをジャンル別の総閲覧時間数に応じてソートする第1ソート手段と、所定のキーワードを入力するキーワード入力手段と、前記キーワード入力手段によって入力されたキーワードと、前記第1ソート手段によってソートされた総閲覧時間数が最も長いジャンルを最頻出キーワードとして、ネットワークを介して閲覧可能な文書データを検索する検索装置に対して検索指示を行う検索指示手段と、を有することを特徴とする情報処理装置である。   According to a second aspect of the present invention, there is provided a genre analyzing unit for analyzing a genre to which the document data belongs by analyzing the document data of an access destination, and a browsing time calculating unit for calculating a time during which the document data was browsed. A search-oriented database that stores search-oriented data by combining the genre of the document data analyzed by the genre analysis unit and the browsing time calculated by the browsing time calculation unit, and stored in the search-oriented database. First sort means for sorting the search-oriented data according to the total browsing time by genre, keyword input means for inputting a predetermined keyword, keyword input by the keyword input means, and the first sort means The most frequently used genre with the longest total browsing time As over de, an information processing apparatus characterized by comprising: a search instruction means for performing a search instruction to the search unit for searching the document data viewable via the network.

また、請求項3に係る発明は、請求項2に記載の情報処理装置において、検索指示を行った前記検索装置から、閲覧可能な文書データの候補を受領する検索結果受領手段と、前記検索結果受領手段によって受領された文書データの候補を、前記最頻出キーワードの文書データ中の出現回数に応じてソートする第2ソート手段と、を有することを特徴とする。   According to a third aspect of the present invention, there is provided an information processing apparatus according to the second aspect, wherein a search result receiving means for receiving a browseable document data candidate from the search device that has issued a search instruction; Document data candidates received by the receiving means include second sorting means for sorting according to the number of appearances of the most frequently occurring keyword in the document data.

また、請求項4に係る発明は、請求項1乃至請求項3のいずれかに記載の情報処理装置において、前記閲覧時間算定手段によって算定された閲覧時間が所定閲覧時間以上の前記文書データのジャンルのみを検索指向データとして前記検索指向データベースに蓄積することを特徴とする。   According to a fourth aspect of the present invention, in the information processing device according to any one of the first to third aspects, the genre of the document data whose browsing time calculated by the browsing time calculating means is equal to or longer than a predetermined browsing time. Are stored as search-oriented data in the search-oriented database.

また、請求項5に係る発明は、情報処理装置とネットワークを介して接続され、前記情報処理装置からのキーワードに基づいて閲覧可能な文書データを検索し、閲覧可能な文書データの候補を前記情報処理装置に回答する検索装置であって、前記情報処理装置からの複数のキーワードに基づいて閲覧可能な文書データの候補を抽出したとき、抽出した文書データにおける前記複数のキーワードのうちの一つのキーワードの出現回数に応じてソートを行った上で、前記情報処理装置に閲覧可能な文書データの候補を回答することを特徴とする検索装置である。   Further, the invention according to claim 5 is connected to an information processing apparatus via a network, searches for document data that can be browsed based on a keyword from the information processing apparatus, and sets candidates for the browseable document data as the information. A search device that answers a processing device, and when a candidate for document data that can be browsed is extracted based on a plurality of keywords from the information processing device, one keyword of the plurality of keywords in the extracted document data The search apparatus is characterized in that it sorts according to the number of appearances of the documents, and then answers the document data candidates that can be browsed to the information processing apparatus.

また、請求項6に係る発明は、アクセス先の文書データを解析することによって前記文書データが属するジャンルを解析するジャンル解析手段と、前記文書データを閲覧していた時間を算定する閲覧時間算定手段と、前記ジャンル解析手段によって解析された前記文書データのジャンルと前記閲覧時間算定手段によって算定された閲覧時間とを組み合わせて検索指向データとして蓄積する検索指向データベースと、を有することを特徴とする情報処理装置である。   According to a sixth aspect of the present invention, there is provided a genre analyzing unit for analyzing a genre to which the document data belongs by analyzing the document data of an access destination, and a browsing time calculating unit for calculating a time for browsing the document data. And a search-oriented database that stores the genre of the document data analyzed by the genre analyzing means and the browsing time calculated by the browsing time calculating means in combination as search-oriented data. It is a processing device.

また、請求項7に係る発明は、請求項6に記載の情報処理装置において、所定のキーワードを入力するキーワード入力手段と、前記キーワード入力手段によって入力されたキーワードと、前記検索指向データベースに蓄積される検索指向データのジャンルをキーワードとして、ネットワークを介して閲覧可能な文書データを検索する検索装置に対して検索指示を行う検索指示手段と、を有することを特徴とする。   The invention according to claim 7 is the information processing apparatus according to claim 6, wherein the keyword input means for inputting a predetermined keyword, the keyword input by the keyword input means, and the search-oriented database are stored. And search instruction means for issuing a search instruction to a search device for searching document data that can be browsed via a network, using the genre of search-oriented data as a keyword.

また、本発明の請求項1に記載の情報処理装置によれば、ユーザーの負担を要することなく、ユーザーの最新の興味の動向に沿った精度の高い検索を実行することが可能となる。   Further, according to the information processing apparatus of the first aspect of the present invention, it is possible to execute a highly accurate search according to the latest trend of interest of the user without requiring the user's burden.

また、本発明の請求2に記載の情報処理装置によれば、ユーザーの負担を要することなく、ユーザーの全般的な興味に沿った精度の高い検索を実行することが可能となる。   In addition, according to the information processing apparatus described in claim 2 of the present invention, it is possible to execute a highly accurate search in accordance with the user's general interest without requiring the user's burden.

また、本発明の請求項3に記載の情報処理装置によれば、ユーザーの興味に沿った検索結果を提示することができる。   Moreover, according to the information processing apparatus of Claim 3 of this invention, the search result along a user's interest can be shown.

また、本発明の請求項4に記載の情報処理装置によれば、ノイズとなり得る情報を検索指向データベースに蓄積することを防止できる。   In addition, according to the information processing apparatus of the fourth aspect of the present invention, it is possible to prevent information that may be noise from being stored in the search-oriented database.

また、本発明の請求項5に記載の検索装置によれば、ユーザーの興味に沿った検索結果を提示することができる。   Moreover, according to the search device of Claim 5 of this invention, the search result along a user's interest can be shown.

本発明の請求項6及び7に記載の情報処理装置によれば、ユーザーの負担を要することなくより精度の高い検索を実行することが可能となる。   According to the information processing apparatus described in claims 6 and 7 of the present invention, it is possible to execute a more accurate search without requiring a burden on the user.

以下、本発明の実施の形態を図面を参照しつつ説明する。図1は本発明の実施の形態に係る情報処理装置の概念を説明する図である。図1において、50はネットワーク、100は情報処理装置、108はネットワーク通信制御部、111は表示部、120は入力部、130は文書データ受領部、135はジャンル解析用辞書データベース、140はジャンル解析部、141は閲覧時間算定部、142は計時部、150は検索指向データベース、160は検索指示部、161は文書データ取得要求部、200a〜200fは文書データ提供装置、300は検索装置をそれぞれ示している。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram for explaining the concept of an information processing apparatus according to an embodiment of the present invention. In FIG. 1, 50 is a network, 100 is an information processing apparatus, 108 is a network communication control unit, 111 is a display unit, 120 is an input unit, 130 is a document data receiving unit, 135 is a dictionary database for genre analysis, and 140 is genre analysis. , 141 is a browsing time calculation unit, 142 is a timing unit, 150 is a search-oriented database, 160 is a search instruction unit, 161 is a document data acquisition request unit, 200a to 200f are document data providing devices, and 300 is a search device. ing.

本実施形態に係る情報処理装置100は、イントラネット、インターネット等のネットワーク50に通信可能に接続される。このネットワーク50上には、情報処理装置100と共に、文書データ提供装置200a〜200f及び検索装置300が接続されている。   The information processing apparatus 100 according to the present embodiment is communicably connected to a network 50 such as an intranet or the Internet. On the network 50, document data providing devices 200 a to 200 f and a search device 300 are connected together with the information processing device 100.

文書データ提供装置200a〜200fは一般的にはサーバと呼ばれるものであり、ホームページなどによってhtml形式などの文書データをネットワーク50上で公開しているものである。図1においては、この文書データ提供装置は模式的に示されるものである。   The document data providing devices 200a to 200f are generally called servers, and publish document data in the html format or the like on the network 50 through a homepage or the like. In FIG. 1, this document data providing apparatus is schematically shown.

検索装置300は検索エンジンであり、情報処理装置100から検索のためのキーワードと共に検索指示を受けると、ネットワーク50上の文書データ提供装置200a〜200fで提供される文書データを検索する。検索装置300は、基本的には、文書データ提供装置によって提供される文書データ中に含まれている語に、当該キーワードが含まれているか否かによって検索を実行する。検索が完了すると、検索装置300は当該キーワードが含まれている文書データを保持する文書データ提供装置の指定先(URLなど)を、検索指示を受けた情報処理装置100に対して回答する。   The search device 300 is a search engine. When a search instruction is received together with a search keyword from the information processing device 100, the search device 300 searches for document data provided by the document data providing devices 200a to 200f on the network 50. Basically, the search device 300 executes a search based on whether or not the keyword is included in words included in the document data provided by the document data providing device. When the search is completed, the search apparatus 300 replies to the information processing apparatus 100 that has received the search instruction, the designation destination (such as URL) of the document data providing apparatus that holds the document data including the keyword.

情報処理装置100は、検索のためのキーワードを指定することで、検索装置300に検索指示を行う。そして、検索装置300から検索結果を受領した情報処理装置100のユーザーは、候補となる文書データ提供装置の指定先の中から希望するものを選択して、当該文書データ提供装置にアクセスする。なお、本実施例においては、上記及び図1に記載するようなクライアントサーバーモデルで説明するが、本実施例のクライアントサーバーモデルに限定されるものではない。例えば、検索装置300は検索用のサーバーであって、ロボット型の検索エンジンである場合が考えられる。この場合、検索装置300は、クライアントである情報処理装置100から検索のためのキーワードとともに検索指示を受けると、まずその検索エンジンで予め24時間常に情報収集して蓄えた情報データベースの中からキーワードに該当する情報の指定先(URL等)を検索する。そして、該当する情報が検索できた場合には、情報の指定先である所定のサーバーへアクセスするように設定されたプログラム(CGI等)を伴ったリンクを情報処理装置100に回答として送信する。情報処理装置100では、検索装置300から送信されたリンクを操作者に提示し、操作者によってそのリンクが選択された場合には、検索装置300を介さずに情報の指定先である所定のサーバーへアクセスするというようなクライアントサーバモデルが考えられる。   The information processing apparatus 100 issues a search instruction to the search apparatus 300 by designating a keyword for search. Then, the user of the information processing apparatus 100 that has received the search result from the search apparatus 300 selects a desired one from the designation destinations of candidate document data providing apparatuses, and accesses the document data providing apparatus. In the present embodiment, the client server model as described above and shown in FIG. 1 will be described. However, the present invention is not limited to the client server model of the present embodiment. For example, the search device 300 may be a search server and may be a robot type search engine. In this case, when the search apparatus 300 receives a search instruction together with a keyword for search from the information processing apparatus 100 as a client, first, the search apparatus 300 uses the search engine as a keyword from an information database that is always collected and stored in advance for 24 hours. Search the specified information (URL, etc.). When the corresponding information can be searched, a link with a program (CGI or the like) set to access a predetermined server as the information designation destination is transmitted to the information processing apparatus 100 as an answer. In the information processing apparatus 100, a link transmitted from the search apparatus 300 is presented to the operator, and when the link is selected by the operator, a predetermined server that is a designation destination of information without using the search apparatus 300 A client-server model such as accessing

図1において、情報処理装置100のイメージ図から引き出されているのは、情報処理装置100内の機能ブロック図である。   In FIG. 1, a functional block diagram in the information processing apparatus 100 is drawn from the image diagram of the information processing apparatus 100.

ここで、本発明の実施の形態に係る情報処理装置のハードウエア構成について説明する。図2は本発明の実施の形態に係る情報処理装置がシステム構成を示す図である。図2において、50はネットワーク、101はCPU、102はROM、103はRAM、104はシステムバス、105は入力制御部、106は表示出力制御部、107は記憶媒体制御部、108はネットワーク通信制御部、109はキーボード、110はマウス、111は表示部、112はハードディスクドライブ、113はフレキシブルディスクドライブ、114は光学ディスクドライブをそれぞれ示している。   Here, the hardware configuration of the information processing apparatus according to the embodiment of the present invention will be described. FIG. 2 is a diagram showing a system configuration of the information processing apparatus according to the embodiment of the present invention. In FIG. 2, 50 is a network, 101 is a CPU, 102 is a ROM, 103 is a RAM, 104 is a system bus, 105 is an input control unit, 106 is a display output control unit, 107 is a storage medium control unit, and 108 is network communication control. , 109 is a keyboard, 110 is a mouse, 111 is a display unit, 112 is a hard disk drive, 113 is a flexible disk drive, and 114 is an optical disk drive.

図2は、情報処理装置100の構成の一例を示したブロック図であり、これは汎用のパーソナルコンピュータと同様の構成から成っている。同図において、100はドライバなどのソフトウエアが稼動する情報処理装置全体を表わしている。情報処理装置100は、ROM102もしくはハードディスクドライブ112に記憶された、あるいはフレキシブルディスクや光学ディスクにより供給される、本発明のドライバソフトウエアを実行するCPU101を備え、このCPU101は、システムバス104に接続される各デバイスを総括的に制御する。   FIG. 2 is a block diagram showing an example of the configuration of the information processing apparatus 100, which has the same configuration as a general-purpose personal computer. In the figure, reference numeral 100 denotes an entire information processing apparatus on which software such as a driver operates. The information processing apparatus 100 includes a CPU 101 that executes the driver software of the present invention that is stored in the ROM 102 or the hard disk drive 112 or that is supplied by a flexible disk or an optical disk. The CPU 101 is connected to the system bus 104. Controls each device collectively.

103はRAMで、CPU101の主メモリ、ワークエリア等として機能する。105は入力制御部で、キーボード109やマウス110などのポインティングデバイス等からの指示入力機器を制御する。このようなキーボード109やマウス110を総じて入力部120として、情報処理装置100の入力インターフェイスの役割を果たす。なお、なお、特許請求の範囲における「キーワード入力手段」は、この入力部120を上位概念的に示したものである。   Reference numeral 103 denotes a RAM which functions as a main memory, work area, and the like for the CPU 101. An input control unit 105 controls an instruction input device from a pointing device such as a keyboard 109 or a mouse 110. The keyboard 109 and the mouse 110 as a whole serve as the input unit 120 and serve as an input interface of the information processing apparatus 100. It should be noted that the “keyword input means” in the claims is a conceptual representation of the input unit 120.

106は表示出力制御部で、液晶パネルやELパネルなどの表示部111の表示を制御する。ユーザーはこの表示部111によって、検索された閲覧可能文書データを参照することができる。107は記憶媒体制御部で、ブートプログラム、種々のアプリケーション、編集ファイル、ユーザファイルそしてネットワーク管理プログラム等を記憶するハードディスクドライブ112、フレキシブルディスクドライブ113、光学ディスクドライブ114とのアクセスを制御する。108はネットワーク通信制御部で、ローカルエリアネットワークネットワークやインターネットなどのネットワーク50を介して、検索装置200や文書データ提供装置300などの他のネットワーク機器と双方向にデータをやりとりするときにおける通信制御を司る。文書データ提供装置300は、汎用のサーバなどによって構成されるものである。   A display output control unit 106 controls display on the display unit 111 such as a liquid crystal panel or an EL panel. The display unit 111 allows the user to refer to the retrieved viewable document data. A storage medium control unit 107 controls access to the hard disk drive 112, the flexible disk drive 113, and the optical disk drive 114 that store a boot program, various applications, editing files, user files, a network management program, and the like. A network communication control unit 108 performs communication control when data is bidirectionally exchanged with other network devices such as the search device 200 and the document data providing device 300 via the network 50 such as a local area network network or the Internet. Control. The document data providing apparatus 300 is configured by a general-purpose server or the like.

本発明の実施の形態に係る情報処理装置100の動作を司るプログラムは、例えば、上記のような構成の情報処理装置のハードディスクドライブ112等の記憶部に記憶されており、本発明の情報処理装置は、当該プログラムが情報処理装置上で実行されることによって実現することができるものである。   The program that controls the operation of the information processing apparatus 100 according to the embodiment of the present invention is stored in, for example, a storage unit such as the hard disk drive 112 of the information processing apparatus having the above-described configuration, and the information processing apparatus of the present invention Can be realized by executing the program on the information processing apparatus.

再び図1に戻り、情報処理装置100内の機能ブロック図について説明する。文書データ受領部130は、アクセス先の文書データ提供装置から文書データを受領するものである。文書データ受領部130は、ユーザーに対して文書データを表示部111で提示する一方、同じ文書データをジャンル解析部140に引き渡す。   Returning to FIG. 1 again, a functional block diagram in the information processing apparatus 100 will be described. The document data receiving unit 130 receives document data from the access destination document data providing apparatus. The document data receiving unit 130 presents the document data to the user on the display unit 111, while delivering the same document data to the genre analysis unit 140.

ジャンル解析部140は、文書データ中の単語を解析することによって、当該文書データがどのようなジャンルに属するものであるのかを解析する。ジャンル解析部140で解析されるジャンルの概念を図3に示す。図3は本発明の実施の形態に係る情報処理装置で扱うジャンルの概念を模式的に示す図である。   The genre analysis unit 140 analyzes what genre the document data belongs to by analyzing words in the document data. The concept of the genre analyzed by the genre analysis unit 140 is shown in FIG. FIG. 3 is a diagram schematically showing the concept of a genre handled by the information processing apparatus according to the embodiment of the present invention.

図3に示すように、情報処理装置100で扱うジャンルは大項目から徐々に枝分かれしつつ、より詳細なジャンルに進むようになっている。ジャンル解析部140は、文書データの内容を解析するが、詳細なジャンルの特定ができない場合には、大項目に近い項目のジャンル(例えば、「球技」など)に解析を留め、より詳細なジャンルが特定できるような場合には大項目から離れたより詳細な項目(例えば、「球技」→「野球」→「メジャーリーグ」など)のジャンルを特定する。   As shown in FIG. 3, the genre handled by the information processing apparatus 100 is gradually branched from a large item, and proceeds to a more detailed genre. The genre analysis unit 140 analyzes the contents of the document data, but if the detailed genre cannot be specified, the genre analysis unit 140 analyzes the genre of the item close to the large item (for example, “ball game”) and the more detailed genre. In such a case, a genre of a more detailed item (for example, “ball game” → “baseball” → “major league”) separated from the large item is specified.

情報処理装置100のジャンル解析部140は、文書データのジャンル解析に用いるジャンル解析用辞書データベース135を有している。ジャンル解析部140は、所定の文書を解析するときには、当該文書データ中から単語をピックアップし、ピックアップされた単語との関連性によって文書データが属するジャンルを決定する。単語とジャンルとの関連性がデータベース化されたものがジャンル解析用辞書データベース135である。なお、ジャンル解析部140のジャンル解析のためのアルゴリズムについては従来周知の種々のものを用いることができる。
なお、特許請求の範囲における「ジャンル解析手段」は、ジャンル解析部140を上位概念的に示したものである。
The genre analysis unit 140 of the information processing apparatus 100 has a genre analysis dictionary database 135 used for genre analysis of document data. When analyzing a predetermined document, the genre analysis unit 140 picks up a word from the document data, and determines the genre to which the document data belongs based on the relationship with the picked-up word. A genre analysis dictionary database 135 is a database of relations between words and genres. Note that various well-known algorithms can be used for the genre analysis algorithm of the genre analysis unit 140.
The “genre analysis unit” in the claims is a conceptual representation of the genre analysis unit 140.

閲覧時間算定部141は、所定の文書データ提供装置を閲覧した時間を算定するものである。また、情報処理装置100の計時部142は現在時刻を計時するものであり、情報処理装置100が所定の文書データ提供装置にアクセスした時刻情報を提供する。なお、特許請求の範囲における「閲覧時間算定手段」は、閲覧時間算定部141を上位概念的に示したものであり、特許請求の範囲における「計時手段」は、この計時部142を上位概念的に示したものである。   The browsing time calculation unit 141 calculates the time for browsing a predetermined document data providing apparatus. The time measuring unit 142 of the information processing apparatus 100 measures the current time, and provides time information when the information processing apparatus 100 accesses a predetermined document data providing apparatus. The “browsing time calculation means” in the claims is a high-level conceptual view of the browsing time calculation section 141, and the “time counting means” in the claims is a high-level conceptual view. It is shown in.

情報処理装置100が所定の文書データ提供装置にアクセスしたときにおいては、ジャンル解析部140によって解析された「ジャンル」及び閲覧時間算定部141によって算定された「閲覧時間」及び計時部142によって計時された「アクセス時刻」をひとまとまりの「検索指向データ」として、検索指向データベース150に蓄積する。   When the information processing apparatus 100 accesses a predetermined document data providing apparatus, the “genre” analyzed by the genre analyzing unit 140 and the “browsing time” calculated by the browsing time calculating unit 141 and the time measuring unit 142 are counted. The “access time” is stored in the search-oriented database 150 as a group of “search-oriented data”.

このような検索指向データベース150へのデータ蓄積について図4も参照しつつより具体的に説明する。図4は本発明の実施の形態に係る情報処理装置における検索指向データの収集過程を模式的に示す図である。情報処理装置100のユーザーが、例えば文書データ提供装置200cに対してアクセスした場合を考える。このとき、上述のジャンル解析部140によって、文書データ提供装置200cが提供する文書データが属するジャンルは「デジタルカメラ」であることを解析したとする。また、閲覧時間算定部141によって、文書データ提供装置200cが提供する文書データを閲覧した時間が「10分30秒」であると算定されたとする。また、計時部142によって計時されたアクセス時刻が「2008/6/19 15:00:00」であったものとする。このような場合には、検索指向データベース150には、図4の(1)に示されるようなデータが蓄積される。   The accumulation of data in the search-oriented database 150 will be described more specifically with reference to FIG. FIG. 4 is a diagram schematically showing a search-oriented data collection process in the information processing apparatus according to the embodiment of the present invention. Consider a case where the user of the information processing apparatus 100 accesses the document data providing apparatus 200c, for example. At this time, it is assumed that the genre analysis unit 140 analyzes that the genre to which the document data provided by the document data providing apparatus 200c belongs is “digital camera”. Further, it is assumed that the browsing time calculation unit 141 calculates that the time for browsing the document data provided by the document data providing apparatus 200c is “10 minutes 30 seconds”. In addition, it is assumed that the access time counted by the timing unit 142 is “2008/6/19 15:00:00”. In such a case, data as shown in (1) of FIG.

次に、例えば文書データ提供装置200dに対してアクセスした場合を考える。このとき、上述のジャンル解析部140によって、文書データ提供装置200dが提供する文書データが属するジャンルは「日本酒」であることを解析したとする。また、閲覧時間算定部141によって、文書データ提供装置200cが提供する文書データを閲覧した時間が「20秒」であると算定されたとする。また、計時部142によって計時されたアクセス時刻が「2008/6/19 15:11:00」であったものとする。このような場合には、検索指向データベース150には、図4の(2)に示されるようなデータの蓄積が基本的には行われるが、ただ、閲覧時間算定部141によって算定された閲覧時間20秒と比較的短く、図4の(2)に示すデータは、検索指向データベース150を利用する上でのノイズとなる可能性もあるので、このデータ(2)を破棄するようにしてもよい。特許請求の範囲における「前記閲覧時間算定手段によって算定された閲覧時間が所定閲覧時間以上の前記文書データのジャンルのみを検索指向データとして前記検索指向データベースに蓄積する」ことは、このようなデータ破棄のことを上位概念的に表現したものである。なお、閲覧時間算定部141は、所定の文書データ提供装置を閲覧した時間を算定するが、本実施例に限定されるものではない。例えば、操作者が検索装置300から送信されたリンクを選択した場合に閲覧時刻の計測開始を検索装置300に報知し、操作者がそのリンクから他のリンク先にアクセスしたときを計測終了を検索装置300に報知することで、検索装置300は閲覧時刻の計測開始から計測終了までの閲覧時間として算定することが出来る。すなわち、閲覧時刻の計測は、クライアントまたはサーバーのいずれで計測しても良く、情報にアクセスするためのブラウザによって計測しても良い。   Next, for example, consider a case where the document data providing apparatus 200d is accessed. At this time, it is assumed that the genre analysis unit 140 analyzes that the genre to which the document data provided by the document data providing apparatus 200d belongs is “Japanese sake”. Further, it is assumed that the browsing time calculation unit 141 calculates that the time for browsing the document data provided by the document data providing apparatus 200c is “20 seconds”. In addition, it is assumed that the access time counted by the timing unit 142 is “2008/6/19 15:11:00”. In such a case, data is basically stored in the search-oriented database 150 as shown in (2) of FIG. 4, but the browsing time calculated by the browsing time calculation unit 141 is merely used. Since the data shown in (2) of FIG. 4 is relatively short, such as 20 seconds, there is a possibility of causing noise when using the search-oriented database 150. Therefore, the data (2) may be discarded. . “Accumulating only the genre of the document data whose browsing time calculated by the browsing time calculation means is equal to or longer than a predetermined browsing time in the search-oriented database as search-oriented data” in the claims is such data destruction Is a high-level concept. The browsing time calculation unit 141 calculates the time for browsing a predetermined document data providing apparatus, but is not limited to this embodiment. For example, when the operator selects a link transmitted from the search device 300, the search device 300 is informed of the start of browsing time measurement, and the end of measurement is searched when the operator accesses another link destination from the link. By notifying the device 300, the search device 300 can calculate the browsing time from the measurement start of the browsing time to the end of the measurement. That is, the browsing time may be measured by either the client or the server, or by a browser for accessing information.

次に、情報処理装置100のユーザーが、例えば文書データ提供装置200fに対してアクセスした場合を考える。このとき、上述のジャンル解析部140によって、文書データ提供装置200fが提供する文書データが属するジャンルは「ペット」であることを解析したとする。また、閲覧時間算定部141によって、文書データ提供装置200cが提供する文書データを閲覧した時間が「7分00秒」であると算定されたとする。また、計時部142によって計時されたアクセス時刻が「2008/6/19 15:13:00」であったものとする。このような場合には、検索指向データベース150には、図4の(3)に示されるようなデータの蓄積が実行される。   Next, consider a case where the user of the information processing apparatus 100 accesses the document data providing apparatus 200f, for example. At this time, it is assumed that the genre analysis unit 140 analyzes that the genre to which the document data provided by the document data providing apparatus 200f belongs is “pet”. Further, it is assumed that the browsing time calculation unit 141 calculates that the time when the document data provided by the document data providing apparatus 200c is browsed is “7:00”. In addition, it is assumed that the access time counted by the timing unit 142 is “2008/6/19 15:13:00”. In such a case, data accumulation as shown in (3) of FIG.

以上のようにして検索指向データベース150に蓄積されたデータの利用方法の一例について次に説明する。   Next, an example of how to use the data accumulated in the search-oriented database 150 as described above will be described.

検索指示部160は検索装置300に対して、所定のキーワードを検索語として検索指示要求を行う構成である。ここで、本発明の情報処理装置100において特徴的であるのは、ユーザーによって入力部120から入力されたキーワードに加えて、検索指向データベース150から選択された検索指向データの「ジャンル」についてもキーワードとして、検索装置300に対して検索指示要求を行うことである。このような「ジャンル」キーワードを加味して、検索装置300に対して検索指示をすることによって、本発明の情報処理装置100によれば、ユーザーの負担を要することなくより精度の高い検索を実行することが可能となる。なお、特許請求の範囲における「検索指示手段」は、この検索指示部160を上位概念的に示したものである。   The search instruction unit 160 is configured to make a search instruction request to the search device 300 using a predetermined keyword as a search word. Here, the information processing apparatus 100 according to the present invention is characterized by a keyword regarding the “genre” of the search-oriented data selected from the search-oriented database 150 in addition to the keyword input from the input unit 120 by the user. And a search instruction request to the search device 300. By taking such a “genre” keyword into consideration and instructing the search device 300 to perform a search, according to the information processing device 100 of the present invention, a more accurate search can be performed without requiring the user's burden. It becomes possible to do. The “search instruction means” in the claims is a high-level conception of the search instruction unit 160.

検索指向データベース150から選択された「ジャンル」キーワードをどのようなものとするかは任意であるが、一例としては最新の検索指向データの「ジャンル」を最新キーワードとして、用いることができる。このような最新の検索指向データの「ジャンル」キーワードを、ユーザー入力されたキーワードと併用することで、ユーザーの最新の関心事項が加味された検索指示を検索装置300に送信することとなるので、本発明の情報処理装置100によれば、ユーザーの負担を要することなく、ユーザーの最新の興味の動向に沿った精度の高い検索を実行することが可能となる。   The “genre” keyword selected from the search-oriented database 150 is arbitrary, but as an example, the “genre” of the latest search-oriented data can be used as the latest keyword. By using the “genre” keyword of the latest search-oriented data in combination with the keyword input by the user, a search instruction including the latest interest of the user is transmitted to the search device 300. According to the information processing apparatus 100 of the present invention, it is possible to execute a highly accurate search according to the latest trend of interest of the user without requiring the user's burden.

なお、特許請求の範囲における「最新キーワード」は、上記の最新の検索指向データの「ジャンル」キーワードを上位概念的に示したものである。   The “latest keyword” in the claims is a high-level conception of the “genre” keyword of the latest search-oriented data.

入力部120を構成するキーボード109やマウス110などから入力された文書データ提供装置の指定先(URLなど)は、文書データ取得要求部161に送られ、この文書データ取得要求部161は、ユーザーが指定した文書データ提供装置に対して、文書データの送信を要求する。   A document data providing device designation destination (such as a URL) input from the keyboard 109 or mouse 110 constituting the input unit 120 is sent to the document data acquisition request unit 161. The document data acquisition request unit 161 is displayed by the user. Requests transmission of document data to the designated document data providing apparatus.

次に、本発明の他の実施形態について説明する。図5は本発明の他の実施の形態に係る情報処理装置の概念を説明する図である。図5において、図1と同様の参照符号が付された構成は、同様のものであり、同じ機能を果たすものである。   Next, another embodiment of the present invention will be described. FIG. 5 is a diagram for explaining the concept of an information processing apparatus according to another embodiment of the present invention. In FIG. 5, configurations denoted by the same reference numerals as those in FIG. 1 are the same and perform the same functions.

本実施形態が先の実施形態と異なる点は、先の実施形態の構成に加え、2つのソート部―第1ソート部171及び第2ソート部172―を備える点である。   The present embodiment is different from the previous embodiment in that in addition to the configuration of the previous embodiment, two sort units—a first sort unit 171 and a second sort unit 172—are provided.

第1ソート部171は、検索指向データベース150に蓄積された検索指向データをジャンル別の総閲覧時間数に応じてソートするものである。この第1ソート部171のソート処理についてより詳しく説明する。図6は本発明の他の実施の形態に係る情報処理装置100の第1ソート部171による処理を説明する図である。   The first sorting unit 171 sorts the search-oriented data stored in the search-oriented database 150 according to the total number of browsing hours by genre. The sorting process of the first sorting unit 171 will be described in more detail. FIG. 6 is a diagram for explaining processing by the first sorting unit 171 of the information processing apparatus 100 according to another embodiment of the present invention.

既に説明したように、検索指向データは「ジャンル」、「閲覧時間」、「アクセス時刻」が組み合わされて一つのデータとされている。この中で、同一「ジャンル」の検索指向データの「閲覧時間」を全て足し合わせたものが総閲覧時間数である。第1ソート部171によるソート処理によれば、例えば図6に示されたようなソート結果となる。すなわち、検索指向データベース150を第1ソート部171によってソートすることによって、例えば、ジャンルキーワード「デジタルカメラ」が総閲覧時間数75時間25分00秒で第1位に、ジャンルキーワード「イタリア料理」が総閲覧時間数68時間38分00秒で第2位に、・・・・・というような結果を得ることが可能となる。   As already described, the search-oriented data is combined with “genre”, “browsing time”, and “access time” as one data. Among these, the total browsing time is the sum of all “viewing times” of search-oriented data of the same “genre”. According to the sorting process by the first sorting unit 171, for example, a sorting result as shown in FIG. 6 is obtained. That is, by sorting the search-oriented database 150 by the first sorting unit 171, for example, the genre keyword “digital camera” is ranked first with a total browsing time of 75 hours 25:00, and the genre keyword “Italian cuisine” It is possible to obtain a result such as... In the second place with a total viewing time of 68 hours 38:00.

総閲覧時間数が長いほど(すなわち、第1ソート部171によってソートで順位が高いほど)、ユーザーの興味が高い、と言う予想を立てることができる。本実施形態においては、検索指向データベース150からピックアップされ、検索指示部160で用いられる「ジャンル」キーワードとして、第1ソート部171によってソートされて最も順位が高いジャンルをキーワードとして用いる。すなわち、本実施形態においては、総閲覧時間数が長くユーザーの興味が高い可能性があるキーワード―最頻出キーワードともいう―を、ユーザー入力されたキーワードと併用する。これによれば、ユーザーが最も関心のある事項が加味された検索指示を検索装置300に送信することとなるので、本実施形態の情報処理装置100によれば、ユーザーの負担を要することなく、ユーザーの全般的な興味に沿った精度の高い検索を実行することが可能となる。なお、特許請求の範囲における「最頻出キーワード」は、第1ソート部171によってソートされた総閲覧時間数が最も長いジャンルキーワードを上位概念的に示したものである。また、特許請求の範囲における「第1ソート手段」は、この第1ソート部171を上位概念的に示したものである。   It can be predicted that the longer the total browsing time (that is, the higher the ranking by the first sorting unit 171), the higher the user's interest. In the present embodiment, as the “genre” keyword picked up from the search-oriented database 150 and used in the search instruction unit 160, the genre having the highest ranking sorted by the first sorting unit 171 is used as the keyword. That is, in the present embodiment, a keyword that is likely to be of high interest to the user because of the long total browsing time—also referred to as the most frequently used keyword—is used together with the keyword input by the user. According to this, a search instruction in which a matter that the user is most interested in is transmitted to the search device 300. Therefore, according to the information processing device 100 of the present embodiment, without burdening the user, It is possible to execute a highly accurate search that matches the general interest of the user. The “most frequently used keyword” in the claims is a high-level concept of a genre keyword with the longest total browsing time sorted by the first sorting unit 171. Further, the “first sorting means” in the claims is a conceptual representation of the first sorting unit 171.

次に、第2ソート部172について説明する。検索装置300に検索された結果、すなわち、文書データの候補(文書データ提供装置の候補)を受領する構成が検索結果受領部180であるが、この検索結果受領部180で受領された文書データの候補をソートする構成が第2ソート部172である。   Next, the second sort unit 172 will be described. The search result receiving unit 180 is configured to receive a search result by the search device 300, that is, a document data candidate (a candidate for the document data providing device). The search result receiving unit 180 receives the document data received by the search result receiving unit 180. The configuration for sorting the candidates is the second sorting unit 172.

より具体的には、第2ソート部172は、先の最頻出キーワードの文書データ中の出現回数に応じて、候補となる文書データをソートするものである。このようなソートによって、検索結果受領部180においては、文書データの候補が、ユーザー最関心事項の順に並び替えられることとなる。そして、第2ソート部172で並び替えられた結果を、表示部111に表示することによって、ユーザーの興味に沿った検索結果を提示することができる。   More specifically, the second sorting unit 172 sorts candidate document data according to the number of appearances of the most frequently occurring keyword in the document data. By such sorting, the search result receiving unit 180 rearranges the document data candidates in the order of the user's most important items. Then, by displaying the result rearranged by the second sort unit 172 on the display unit 111, a search result in accordance with the user's interest can be presented.

なお、特許請求の範囲における「第2ソート手段」は、第2ソート部172を上位概念的に示したものである。   The “second sort means” in the claims is a conceptual representation of the second sort unit 172.

なお、第2ソート部172の機能を検索装置300の側に持たせることも可能である。すなわち、検索装置300において、情報処理装置100からの複数のキーワードに基づいて閲覧可能な文書データの候補を抽出したとき、抽出した文書データにおける複数のキーワードのうちの一つのキーワードの出現回数に応じてソートを行った上で、情報処理装置100に閲覧可能な文書データの候補を回答する構成とするわけである。この場合、何らかの方法によって、検索指向データベース150を情報処理装置100から得るか、それに相当するものを検索装置300に保持しておくかする。   Note that the function of the second sorting unit 172 may be provided on the search device 300 side. That is, when the search device 300 extracts browseable document data candidates based on a plurality of keywords from the information processing device 100, the search device 300 depends on the number of appearances of one of the keywords in the extracted document data. Thus, after sorting, the information processing apparatus 100 answers the candidates for document data that can be browsed. In this case, the search-oriented database 150 is obtained from the information processing apparatus 100 by some method, or the equivalent is stored in the search apparatus 300.

このような検索装置300によれば、ユーザーの興味に沿った検索結果を提示することができることとなる。   According to such a search device 300, a search result in accordance with the user's interest can be presented.

以上、本明細書においては、種々の実施形態について説明したが、それぞれの実施形態の構成同士を、任意に組み合わせて構成した発明も本発明の範疇となり得ることを付記しておく。   As described above, in the present specification, various embodiments have been described. However, it should be noted that an invention configured by arbitrarily combining the configurations of the respective embodiments can also be included in the scope of the present invention.

本発明の実施の形態に係る情報処理装置の概念を説明する図である。It is a figure explaining the concept of the information processing apparatus which concerns on embodiment of this invention. 本発明の実施の形態に係る情報処理装置がシステム構成を示す図である。1 is a diagram illustrating a system configuration of an information processing apparatus according to an embodiment of the present invention. 本発明の実施の形態に係る情報処理装置で扱うジャンルの概念を模式的に示す図である。It is a figure which shows typically the concept of the genre handled with the information processing apparatus which concerns on embodiment of this invention. 本発明の実施の形態に係る情報処理装置における検索指向データの収集過程を模式的に示す図である。It is a figure which shows typically the collection process of the search oriented data in the information processing apparatus which concerns on embodiment of this invention. 本発明の他の実施の形態に係る情報処理装置の概念を説明する図である。It is a figure explaining the concept of the information processing apparatus which concerns on other embodiment of this invention. 本発明の他の実施の形態に係る情報処理装置の第1ソート部による処理を説明する図である。It is a figure explaining the process by the 1st sort part of the information processing apparatus which concerns on other embodiment of this invention.

符号の説明Explanation of symbols

50・・・ネットワーク、100・・・情報処理装置、101・・・CPU、102・・・ROM、103・・・RAM、104・・・システムバス、105・・・入力制御部、106・・・表示出力制御部、107・・・記憶媒体制御部、108・・・ネットワーク通信制御部、109・・・キーボード、110・・・マウス、111・・・表示部、112・・・・・・ドディスクドライブ、113・・・フレキシブルディスクドライブ、114・・・光学ディスクドライブ、120・・・入力部、130・・・文書データ受領部、135・・・ジャンル解析用辞書データベース、140・・・ジャンル解析部、141・・・閲覧時間算定部、142・・・計時部、150・・・検索指向データベース、160・・・検索指示部、161・・・文書データ取得要求部、171・・・第1ソート部、172・・・第2ソート部、180・・・検索結果受領部、200a〜200f・・・文書データ提供装置、300・・・検索装置 DESCRIPTION OF SYMBOLS 50 ... Network, 100 ... Information processing apparatus, 101 ... CPU, 102 ... ROM, 103 ... RAM, 104 ... System bus, 105 ... Input control part, 106 ... Display output control unit 107... Storage medium control unit 108... Network communication control unit 109 109 keyboard 110 110 mouse 111 display unit 112. Disk drive, 113 ... flexible disk drive, 114 ... optical disk drive, 120 ... input unit, 130 ... document data receiving unit, 135 ... genre analysis dictionary database, 140 ... Genre analysis unit, 141 ... browsing time calculation unit, 142 ... time keeping unit, 150 ... search-oriented database, 160 ... search instruction unit, 161. Document data acquisition request unit, 171 ... first sort unit, 172 ... second sort unit, 180 ... search result receiving unit, 200a to 200f ... document data providing device, 300 ... search apparatus

Claims (7)

アクセス先の文書データを解析することによって前記文書データが属するジャンルを解析するジャンル解析手段と、
前記文書データを閲覧していた時間を算定する閲覧時間算定手段と、
現在時刻を計時する計時手段と、
前記ジャンル解析手段によって解析された前記文書データのジャンルと前記閲覧時間算定手段によって算定された閲覧時間と前記計時手段によって計時された前記文書データに対するアクセス時刻とを組み合わせて検索指向データとして蓄積する検索指向データベースと、
所定のキーワードを入力するキーワード入力手段と、
前記キーワード入力手段によって入力されたキーワードと、前記検索指向データベースに蓄積される最新の検索指向データのジャンルを最新キーワードとして、ネットワークを介して閲覧可能な文書データを検索する検索装置に対して検索指示を行う検索指示手段と、を有することを特徴とする情報処理装置。
Genre analysis means for analyzing the genre to which the document data belongs by analyzing the document data of the access destination;
Browsing time calculation means for calculating the time when the document data was browsed;
A time measuring means for measuring the current time;
Retrieval in which the genre of the document data analyzed by the genre analyzing means, the browsing time calculated by the browsing time calculating means, and the access time for the document data timed by the time measuring means are combined and stored as search-oriented data An oriented database,
A keyword input means for inputting a predetermined keyword;
A search instruction for a search device that searches document data that can be browsed through a network, with the keyword input by the keyword input means and the genre of the latest search-oriented data stored in the search-oriented database as the latest keyword An information processing apparatus comprising: search instruction means for performing
アクセス先の文書データを解析することによって前記文書データが属するジャンルを解析するジャンル解析手段と、
前記文書データを閲覧していた時間を算定する閲覧時間算定手段と、
前記ジャンル解析手段によって解析された前記文書データのジャンルと前記閲覧時間算定手段によって算定された閲覧時間とを組み合わせて検索指向データとして蓄積する検索指向データベースと、
前記検索指向データベースに蓄積された検索指向データをジャンル別の総閲覧時間数に応じてソートする第1ソート手段と、
所定のキーワードを入力するキーワード入力手段と、
前記キーワード入力手段によって入力されたキーワードと、前記第1ソート手段によってソートされた総閲覧時間数が最も長いジャンルを最頻出キーワードとして、ネットワークを介して閲覧可能な文書データを検索する検索装置に対して検索指示を行う検索指示手段と、を有することを特徴とする情報処理装置。
Genre analysis means for analyzing the genre to which the document data belongs by analyzing the document data of the access destination;
Browsing time calculation means for calculating the time when the document data was browsed;
A search-oriented database that accumulates search-oriented data by combining the genre of the document data analyzed by the genre analysis means and the browsing time calculated by the browsing time calculation means;
First sorting means for sorting the search-oriented data stored in the search-oriented database according to the total browsing time by genre;
A keyword input means for inputting a predetermined keyword;
For a search device for searching document data that can be browsed via a network, with the keyword input by the keyword input means and the genre with the longest total browsing time sorted by the first sorting means as the most frequently used keywords. An information processing apparatus comprising: search instruction means for issuing a search instruction.
検索指示を行った前記検索装置から、閲覧可能な文書データの候補を受領する検索結果受領手段と、
前記検索結果受領手段によって受領された文書データの候補を、前記最頻出キーワードの文書データ中の出現回数に応じてソートする第2ソート手段と、を有することを特徴とする請求項2に記載の情報処理装置。
Search result receiving means for receiving candidates for viewable document data from the search device that has issued the search instruction;
The document data candidates received by the search result receiving means include second sorting means for sorting according to the number of appearances of the most frequently occurring keyword in the document data. Information processing device.
前記閲覧時間算定手段によって算定された閲覧時間が所定閲覧時間以上の前記文書データのジャンルのみを検索指向データとして前記検索指向データベースに蓄積することを特徴とする請求項1乃至請求項3のいずれかに記載の情報処理装置。 4. Only the genre of the document data whose browsing time calculated by the browsing time calculating means is equal to or longer than a predetermined browsing time is stored as search-oriented data in the search-oriented database. The information processing apparatus described in 1. 情報処理装置とネットワークを介して接続され、前記情報処理装置からのキーワードに基づいて閲覧可能な文書データを検索し、閲覧可能な文書データの候補を前記情報処理装置に回答する検索装置であって、
前記情報処理装置からの複数のキーワードに基づいて閲覧可能な文書データの候補を抽出したとき、抽出した文書データにおける前記複数のキーワードのうちの一つのキーワードの出現回数に応じてソートを行った上で、前記情報処理装置に閲覧可能な文書データの候補を回答することを特徴とする検索装置。
A search device connected to an information processing device via a network, searching for document data that can be browsed based on a keyword from the information processing device, and responding to the information processing device with candidates for viewable document data. ,
When candidates for document data that can be browsed are extracted based on a plurality of keywords from the information processing apparatus, sorting is performed according to the number of appearances of one of the keywords in the extracted document data. The search apparatus is characterized in that a candidate for document data that can be browsed is answered to the information processing apparatus.
アクセス先の文書データを解析することによって前記文書データが属するジャンルを解析するジャンル解析手段と、
前記文書データを閲覧していた時間を算定する閲覧時間算定手段と、
前記ジャンル解析手段によって解析された前記文書データのジャンルと前記閲覧時間算定手段によって算定された閲覧時間とを組み合わせて検索指向データとして蓄積する検索指向データベースと、を有することを特徴とする情報処理装置。
Genre analysis means for analyzing the genre to which the document data belongs by analyzing the document data of the access destination;
Browsing time calculation means for calculating the time when the document data was browsed;
An information processing apparatus comprising: a search-oriented database that stores the genre of the document data analyzed by the genre analysis means and the browsing time calculated by the browsing time calculation means in combination as search-oriented data. .
所定のキーワードを入力するキーワード入力手段と、
前記キーワード入力手段によって入力されたキーワードと、前記検索指向データベースに蓄積される検索指向データのジャンルをキーワードとして、ネットワークを介して閲覧可能な文書データを検索する検索装置に対して検索指示を行う検索指示手段と、を有することを特徴とする請求項6に記載の情報処理装置。
A keyword input means for inputting a predetermined keyword;
A search for instructing a search device for searching document data that can be browsed via a network, using the keyword input by the keyword input means and the genre of search-oriented data stored in the search-oriented database as keywords. The information processing apparatus according to claim 6, further comprising an instruction unit.
JP2008171533A 2008-06-30 2008-06-30 Information processing apparatus, information processing method, and program Expired - Fee Related JP5196150B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008171533A JP5196150B2 (en) 2008-06-30 2008-06-30 Information processing apparatus, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008171533A JP5196150B2 (en) 2008-06-30 2008-06-30 Information processing apparatus, information processing method, and program

Publications (2)

Publication Number Publication Date
JP2010009546A true JP2010009546A (en) 2010-01-14
JP5196150B2 JP5196150B2 (en) 2013-05-15

Family

ID=41589907

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008171533A Expired - Fee Related JP5196150B2 (en) 2008-06-30 2008-06-30 Information processing apparatus, information processing method, and program

Country Status (1)

Country Link
JP (1) JP5196150B2 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073677A (en) * 2000-09-05 2002-03-12 Zenrin Co Ltd Device for collecting personal preference information on reader and information reading support device using the information collecting device
JP2005301432A (en) * 2004-04-07 2005-10-27 Nippon Telegr & Teleph Corp <Ntt> Latest information providing method, system, and program
JP2006319799A (en) * 2005-05-13 2006-11-24 Pioneer Electronic Corp Information processing apparatus, system thereof, method thereof, program thereof, and recording medium with the program recorded thereon
JP2007507801A (en) * 2003-09-30 2007-03-29 グーグル インコーポレイテッド Personalized web search

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073677A (en) * 2000-09-05 2002-03-12 Zenrin Co Ltd Device for collecting personal preference information on reader and information reading support device using the information collecting device
JP2007507801A (en) * 2003-09-30 2007-03-29 グーグル インコーポレイテッド Personalized web search
JP2005301432A (en) * 2004-04-07 2005-10-27 Nippon Telegr & Teleph Corp <Ntt> Latest information providing method, system, and program
JP2006319799A (en) * 2005-05-13 2006-11-24 Pioneer Electronic Corp Information processing apparatus, system thereof, method thereof, program thereof, and recording medium with the program recorded thereon

Also Published As

Publication number Publication date
JP5196150B2 (en) 2013-05-15

Similar Documents

Publication Publication Date Title
JP5727512B2 (en) Cluster and present search suggestions
US8612435B2 (en) Activity based users&#39; interests modeling for determining content relevance
JP5638031B2 (en) Rating method, search result classification method, rating system, and search result classification system
US8645390B1 (en) Reordering search query results in accordance with search context specific predicted performance functions
CN103699700B (en) A kind of generation method of search index, system and associated server
US20100153371A1 (en) Method and apparatus for blending search results
US20070271255A1 (en) Reverse search-engine
EP2136302A1 (en) Method and device for generating updating parameter, and method and device for showing related keyword
KR100859918B1 (en) Method and apparatus for evaluating searched contents by using user feedback and providing search result by utilizing evaluation result
US20090287645A1 (en) Search results with most clicked next objects
US20070239692A1 (en) Logo or image based search engine for presenting search results
JP2007140973A (en) Page reranking device, and page reranking program
JP4453437B2 (en) Search keyword ranking method, apparatus and program
WO2007042840A1 (en) Search using changes in prevalence of content items on the web
US8234584B2 (en) Computer system, information collection support device, and method for supporting information collection
JP2007256992A (en) Content specifying method and device
JP2005107688A (en) Information display method and system and information display program
JP2011039625A (en) Information retrieval system and information retrieval method
US20100332491A1 (en) Method and system for utilizing user selection data to determine relevance of a web document for a search query
JP5321258B2 (en) Information collecting system, information collecting method and program thereof
JP5196150B2 (en) Information processing apparatus, information processing method, and program
JP2007183903A (en) Trend information analyzer
KR101120040B1 (en) Apparatus for recommending related query and method thereof
JP4088164B2 (en) Document score calculation method, apparatus, and program
EP2662785A2 (en) A method and system for non-ephemeral search

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121022

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160215

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5196150

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees