JP2008052579A - Retrieval device and program - Google Patents

Retrieval device and program Download PDF

Info

Publication number
JP2008052579A
JP2008052579A JP2006229482A JP2006229482A JP2008052579A JP 2008052579 A JP2008052579 A JP 2008052579A JP 2006229482 A JP2006229482 A JP 2006229482A JP 2006229482 A JP2006229482 A JP 2006229482A JP 2008052579 A JP2008052579 A JP 2008052579A
Authority
JP
Japan
Prior art keywords
document
browsing
importance
content data
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006229482A
Other languages
Japanese (ja)
Inventor
Kiritsu To
巍立 唐
Yasuhito Nagatomo
康仁 永友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2006229482A priority Critical patent/JP2008052579A/en
Publication of JP2008052579A publication Critical patent/JP2008052579A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To present a retrieval result so that a user understands important contents while minimizing the user's workload. <P>SOLUTION: A determining section 14 determines and stores the importance (ranks) of each document and pages included in the document based on a display time stored in a display time management section 15, the number of marking stored in a marking number management section 16, and display frequency stored in a display frequency management section 17. The ranks are determined by page of each document. The ranks for every page are further totaled, and the ranks for every document are obtained by a value (an average value) obtained by dividing the total value by the number of ranked pages. In retrieving the document by a keyword, for instance, the ranked result is reflected in the retrieval result. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は文書などのコンテンツを検索するための技術に関する。   The present invention relates to a technique for searching content such as a document.

記憶装置の大容量化が進み、文書や映像などを含む様々なコンテンツを大量に記憶することが可能となっている。汎用のコンピュータにおいて、膨大な数のコンテンツの中から所望のものを探し出す場合には、例えばデータファイル名、データ形式、データサイズ、作成・アクセス日時或いはキーワードなどをユーザが指定し、その指定した内容に合致するコンテンツをコンピュータが検索する、という方法が一般的である。また、図書館などの検索システムにおいては、各々の図書に関するメタデータを事前に手入力しておき、検索時にはメタデータの内容を指定することによって図書を検索する、という方法が採られている。さらに、特許文献1では、ユーザが重要だと考えるコンテンツに対してアンダーラインやシオリなどのマーキングを付加する技術が提案されている。
特開平9−101971号公報
As the capacity of storage devices has been increased, various contents including documents and videos can be stored in large quantities. In a general-purpose computer, when searching for a desired content from a vast number of contents, the user specifies, for example, the data file name, data format, data size, creation / access date or keyword, and the specified contents In general, a computer searches for content that matches the above. In a search system such as a library, metadata relating to each book is manually input in advance, and the book is searched by specifying the content of the metadata at the time of the search. Further, Patent Document 1 proposes a technique for adding markings such as underline and sirioli to content that the user considers important.
JP-A-9-101971

従来の検索方法において、より有用な検索結果を得るためには、例えばメタデータの入力などのように事前の作業が必要であり、これが非常に煩雑で手間がかかるという問題がある。また、検索結果を表示する際には、検索されたコンテンツを決められた順番で羅列して表示するだけであるから、検索結果に多数のコンテンツが含まれるような場合には、ユーザがそれぞれのコンテンツの内容を見て、自らにとっての重要度を1つ1つ確認しなければならない。   In order to obtain a more useful search result in the conventional search method, for example, prior work such as input of metadata is required, which is very complicated and troublesome. In addition, when displaying the search results, the searched contents are simply displayed in a predetermined order. Therefore, when a large number of contents are included in the search results, the user must You must look at the contents and check the importance of each one.

本発明は上述した背景に鑑みてなされたものであり、その目的は、ユーザの作業負担をできるだけ軽減しつつ、そのユーザにとって重要なコンテンツが分かるような検索結果を提示することにある。   The present invention has been made in view of the above-described background, and an object of the present invention is to present a search result that can identify content important to a user while reducing the work load of the user as much as possible.

上記目的を達成するために、本発明は、コンテンツデータに基づいて表示手段に表示された画像が閲覧された程度を計測し、その閲覧の程度を表す閲覧程度情報を生成する計測手段と、前記計測手段によって生成された閲覧程度情報に基づいて、前記コンテンツデータの重要度を判定する判定手段と、複数のコンテンツデータの中から、指定された検索条件に合致するコンテンツデータを検索し、その検索結果を、前記判定手段により各コンテンツデータについて判定された重要度に応じた出力態様で出力する検索手段とを備えることを特徴とする検索装置を提供する。本発明によれば、コンテンツを検索する際に、ユーザにとって重要なコンテンツが分かるような検索結果を出力することができる。また、ユーザがコンテンツを閲覧するという行為によって各コンテンツデータの重要度が判定されるので、ユーザに対して特別な作業や操作を負わせることがない。   In order to achieve the above object, the present invention measures the degree to which an image displayed on a display means is browsed based on content data, and generates a browsing degree information representing the degree of browsing, Based on the browsing degree information generated by the measuring means, the determination means for determining the importance of the content data, and the content data that matches the specified search condition are searched from the plurality of content data, and the search There is provided a search device comprising: search means for outputting a result in an output mode corresponding to the degree of importance determined for each content data by the determination means. According to the present invention, when searching for content, it is possible to output a search result that can identify content important to the user. In addition, since the importance of each content data is determined by the act of the user browsing the content, no special work or operation is imposed on the user.

本発明の好ましい態様において、前記計測手段は、前記画像が前記表示手段に表示された時間、前記画像が前記表示手段に表示された頻度、又は、前記画像に対してユーザが付与した情報の個数のうち、少なくともいずれか1つを計測して、その計測値を前記閲覧程度情報とする。   In a preferred aspect of the present invention, the measuring means is the time when the image is displayed on the display means, the frequency at which the image is displayed on the display means, or the number of information given by the user to the image. At least one of them is measured, and the measured value is used as the browsing degree information.

本発明の好ましい態様において、前記計測手段は、前記画像が前記表示手段に表示された頻度を計測して、その計測値を前記閲覧程度情報とし、前記判定手段は、前記頻度が多くなるに従って前記重要度が高くなる関数に対し、前記計測手段によって生成された前記閲覧程度情報を入力して、前記コンテンツデータの重要度を求め、前記関数は、前記重要度を縦軸として前記頻度を横軸とした場合に、前記頻度が所定値に到達するまでの間においては下に凸となるような関数となり、前記頻度が前記所定値を超えると上に凸となるような関数である。このようにすれば、表示頻度の特性に応じた重要度を判定することができる。   In a preferred aspect of the present invention, the measurement means measures the frequency at which the image is displayed on the display means, and uses the measurement value as the browsing degree information, and the determination means determines the frequency as the frequency increases. For the function with higher importance, the browsing degree information generated by the measuring means is input to determine the importance of the content data, and the function uses the importance as the vertical axis and the frequency as the horizontal axis In this case, the function becomes a convex function until the frequency reaches a predetermined value, and the function functions as a convex function when the frequency exceeds the predetermined value. In this way, it is possible to determine the importance according to the display frequency characteristics.

本発明の好ましい態様において、前記計測手段は、複数種類の前記閲覧程度情報を生成し、前記判定手段は、前記計測手段によって生成された複数種類の閲覧程度情報がそれぞれ表す閲覧の程度を所定の比率で按分して前記コンテンツデータの重要度を判定する。複数種類の閲覧程度情報を考慮することで、重要度の判定精度を向上させることができる。   In a preferred aspect of the present invention, the measuring unit generates a plurality of types of browsing degree information, and the determining unit is configured to determine a browsing level respectively represented by the plurality of types of browsing level information generated by the measuring unit. The degree of importance of the content data is determined by proportional distribution. Considering multiple types of browsing degree information, the determination accuracy of importance can be improved.

本発明の好ましい態様において、前記計測手段は、複数種類の前記閲覧程度情報を生成し、前記判定手段は、前記複数種類の閲覧程度情報のうち、前記重要度を判定する対象期間の長短に応じた種類の閲覧程度情報に基づいて、前記コンテンツデータの重要度を判定する。複数種類の閲覧程度情報を考慮することで、重要度の判定精度を向上させることができるとともに、前記重要度を判定する対象期間の長短に応じて重要度を判定することが可能となる。   In a preferred aspect of the present invention, the measuring unit generates a plurality of types of browsing degree information, and the determining unit is configured to respond to a length of a target period for determining the importance degree among the plurality of types of browsing level information. The degree of importance of the content data is determined based on different types of browsing degree information. Considering multiple types of browsing degree information, it is possible to improve the determination accuracy of the importance level, and it is possible to determine the importance level according to the length of the target period for determining the importance level.

本発明の好ましい態様において、前記コンテンツデータは、複数のページデータからなる文書データであり、前記計測手段は、前記表示手段に表示されたページが閲覧された程度を計測して、その閲覧の程度を表す閲覧程度情報を生成し、前記判定手段は、前記計測手段によって生成された閲覧程度情報に基づき、各々の前記文書に含まれるページ単位の重要度、及び、各々の前記文書単位の重要度を判定し、前記検索手段は、記憶手段に記憶された複数の文書データの中から、指定された検索条件に合致する文書データ又はページデータを検索し、その検索結果を、前記判定手段により各文書データ及び各ページデータについて判定された重要度に応じた出力態様で出力する。   In a preferred aspect of the present invention, the content data is document data composed of a plurality of page data, and the measuring means measures the degree of browsing of the page displayed on the display means, and the degree of browsing The degree-of-view information that represents the degree of importance of each page included in each of the documents and the degree of importance of each of the document units based on the degree-of-view information generated by the measuring means The search means searches for document data or page data that matches a specified search condition from a plurality of document data stored in the storage means, and the search result is obtained by the determination means. The document data and each page data are output in an output mode corresponding to the determined importance.

本発明の好ましい態様において、前記表示手段に表示される画像を閲覧するユーザを特定するユーザ特定手段を備え、前記計測手段は、前記表示手段によって表示された画像が閲覧された程度を表す閲覧程度情報を、当該画像を閲覧するユーザとして前記ユーザ特定手段によって特定されたユーザに割り当てられたユーザ識別情報と対応付けて記憶し、
前記判定手段は、各々のユーザ識別情報に対応付けられて前記計測手段により記憶されている閲覧程度情報に基づき、前記コンテンツデータの重要度を判定する。このようにすれば、表示される画像を複数のユーザが閲覧する場合であっても、各々のユーザに応じた重要度を判定することが可能となる。
In a preferred aspect of the present invention, the apparatus includes a user specifying unit that specifies a user who browses an image displayed on the display unit, and the measuring unit is a browsing level indicating a level of viewing of the image displayed by the display unit. Storing the information in association with the user identification information assigned to the user specified by the user specifying means as the user viewing the image,
The determination means determines the importance of the content data based on browsing degree information stored in association with each user identification information and stored by the measurement means. In this way, even when a plurality of users browse the displayed image, it is possible to determine the importance according to each user.

また、本発明は、コンピュータに、コンテンツデータに基づいて表示手段に表示された画像が閲覧された程度を表す閲覧程度情報に基づいて、前記コンテンツデータの重要度を判定する判定機能と、複数のコンテンツデータの中から、指定された検索条件に合致するコンテンツデータを検索し、その検索結果を、前記判定機能により各コンテンツデータについて判定された重要度に応じた出力態様で出力する検索機能とを実現させるためのプログラムを提供する。本発明によれば、コンテンツを検索する際に、ユーザにとって重要なコンテンツが分かるような検索結果を出力することができる。また、ユーザがコンテンツを閲覧するという行為によって各コンテンツデータの重要度が判定されるので、ユーザに対して特別な作業や操作を負わせることがない。   Further, the present invention provides a computer having a determination function for determining the importance of the content data based on browsing degree information indicating a degree to which an image displayed on the display unit is browsed based on the content data, A search function for searching content data that matches a specified search condition from the content data, and outputting the search result in an output mode according to the importance determined for each content data by the determination function; Provide a program to make it happen. According to the present invention, when searching for content, it is possible to output a search result that can identify content important to the user. In addition, since the importance of each content data is determined by the act of the user browsing the content, no special work or operation is imposed on the user.

本実施形態では、1又は複数のページからなる「文書」を、検索対象となる“コンテンツ”とする。そして、各々のコンテンツが個々のユーザによってどの程度重要であるかを判定し、各文書についてランク付けを行う。そして、例えばキーワード検索によって文書を検索する際には、そのランク付けを検索結果の出力態様に反映させ、ユーザにどの文書が重要であるかを理解させるようにしている。   In this embodiment, a “document” composed of one or a plurality of pages is set as “content” to be searched. Then, how important each content is by each user is determined, and each document is ranked. For example, when searching for a document by keyword search, the ranking is reflected in the output form of the search result so that the user can understand which document is important.

そして、本実施形態では、文書の閲覧の程度が高いほど、その文書はユーザにとって重要であり、閲覧の程度が低いほど重要ではない、という考え方を採っている。文書の重要度は、ユーザがその文書に対してどの程度興味や関心を抱いて閲覧したかという“閲覧の程度”に基づいて判定される。閲覧の程度を測定する方法には、以下の3種類がある。
(A)コンテンツが表示されている時間を計測し、この計測値を、閲覧の程度を表す閲覧程度情報とする方法。
(B)コンテンツに対してなされたマーキングの個数を計測し、この計測値を、閲覧の程度を表す閲覧程度情報とする方法。
(C)一定期間におけるコンテンツの表示頻度を計測し、この計測値を、閲覧の程度を表す閲覧程度情報とする方法。
以下、上記の考え方に沿って、実施形態の詳細を説明する。
In this embodiment, the idea is that the higher the level of browsing the document, the more important the document is for the user, and the lower the level of browsing, the less important it is. The degree of importance of a document is determined based on the “degree of browsing” indicating how much interest the user has viewed with respect to the document. There are the following three methods for measuring the degree of browsing.
(A) A method of measuring the time during which content is displayed and using the measured value as browsing degree information indicating the degree of browsing.
(B) A method of measuring the number of markings made on the content and using the measured value as browsing degree information indicating the degree of browsing.
(C) A method of measuring the display frequency of content in a certain period and using the measured value as browsing degree information indicating the degree of browsing.
Hereinafter, the details of the embodiment will be described in accordance with the above concept.

(1)実施形態の構成
図1は、本実施形態に係る表示検索システム1の構成を示した図である。
この表示検索システム1は、複数の文書データ(コンテンツデータ)を記憶したホスト装置10と、その文書データに基づいた文書を画像として表示する文書表示デバイス200と、文書表示デバイス200に表示された文書に対してマーキングなどの処理を行うためのペン型のセンシングデバイス30とを備えている。文書データは、文書を構成する複数のページを表すページデータから成る。文書データには、各文書を識別するための文書ID(Identification:識別情報)が割り当てられている。また、各文書データに含まれるページデータには、ページ番号が割り当てられている。表示検索システム1は、この文書ID及びページ番号に基づいて各々の文書及びページを識別し、それぞれの文書・ページ単位での処理を実行することができるようになっている。
(1) Configuration of Embodiment FIG. 1 is a diagram illustrating a configuration of a display search system 1 according to the present embodiment.
The display search system 1 includes a host device 10 that stores a plurality of document data (content data), a document display device 200 that displays a document based on the document data as an image, and a document displayed on the document display device 200. And a pen-type sensing device 30 for performing processing such as marking. The document data is composed of page data representing a plurality of pages constituting the document. A document ID (Identification: identification information) for identifying each document is assigned to the document data. A page number is assigned to page data included in each document data. The display retrieval system 1 can identify each document and page based on the document ID and page number, and can execute processing in units of each document / page.

文書表示デバイス200は、表示部21と、表示時間計測部22と、通信部23とを備えている。通信部23は、アンテナや無線通信回路を備えており、例えばBluetooth(登録商標)などで規定された通信手順に従って無線通信を行う。この通信部23は、ホスト装置10からセンシングデバイス30を経由して送信されてくる文書データを受信し、これを表示部21に供給する。表示部21は、コレステリック液晶や電気泳動などを利用した記憶性液晶表示体や表示制御回路を備えており、通信部23から供給される文書データに基づいて文書を表示する。表示時間計測部22は、それぞれの文書・ページが表示されている時間を計測し、記録する。この表示時間は、ユーザが過去に各々の文書・ページをどれくらいの期間にわたって閲覧していたかという“閲覧の程度”を表している。記録された表示時間は通信部23経由でセンシングデバイス30に送信される。   The document display device 200 includes a display unit 21, a display time measurement unit 22, and a communication unit 23. The communication unit 23 includes an antenna and a wireless communication circuit, and performs wireless communication according to a communication procedure defined by, for example, Bluetooth (registered trademark). The communication unit 23 receives document data transmitted from the host device 10 via the sensing device 30 and supplies it to the display unit 21. The display unit 21 includes a storage liquid crystal display using a cholesteric liquid crystal or electrophoresis, and a display control circuit, and displays a document based on document data supplied from the communication unit 23. The display time measuring unit 22 measures and records the time during which each document / page is displayed. This display time represents the “degree of browsing” indicating how long the user has viewed each document / page in the past. The recorded display time is transmitted to the sensing device 30 via the communication unit 23.

センシングデバイス30は、マーキング数計測部31と、表示頻度計測部32と、記憶部33と、画像入力部34と、画像処理部35と、通信部36とを有する。通信部36は、文書表示デバイス200の通信部23と同じ通信手順に従って無線通信を行う。この通信部36は、ホスト装置10から送信されてくる文書データを受信し、記憶部33に格納する。記憶部33に格納された文書データは、必要に応じて、通信部36から文書表示デバイス200の通信部23に送信される。また、通信部36は、文書表示デバイス200から送信されてくる表示時間を受信して、ホスト装置10に転送することも行う。   The sensing device 30 includes a marking number measurement unit 31, a display frequency measurement unit 32, a storage unit 33, an image input unit 34, an image processing unit 35, and a communication unit 36. The communication unit 36 performs wireless communication according to the same communication procedure as that of the communication unit 23 of the document display device 200. The communication unit 36 receives document data transmitted from the host device 10 and stores it in the storage unit 33. The document data stored in the storage unit 33 is transmitted from the communication unit 36 to the communication unit 23 of the document display device 200 as necessary. The communication unit 36 also receives the display time transmitted from the document display device 200 and transfers it to the host device 10.

画像入力部34は、ユーザがセンシングデバイス30を用いて文書にマーキングを行う際に、マーキングされた箇所近傍の画像を読み取る。画像処理部35は、画像入力部34が読み取った画像に基づいて、文書中のどこにマーキングがなされたかを特定する。マーキング数計測部31は、このようにして文書になされたマーキングの数を計測し、それぞれの文書・ページ毎に記録する。なお、ここでいう“マーキング”とは、文書に対して付与された“シオリ”、“付箋”、“アンダーライン”或いは“注記”や“コメント”などのように、ユーザが指示した内容を意味する情報である。よって、マーキングの数は、ユーザが過去に文書を閲覧していた際にその文書の内容にどれくらい注目したかという“閲覧の程度”を表している。表示頻度計測部32は、一定期間内に文書表示デバイス200に文書が表示された回数(つまり頻度)を、それぞれの文書・ページ毎に計測し、記録する。この表示頻度は、ユーザが過去にそれぞれの文書を何回閲覧したかという“閲覧の程度”を表している。このように、表示時間、マーキング数及び表示頻度は、いずれもユーザが文書を閲覧した程度を表しているので、「閲覧程度情報」と総称する。   When the user marks the document using the sensing device 30, the image input unit 34 reads an image near the marked portion. Based on the image read by the image input unit 34, the image processing unit 35 specifies where in the document the marking has been made. The marking number measuring unit 31 measures the number of markings made on the document in this way and records it for each document / page. Note that “marking” here means the content specified by the user, such as “siori”, “sticky note”, “underline” or “note” or “comment” given to the document. Information. Therefore, the number of markings represents the “degree of browsing” that indicates how much attention the user has had when browsing the document in the past. The display frequency measuring unit 32 measures and records the number of times (that is, the frequency) that a document is displayed on the document display device 200 within a certain period for each document / page. This display frequency represents the “degree of browsing” that indicates how many times the user has viewed each document in the past. Thus, the display time, the number of markings, and the display frequency all represent the degree to which the user has browsed the document, and are therefore collectively referred to as “browsing degree information”.

ホスト装置10は、通信部11と、デバイス管理部12と、文書管理部13と、判定部14と、表示時間管理部15と、マーキング数管理部16と、表示頻度管理部17と、記憶部18と、検索条件指定部19と、検索部20とを有している。通信部11は、センシングデバイス30の通信部36と同じ通信手順に従って無線通信を行う。この通信部11は、記憶部18に記憶されている文書データをセンシングデバイス30に送信したり、センシングデバイス30から送信されてくる閲覧程度情報を、表示時間管理部15とマーキング数管理部16と表示頻度管理部17とに供給する。   The host device 10 includes a communication unit 11, a device management unit 12, a document management unit 13, a determination unit 14, a display time management unit 15, a marking number management unit 16, a display frequency management unit 17, and a storage unit. 18, a search condition specifying unit 19, and a search unit 20. The communication unit 11 performs wireless communication according to the same communication procedure as that of the communication unit 36 of the sensing device 30. The communication unit 11 transmits the document data stored in the storage unit 18 to the sensing device 30 and the browsing degree information transmitted from the sensing device 30 with the display time management unit 15, the marking number management unit 16, and the like. This is supplied to the display frequency management unit 17.

デバイス管理部12は、文書表示デバイス200やセンシングデバイス30に割り当てられたデバイスIDと、各デバイスに提供した文書の文書IDとを関連づけて記憶しており、これらの登録や更新・変更などの管理機能を司る。文書管理部13は、全ての文書の文書ID・ページ番号を記憶しており、これらの登録や更新・変更などの管理機能を司る。表示時間管理部15は、各文書・各ページについての表示時間を記憶しており、その登録や更新・変更などの管理機能を司る。マーキング数管理部16は、各文書・各ページに対するマーキング数を記憶しており、その登録や更新・変更などの管理機能を司る。表示頻度管理部は、各ページ・各文書の表示頻度を記憶しており、その登録や更新・変更などの管理機能を司る。   The device management unit 12 stores a device ID assigned to the document display device 200 or the sensing device 30 in association with a document ID of a document provided to each device, and manages such registration, update, and change. Control functions. The document management unit 13 stores document IDs and page numbers of all documents, and manages management functions such as registration, update, and change. The display time management unit 15 stores the display time for each document and each page, and manages management functions such as registration, update, and change. The marking number management unit 16 stores the number of markings for each document and each page, and manages management functions such as registration, update, and change. The display frequency management unit stores the display frequency of each page and each document, and manages management functions such as registration, update, and change.

判定部14は、表示時間管理部15が記憶している表示時間と、マーキング数管理部16が記憶しているマーキング数と、表示頻度管理部17が記憶している表示頻度とに基づいて、それぞれの文書と、その文書に含まれるページの重要度(ランク値)を判定し、それを記憶する。図2に模式的に示すように、ランク値は、各文書のページ単位で判定される。さらにそのページ毎のランク値が合計され、それが、ランク付けされたページ数で除算される。その除算値(つまり平均値)が文書のランク値となる。   The determination unit 14 is based on the display time stored in the display time management unit 15, the marking number stored in the marking number management unit 16, and the display frequency stored in the display frequency management unit 17. The importance (rank value) of each document and the pages included in the document is determined and stored. As schematically shown in FIG. 2, the rank value is determined for each page of each document. Further, the rank values for each page are summed and divided by the number of ranked pages. The division value (that is, the average value) becomes the document rank value.

図1に戻り、検索条件指定部19は、例えば複数の操作子を備えたキーボードなどであり、ユーザによって指定された検索条件を受け付ける。検索部20は、指定された検索条件に合致する文書データを、記憶部18の記憶内容から検索する。そして、検索部20は、その検索結果を上記のランク値に応じた出力態様で出力する。具体的な出力手段としては、文書表示デバイス200や、ホスト装置10の図示せぬ表示装置などに検索結果を表示させるとか、図示せぬ印刷装置によって用紙に検索結果をプリントアウトするなどの手段がある。また、ここで用いる検索手法としては、周知のものを用いることができる。例えばデータファイル名、データ形式、データサイズ、作成・アクセス日時或いはキーワードなどをユーザが指定し、その指定した内容に合致する文書データを検索するといったものである。   Returning to FIG. 1, the search condition specifying unit 19 is, for example, a keyboard provided with a plurality of operators, and receives search conditions specified by the user. The search unit 20 searches the stored content of the storage unit 18 for document data that matches the specified search condition. And the search part 20 outputs the search result in the output mode according to said rank value. Specific output means include means for displaying the search results on the document display device 200, a display device (not shown) of the host device 10, or printing out the search results on paper by a printing device (not shown). is there. Moreover, as a search method used here, a well-known thing can be used. For example, the user designates a data file name, data format, data size, creation / access date / time, or keyword, and searches for document data that matches the designated content.

(2)ランク判定の方法
ここで、図3は、表示時間、マーキング数及び表示頻度に基づくランク付けの方法を説明する図である。この図3を参照しながら、判定部14がどのようにして各ページの重要度を判定するかという点について説明する。
(2) Rank Determination Method Here, FIG. 3 is a diagram for explaining a ranking method based on the display time, the number of markings, and the display frequency. With reference to FIG. 3, how the determination unit 14 determines the importance of each page will be described.

(2−1)表示時間:t
表示時間が長いほど、その文書の重要性は高いと考えられる。
図3には、横軸を表示時間tとし、縦軸をランク値Rとしたときの、表示時間tとランク値Rとの関係を表した関数Tが示されている。ランク値Rの最高値は100である。図3に示すように、はじめて文書が表示された時から所定の時間t1までは、ランク値Rは表示時間tにほぼ比例して高くなっていく。そして、表示時間が時間t1を超えてランク値Rが100に到達すると、それ以降はランク値Rが100のまま維持される。つまり、表示時間t1を超えると、ユーザがそれ以降いくら長い時間閲覧しても、ランク値Rは最高値のまま変わらない。ただし、例えば表示時間tが時間t1に到達した後に、一度も表示されなくなると、ランク値Rは、その非表示時間に比例するようにして低くなっていき、いすれはランク値が「0」となる。文書が表示されなくなったということは、ユーザの興味・関心が薄くなった、つまり重要度が低下したと考えてよいからである。
(2-1) Display time: t
The longer the display time, the more important the document is.
FIG. 3 shows a function T representing the relationship between the display time t and the rank value R when the horizontal axis is the display time t and the vertical axis is the rank value R. The highest rank value R is 100. As shown in FIG. 3, the rank value R increases substantially in proportion to the display time t from when the document is first displayed until a predetermined time t1. When the display time exceeds the time t1 and the rank value R reaches 100, the rank value R is maintained at 100 thereafter. That is, when the display time t1 is exceeded, the rank value R remains the highest value, no matter how long the user browses thereafter. However, for example, if the display time t reaches the time t1 and is no longer displayed, the rank value R decreases in proportion to the non-display time. It becomes. The fact that the document is no longer displayed is because it may be considered that the user's interest has decreased, that is, the importance has decreased.

(2−2)マーキング数:n
ユーザがマーキングを行った回数が多いほど、その文書の重要性は高いと考えられる。
図3には、横軸をマーキング数nとし、縦軸をランク値Rとしたときの、マーキング数nとランク値Rとの関係を表した関数Nが示されている。図3に示すように、所定の回数n1までは、ランク値Rはマーキング数nにほぼ比例して高くなっていく。そして、マーキング数がn1を超えてランク値Rが100に到達すると、それ以降はランク値Rが100のまま維持される。つまり、マーキング数nがn1を超えると、ユーザがそれ以降いくら多くのマーキングを行っても、ランク値Rは最高値のまま変わらない。なお、マーキング数nによるランク値Rは、表示時間tとランク値Rとの関係のように、いったん高くなるとそれ以降は低くなることはない。
(2-2) Number of markings: n
The more times a user has marked, the more important the document is.
FIG. 3 shows a function N representing the relationship between the marking number n and the rank value R, where the horizontal axis is the marking number n and the vertical axis is the rank value R. As shown in FIG. 3, up to a predetermined number n1, the rank value R increases in proportion to the marking number n. When the number of markings exceeds n1 and the rank value R reaches 100, the rank value R is maintained at 100 thereafter. That is, when the number of markings n exceeds n1, the rank value R remains the highest value no matter how many markings the user performs thereafter. Note that the rank value R based on the number of markings n does not decrease thereafter once it is increased as in the relationship between the display time t and the rank value R.

(2−3)表示頻度:f
文書が頻繁に表示されるほど、その重要性は高いと考えられる。
図3には、横軸を表示頻度fとし、縦軸をランク値Rとしたときの、表示頻度fとランク値Rとの関係を表した関数Fが示されている。図3に示すように、表示頻度fが所定の回数f1に到達するまでは、表示頻度fが増加してもランク値Rはほとんど高くならない。そして、表示頻度fが所定値f1を超えると、表示頻度fが増加するに連れてランク値Rも徐々に高くなっていく。ただし、このときの表示頻度fの増加度合いに対するランク値Rの増加度合いは非線形となる。より具体的には、表示頻度fが所定値f2に到達するまでの間においては、関数Fは下に凸となり、表示頻度fが所定値f2を超えると、関数Fは上に凸となる。
(2-3) Display frequency: f
The more frequently a document is displayed, the more important it is.
FIG. 3 shows a function F representing the relationship between the display frequency f and the rank value R when the horizontal axis is the display frequency f and the vertical axis is the rank value R. As shown in FIG. 3, the rank value R hardly increases even if the display frequency f increases until the display frequency f reaches the predetermined number of times f1. When the display frequency f exceeds the predetermined value f1, the rank value R gradually increases as the display frequency f increases. However, the increase degree of the rank value R with respect to the increase degree of the display frequency f at this time is non-linear. More specifically, until the display frequency f reaches the predetermined value f2, the function F is convex downward, and when the display frequency f exceeds the predetermined value f2, the function F is convex upward.

関数Fがこのような特性を採る理由は以下の通りである。
ユーザが最初に文書にアクセスしてそれを何回か表示している段階は、そのユーザがその文書を読み始めた段階、或いは、自分にとって有用な文書を探し始めた段階であると考えられる。よってこの時点では、その文書が必ずしもユーザにとって重要なものであるかどうかは判断できない。よって、表示頻度fが所定の回数f1に到達するまでは、ランク値Rはほとんど高くならない。そして、所定値f1を超えてさらに表示頻度fが増加すれば、その文書がユーザにとって重要なものであると確信することができる。よって、表示頻度fが所定値f2に到達するまでの間においては、関数Fを下に凸とし、ランク値Rを急速に高くしている。ただし、表示頻度fが所定値f2を超えた後も所定値の増加度合いをそのまま維持することは望ましくない。表示頻度fによるランク値Rを過大に評価しすぎるのは望ましくないからである。
The reason why the function F takes such characteristics is as follows.
The stage where the user first accesses the document and displays it several times is considered to be the stage when the user starts reading the document or starts searching for a document useful for him. Therefore, at this point, it cannot be determined whether the document is necessarily important to the user. Therefore, the rank value R hardly increases until the display frequency f reaches the predetermined number of times f1. If the display frequency f further exceeds the predetermined value f1, it can be confident that the document is important for the user. Therefore, until the display frequency f reaches the predetermined value f2, the function F is convex downward and the rank value R is rapidly increased. However, it is not desirable to maintain the degree of increase of the predetermined value as it is even after the display frequency f exceeds the predetermined value f2. This is because it is not desirable to overestimate the rank value R based on the display frequency f.

このような理由があるために、表示頻度fの増加度合いに対するランク値Rの増加度合いが図3のような非線形となっているのである。そして、表示頻度fがf3を超えてランク値Rが100に到達すると、それ以降はランク値Rが100のまま維持される。つまり、表示頻度fがf3を超えると、その文書がそれ以降何回表示されようとも、ランク値Rは最高値のまま変わらない。
なお、前述したように、表示頻度fは、ある一定の期間中における表示回数である。よって、図3には示していないが、あまり表示されなくなると、表示頻度fも減少し、これに応じてランク値Rも低下することになる。
For this reason, the increase degree of the rank value R with respect to the increase degree of the display frequency f is nonlinear as shown in FIG. When the display frequency f exceeds f3 and the rank value R reaches 100, the rank value R is maintained at 100 thereafter. That is, when the display frequency f exceeds f3, the rank value R remains the highest value no matter how many times the document is displayed thereafter.
As described above, the display frequency f is the number of display times during a certain period. Therefore, although not shown in FIG. 3, when the display is not so much, the display frequency f is also decreased, and the rank value R is also decreased accordingly.

(2−4)文書・ページに対するランク算出
次に、判定部14が、表示時間、マーキング数及び表示頻度のそれぞれに基づいて判定したランク値Rから、さらに各々の文書・ページのランク値を求める方法について説明する。
ここでは、
Rank値/t:表示時間によって付けられたRank値(0≦Rank値/t≦100)、
Rank値/n:マーキング数によって付けられたRank値(0≦Rank値/n≦100)、
Rank値/f:表示頻度によって付けられたRank値(0≦Rank値/f≦100)、
と定義する。このとき、各ページのランク値(Rp)は次式(i)によって求められる。ま
た、各文書のランク値(Dp)は次式(ii)によって求められる。
ページのランク値(Rp)=(Rank値/t+Rank値/n+Rank値/f)/3
・・・(i)
文書のランク値(Dp)=(ΣRp) /{Σ(ランク付けされたページ数)}・・(ii)
要するに、ページのランク値(Rp)は、表示時間情報、マーキング数情報及び表示頻度情報のそれぞれに基づいて判定されたランク値Rを所定の比率で按分することで求められる。また、文書のランク値(Dp)は、ページ毎のランク値(Rp)を合計して、それをランク付けされたページ数で除した値(平均値)を計算することによって求められる。
(2-4) Rank calculation for document / page Next, the determination unit 14 further determines the rank value of each document / page from the rank value R determined based on the display time, the number of markings, and the display frequency. A method will be described.
here,
Rank value / t: Rank value given by the display time (0 ≦ Rank value / t ≦ 100),
Rank value / n: Rank value given by the number of markings (0 ≦ Rank value / n ≦ 100),
Rank value / f: Rank value given by display frequency (0 ≦ Rank value / f ≦ 100),
It is defined as At this time, the rank value (Rp) of each page is obtained by the following equation (i). Further, the rank value (Dp) of each document is obtained by the following equation (ii).
Page rank value (Rp) = (Rank value / t + Rank value / n + Rank value / f) / 3
(I)
Document rank value (Dp) = (ΣRp) / {Σ (number of ranked pages)} (ii)
In short, the rank value (Rp) of a page is obtained by dividing the rank value R determined based on each of display time information, marking number information, and display frequency information at a predetermined ratio. Further, the rank value (Dp) of the document is obtained by calculating a value (average value) obtained by adding the rank values (Rp) for each page and dividing the sum by the number of ranked pages.

(3)実施形態の動作
次に実施形態の動作を説明する。
図4は、判定部14が実行する手順を示したフローチャートであり、図5は、上述した方法に従って判定部14が判定したランク値の一例を示す図である。
ランク値を判定(算出)する時期としては、例えば24時間毎などのように定期的な時期が予め決められている。図4において、判定部14は、ランク値を判定(算出)する時期が到来したと判断すると(ステップS1;Yes)、まず処理対象となる文書を1つ特定する。そして、この文書に含まれる各ページに対応する表示時間、マーキング数及び表示頻度をそれぞれ、表示時間管理部15、マーキング数管理部16及び表示頻度管理部17から読み出す(ステップS2)。
(3) Operation of Embodiment Next, the operation of the embodiment will be described.
FIG. 4 is a flowchart illustrating a procedure executed by the determination unit 14, and FIG. 5 is a diagram illustrating an example of rank values determined by the determination unit 14 according to the method described above.
As the time for determining (calculating) the rank value, a regular time is determined in advance, for example, every 24 hours. In FIG. 4, when the determination unit 14 determines that the time for determining (calculating) the rank value has arrived (step S <b>1; Yes), it first specifies one document to be processed. Then, the display time, marking number, and display frequency corresponding to each page included in the document are read from the display time management unit 15, marking number management unit 16, and display frequency management unit 17, respectively (step S2).

次に、判定部14は、読み出した表示時間、マーキング数及び表示頻度の各々に基づいて、前述した方法でページ単位のランク値を求めていく。つまり、判定部14は、図3に示した関数T、N、Fに従い、表示時間に応じた各ページのランク値を求め(ステップS3)、マーキング数に応じた各ページのランク値を求め(ステップS4)、表示頻度に応じた各ページのランク値を求める(ステップS5)。次に、判定部14は、表示時間、マーキング数及び表示頻度の各々に基づいて算出した各ページのランク値Rを式(i)のよ
うにして足し合わせ、さらに「3」で除算することで、ページ単位のランク値(Rp)を算出する(ステップS6)。次に、判定部14は、式(ii)に示したように、ページ単位の
ランク値(Rp)を合計し、それをランク付けされたページ数で除算して、文書のランク値(Dp)を求める(ステップS7)。
Next, the determination unit 14 obtains a rank value for each page by the above-described method based on the read display time, the number of markings, and the display frequency. That is, the determination unit 14 obtains the rank value of each page according to the display time according to the functions T, N, and F shown in FIG. 3 (step S3), and obtains the rank value of each page according to the number of markings ( In step S4), the rank value of each page corresponding to the display frequency is obtained (step S5). Next, the determination unit 14 adds the rank value R of each page calculated based on each of the display time, the number of markings, and the display frequency as shown in Expression (i), and further divides by “3”. Then, a rank value (Rp) for each page is calculated (step S6). Next, as shown in the formula (ii), the determination unit 14 sums up the rank value (Rp) for each page, divides it by the number of ranked pages, and calculates the rank value (Dp) of the document. Is obtained (step S7).

例えば図5では、文書A,・・・,文書Jまでの10個の文書を対象としている、文書A,・・・,文書Jには、それぞれ文書IDとして、「Doc1」,・・・,「Doc10」が割り当てられている。或る文書に含まれる各ページのランク値(Rp)が算出されることで、その文書中のページのランク順が特定される。例えば、文書Aの例で説明すると、ランク値(Rp)が高い順から、ページ番号「Page9」のページのランク値(Rp)が「90」、ページ番号「Page7」のページのランク値(Rp)が「60」、ページ番号「Page2」のページのランク値(Rp)が「40」・・・といった具合である。さらに、これらのページ毎のランク値(Rp)から、文書のランク値(Dp)が算出される。例えば文書Aの全体のランク値(Dp)は「20」となる。   For example, in FIG. 5, ten documents from document A,..., Document J are targeted. Document A,..., Document J have “Doc1”,. “Doc10” is assigned. By calculating the rank value (Rp) of each page included in a document, the rank order of the pages in the document is specified. For example, in the example of document A, the rank value (Rp) of the page with the page number “Page9” is “90” and the rank value (Rp) of the page with the page number “Page7” from the highest rank value (Rp). ) Is “60”, the rank value (Rp) of the page with the page number “Page2” is “40”, and so on. Further, the rank value (Dp) of the document is calculated from the rank value (Rp) for each page. For example, the overall rank value (Dp) of the document A is “20”.

判定部14は、以上のようなステップS2〜ステップS7の処理を全ての文書について繰り返し実行する(図4のステップS8;No)。そして、判定部14は、全ての文書についての処理を完了すると(ステップS8;Yes)、ランク値が大きい順からリスト化したランキングリストを生成し、これを記憶する(ステップS9)。   The determination unit 14 repeatedly executes the processes in steps S2 to S7 as described above for all documents (step S8 in FIG. 4; No). And the determination part 14 will complete | finish the process about all the documents (step S8; Yes), will generate the ranking list | wrist which made the list from the largest rank value, and memorize | stores this (step S9).

判定部14によって生成されたランキングリストは、“ページ別”と“文書別”に分かれている。図5に例示するように、ページ別ランキングリストPRには、「Doc1」の文書のページ番号「Page9」のランク値(Rp)が「90」で最高である。次いで、「Doc2」の文書のページ番号「Page3」のランク値(Rp)が「80」で続き、さらに、「Doc2」の文書のページ番号「Page8」のランク値(Rp)が「70」で続いている。また、文書別ランキングリストDRには、「Doc3」の文書のランク値(Dp)が「90」で最高である。次いで、「Doc2」の文書のランク値(Dp)が「70」で続き、さらに、「Doc10」の文書のランク値(Dp)が「30」で続いている。   The ranking list generated by the determination unit 14 is divided into “by page” and “by document”. As illustrated in FIG. 5, the rank value (Rp) of the page number “Page9” of the document “Doc1” is the highest in the page-based ranking list PR, “90”. Next, the rank value (Rp) of the page number “Page3” of the document “Doc2” is “80”, and the rank value (Rp) of the page number “Page8” of the document “Doc2” is “70”. in the process of. In the document ranking list DR, the rank value (Dp) of the document “Doc3” is “90”, which is the highest. Next, the rank value (Dp) of the document “Doc2” continues at “70”, and the rank value (Dp) of the document “Doc10” continues at “30”.

検索部20は、検索条件指定部19によって検索条件が指定されると、記憶部18に記憶された複数の文書データの中から、検索条件に合致する文書データを検索する。そして、その検索結果を表示したり、プリントアウトする際には、判定部14によって生成されたランキングリストDR,PRの内容に応じた出力態様で出力する。   When the search condition is specified by the search condition specifying unit 19, the search unit 20 searches for document data that matches the search condition from among a plurality of document data stored in the storage unit 18. Then, when the search result is displayed or printed out, it is output in an output mode corresponding to the contents of the ranking lists DR and PR generated by the determination unit 14.

例えば、図6に示すように、検索結果として、「Doc1」の文書のページ番号「Page9」と、「Doc2」の文書のページ番号「Page1」、「Page8」が抽出された場合を想定する。検索部20が、このときの検索結果を表示する際には、ページ別ランキングリストPRに従って、ランク値(Rp)が最も高い「Doc1」のページ番号「Page9」のページを最も目立つ位置(ここでは最上部)に表示し、その下に「Doc2」のページ番号「Page8」のページを表示し、さらにその下に「Doc2」の文書のページ番号「Page1」のページを表示する。つまり、検索結果に含まれるページを、そのランク値(Rp)が高い順に優先的に出力するのである。   For example, as shown in FIG. 6, it is assumed that the page numbers “Page9” of the document “Doc1” and the page numbers “Page1” and “Page8” of the document “Doc2” are extracted as search results. When the search unit 20 displays the search result at this time, the page with the page number “Page9” of “Doc1” having the highest rank value (Rp) according to the page-specific ranking list PR (here, the most prominent position (here, The page number “Page8” of “Doc2” is displayed below it, and the page of the page number “Page1” of the document “Doc2” is further displayed below it. That is, the pages included in the search result are output preferentially in descending order of the rank value (Rp).

また、例えば図7に示すように、検索結果として「Doc2」の文書と、「Doc3」の文書が抽出された場合を想定する。検索部20が、このときの検索結果を表示する際には、文書別ランキングリストDRに従って、ランク値(Dp)が最も高い「Doc3」の文書を最も目立つ位置(ここでは最上部)に表示し、その下に「Doc2」の文書を表示する。つまり、検索結果に含まれる文書を、そのランク値(Dp)が高い順に優先的に出力するのである。
ユーザは、このような検索結果を見れば、自分にとってどの文書・ページが重要かを一目で理解することができる。
For example, as illustrated in FIG. 7, it is assumed that a document “Doc2” and a document “Doc3” are extracted as search results. When the search unit 20 displays the search result at this time, the document of “Doc3” having the highest rank value (Dp) is displayed at the most prominent position (here, the top) according to the document ranking list DR. The document “Doc2” is displayed below the document. That is, the documents included in the search result are output preferentially in descending order of the rank value (Dp).
The user can understand at a glance which document / page is important to him / her by looking at such a search result.

上述した実施形態によれば、文書に対する過去の閲覧の程度に基づいて、その文書の重要度を判定する。そして、複数の文書の中から指定された条件に合致する文書を検索して出力する場合には、判定された重要度に応じた出力態様で出力する。よって、ユーザにとって有用なコンテンツが容易に理解できるような形で検索結果を提示することができる。また、ユーザが文書を閲覧するという行為によって自動的に各文書の重要度が判定されるので、ユーザに対して特別な作業や操作を負わせることがないという利点もある。   According to the above-described embodiment, the importance level of a document is determined based on the degree of past browsing for the document. Then, when searching for and outputting a document that matches a specified condition from a plurality of documents, the document is output in an output mode corresponding to the determined importance. Therefore, it is possible to present the search result in such a way that the content useful for the user can be easily understood. In addition, since the importance of each document is automatically determined by the user browsing the document, there is an advantage that the user is not burdened with special work or operation.

(4)変形例
(4−1)変形例1
上述した実施形態を次のように変形してもよい。
上記実施形態では、文書の表示時間、マーキング数及び表示頻度という、複数種類の閲覧程度情報に基づいてランク値を求めていた。しかし、この方法に限らず、これらの閲覧程度情報のうちいずれか1つ或いは2つに基づいてランク値を求めてもよいし、さらに多くの閲覧程度情報に基づいてランク値を求めてよい。
また、式(i)に示したように、複数種類の閲覧程度情報を均等に考慮する(式(i)
では3で除算することで均等に考慮していた)のではなく、それぞれの閲覧程度情報に対して重み付けを行ってもよい。例えば表示時間には0.8を乗じ、表示頻度には0.15を乗じ、マーキング数には0.05を乗じるというように、表示時間、表示頻度及びマーキング数をそれぞれ8:1.5:0.5という比率で考慮するようにしてもよい。もちろん、どの閲覧程度情報をどのくらい重視するかはユーザが任意に決めてよい。要するに、判定部14は、複数種類の閲覧程度情報を所定の比率で按分することでランク値を算出することができる。
(4) Modification (4-1) Modification 1
The above-described embodiment may be modified as follows.
In the above embodiment, the rank value is obtained based on a plurality of types of browsing degree information such as the document display time, the number of markings, and the display frequency. However, the present invention is not limited to this method, and the rank value may be obtained based on any one or two of the browsing degree information, or the rank value may be obtained based on more browsing degree information.
In addition, as shown in equation (i), multiple types of browsing degree information are equally considered (equation (i)
In this case, the viewing degree information may be weighted instead of being divided equally by 3). For example, the display time, the display frequency, and the number of markings are respectively set to 8: 1.5: the display time is multiplied by 0.8, the display frequency is multiplied by 0.15, and the number of markings is multiplied by 0.05. You may make it consider in the ratio of 0.5. Of course, the user may arbitrarily decide how much priority is given to which browsing degree information. In short, the determination unit 14 can calculate the rank value by distributing the plurality of types of browsing degree information at a predetermined ratio.

(4―2)変形例2
文書の表示時間、マーキング数及び表示頻度という複数種類の閲覧程度情報のうち、ランク付けの対象期間の長短に応じて、異なる種類の閲覧程度情報に基づいてランクを判定するようにしてもよい。
その理由は、ユーザが文書を閲覧する場合には、次のような傾向があるためである。
ユーザが或る一定期間にのみ頻繁に閲覧した文章は、そのユーザにとって、長期的に重要な文書とは限らない。よって、“表示頻度”という閲覧程度情報を必要以上に重視してしまうと、あまり重要でもない文書に高いランク値を与えてしまう虞がある。そこで、所定の期間よりも短い期間においては、“表示時間”及び“マーキング数”のみをランク判定の基準とし、所定の期間よりも長い期間においては、“表示時間”及び“マーキング数”に“表示頻度”を加えて、これらをランク判定の基準とする。この場合、判定部14は、図8に示すような短期用の判定テーブルと、図9に示すような長期用の判定テーブルとを、重要度の判定対象期間に応じて使い分ける。例えば、短期用の判定テーブルにおいては、画像ID「Doc1」の文書のPage1の表示時間は「1時間」であり、マーキング数は「5個」が記述されている。このように、表示頻度を考慮せずに、表示時間とマーキング数のみを考慮した場合には、判定基準となる閲覧程度情報が少ないので、判定に要する時間も短くて済むという利点がある。
一方、長期用の判定テーブルにおいては、画像ID「Doc1」の文書のPage1の表示時間は「1時間」であり、マーキング数は「5個」であり、表示頻度は「1回」である。このように、表示時間、マーキング数及び表示頻度の全てを考慮した場合には、判定の基準となる閲覧程度情報が多いため、ユーザの閲覧行動をより正確に反映したランク判定が可能となる。
(4-2) Modification 2
Of a plurality of types of browsing degree information such as document display time, number of markings, and display frequency, ranks may be determined based on different types of browsing degree information according to the length of the ranking target period.
The reason is that when a user views a document, there is a tendency as follows.
A sentence frequently viewed by a user only for a certain period is not necessarily a document that is important for the user in the long term. Therefore, if the browsing degree information “display frequency” is emphasized more than necessary, there is a possibility that a high rank value is given to a document that is not very important. Therefore, in the period shorter than the predetermined period, only “display time” and “number of markings” are used as criteria for rank determination, and in the period longer than the predetermined period, “display time” and “number of markings” are set to “ "Display frequency" is added, and these are used as criteria for rank determination. In this case, the determination unit 14 uses a short-term determination table as shown in FIG. 8 and a long-term determination table as shown in FIG. 9 according to the importance determination target period. For example, in the short-term determination table, the display time of Page 1 of the document with the image ID “Doc1” is “1 hour”, and the number of markings is “5”. As described above, when only the display time and the number of markings are taken into consideration without considering the display frequency, there is an advantage that the time required for the determination can be shortened because the browsing degree information as a determination reference is small.
On the other hand, in the long-term determination table, the display time of Page 1 of the document with the image ID “Doc1” is “1 hour”, the number of markings is “5”, and the display frequency is “1 time”. As described above, when all of the display time, the number of markings, and the display frequency are taken into account, since there is a large amount of browsing level information that is a criterion for determination, rank determination that more accurately reflects the browsing behavior of the user is possible.

(4−3)変形例3
実施形態では、文書を閲覧するユーザが単数であるか複数であるかについては特に言及しなかったが、ユーザが複数である場合には、ユーザ毎にランク判定を行うことが望ましい。どの文書が重要かは、それぞれのユーザによって異なるからである。この場合、例えばセンシングデバイス30に、指紋認証などでユーザを認証する手段を備えておき、この手段によって文書を閲覧するユーザを特定する。そして、表示時間管理部15、マーキング数管理部16及び表示頻度管理部17は、閲覧程度情報を、その文書を閲覧するユーザに割り当てられたユーザ識別情報と対応付けて記憶しておく。そして、判定部14は、文書を閲覧するユーザが特定されている場合には、そのユーザのユーザ識別情報に対応付けられて記憶されている閲覧程度情報に基づき、各々の文書・ページのランクを判定する。
(4-3) Modification 3
In the embodiment, no particular mention is made as to whether the number of users browsing the document is one or more. However, when there are a plurality of users, it is desirable to perform rank determination for each user. This is because which document is important depends on each user. In this case, for example, the sensing device 30 is provided with means for authenticating the user by fingerprint authentication or the like, and the user who browses the document is specified by this means. Then, the display time management unit 15, the marking number management unit 16, and the display frequency management unit 17 store the browsing degree information in association with the user identification information assigned to the user browsing the document. And when the user who browses a document is specified, the determination part 14 ranks each document and page based on the browsing degree information memorize | stored matched with the user identification information of the user. judge.

(4−4)変形例4
本発明は、図1のような複数の装置からなるシステムに限らず、例えば単体のパーソナルコンピュータに適用することもできるし、また、例えばPDA(Personal Digital Assistants)のようなタブレット型のコンピュータや、電子ペーパーなどと呼ばれるような可搬性に富む単体の表示装置に適用することも可能である。また、上述した図4に示すような手順が記述されたプログラムは、磁気テープ、磁気ディスク、フロッピー(登録商標)ディスク、光記録媒体、光磁気記録媒体、CD(Compact Disk)、DVD(Digital Versatile Disk)、RAMなどの記録媒体に記録した状態で提供し得る。即ち、本発明をプログラムとして実現することもできる。
(4-4) Modification 4
The present invention is not limited to a system composed of a plurality of devices as shown in FIG. 1, but can be applied to, for example, a single personal computer, a tablet computer such as a PDA (Personal Digital Assistants), The present invention can also be applied to a single display device having high portability such as electronic paper. The program in which the procedure as shown in FIG. 4 is described is a magnetic tape, a magnetic disk, a floppy (registered trademark) disk, an optical recording medium, a magneto-optical recording medium, a CD (Compact Disk), a DVD (Digital Versatile). Disk) or a recording medium such as a RAM. That is, the present invention can be realized as a program.

本発明の実施形態に係る表示検索システムの構成を示した図である。It is the figure which showed the structure of the display search system which concerns on embodiment of this invention. 同実施形態においてなされるランク付けの様子を模式的に示した図である。It is the figure which showed typically the mode of ranking made in the same embodiment. 表示時間、マーキング数及び表示頻度に基づくランク付けの方法を説明する図である。It is a figure explaining the method of ranking based on display time, the number of markings, and display frequency. 判定部が実行する手順を示したフローチャートである。It is the flowchart which showed the procedure which a determination part performs. 判定部が判定したランク値の一例を示す図である。It is a figure which shows an example of the rank value which the determination part determined. 検索結果を出力する際の動作を説明する図である。It is a figure explaining the operation | movement at the time of outputting a search result. 検索結果を出力する際の動作を説明する図である。It is a figure explaining the operation | movement at the time of outputting a search result. 変形例に係るランク付けの方法を説明する図である。It is a figure explaining the ranking method which concerns on a modification. 変形例に係るランク付けの方法を説明する図である。It is a figure explaining the ranking method which concerns on a modification.

符号の説明Explanation of symbols

1…表示検索システム、10…ホスト装置、14…判定部、15…表示時間管理部、16…マーキング数管理部、17…表示頻度管理部、18…記憶部、19…検索条件指定部、20…検索部、200…文書表示デバイス、21…表示部、22…表示時間計測部、30…センシングデバイス、31…マーキング数計測部、32…表示頻度計測部。 DESCRIPTION OF SYMBOLS 1 ... Display search system, 10 ... Host apparatus, 14 ... Determination part, 15 ... Display time management part, 16 ... Marking number management part, 17 ... Display frequency management part, 18 ... Memory | storage part, 19 ... Search condition designation part, 20 DESCRIPTION OF SYMBOLS ... Search part, 200 ... Document display device, 21 ... Display part, 22 ... Display time measurement part, 30 ... Sensing device, 31 ... Marking number measurement part, 32 ... Display frequency measurement part.

Claims (8)

コンテンツデータに基づいて表示手段に表示された画像が閲覧された程度を計測し、その閲覧の程度を表す閲覧程度情報を生成する計測手段と、
前記計測手段によって生成された閲覧程度情報に基づいて、前記コンテンツデータの重要度を判定する判定手段と、
複数のコンテンツデータの中から、指定された検索条件に合致するコンテンツデータを検索し、その検索結果を、前記判定手段により各コンテンツデータについて判定された重要度に応じた出力態様で出力する検索手段と
を備えることを特徴とする検索装置。
Measuring means for measuring the degree of browsing of the image displayed on the display means based on the content data, and generating browsing degree information representing the degree of browsing;
Determination means for determining the importance of the content data based on the browsing degree information generated by the measurement means;
Search means for searching for content data that matches a specified search condition from among a plurality of content data, and outputting the search result in an output mode corresponding to the importance determined for each content data by the determination means A search apparatus comprising: and.
前記計測手段は、前記画像が前記表示手段に表示された時間、前記画像が前記表示手段に表示された頻度、又は、前記画像に対してユーザが付与した情報の個数のうち、少なくともいずれか1つを計測して、その計測値を前記閲覧程度情報とする
ことを特徴とする請求項1に記載の検索装置。
The measuring means is at least one of the time when the image is displayed on the display means, the frequency at which the image is displayed on the display means, or the number of information given to the image by the user. The search device according to claim 1, wherein the search value is used as the browsing degree information.
前記計測手段は、前記画像が前記表示手段に表示された頻度を計測して、その計測値を前記閲覧程度情報とし、
前記判定手段は、前記頻度が多くなるに従って前記重要度が高くなる関数に対し、前記計測手段によって生成された前記閲覧程度情報を入力して、前記コンテンツデータの重要度を求め、
前記関数は、前記重要度を縦軸として前記頻度を横軸とした場合に、前記頻度が所定値に到達するまでの間においては下に凸となるような関数となり、前記頻度が前記所定値を超えると上に凸となるような関数である
ことを特徴とする請求項1に記載の検索装置。
The measuring means measures the frequency at which the image is displayed on the display means, and uses the measured value as the browsing degree information,
The determination means inputs the browsing degree information generated by the measurement means for a function whose importance increases as the frequency increases, and obtains the importance of the content data,
The function is a function that protrudes downward until the frequency reaches a predetermined value when the importance is the vertical axis and the frequency is the horizontal axis, and the frequency is the predetermined value. The search device according to claim 1, wherein the search function is a function that protrudes upward when exceeding.
前記計測手段は、複数種類の前記閲覧程度情報を生成し、
前記判定手段は、前記計測手段によって生成された複数種類の閲覧程度情報がそれぞれ表す閲覧の程度を所定の比率で按分して前記コンテンツデータの重要度を判定する
ことを特徴とする請求項1に記載の検索装置。
The measuring means generates a plurality of types of browsing degree information,
2. The determination unit according to claim 1, wherein the determination unit determines the importance level of the content data by distributing the browsing levels represented by the plurality of types of browsing level information generated by the measuring unit at a predetermined ratio. The described search device.
前記計測手段は、複数種類の前記閲覧程度情報を生成し、
前記判定手段は、前記複数種類の閲覧程度情報のうち、前記重要度を判定する対象期間の長短に応じた種類の閲覧程度情報に基づいて、前記コンテンツデータの重要度を判定する
ことを特徴とする請求項1に記載の検索装置。
The measuring means generates a plurality of types of browsing degree information,
The determination means determines the importance level of the content data based on the browsing level information of a type corresponding to the length of a target period for determining the importance level among the multiple types of browsing level information. The search device according to claim 1.
前記コンテンツデータは、複数のページデータからなる文書データであり、
前記計測手段は、前記表示手段に表示されたページが閲覧された程度を計測して、その閲覧の程度を表す閲覧程度情報を生成し、
前記判定手段は、前記計測手段によって生成された閲覧程度情報に基づき、各々の前記文書に含まれるページ単位の重要度、及び、各々の前記文書単位の重要度を判定し、
前記検索手段は、記憶手段に記憶された複数の文書データの中から、指定された検索条件に合致する文書データ又はページデータを検索し、その検索結果を、前記判定手段により各文書データ及び各ページデータについて判定された重要度に応じた出力態様で出力する
ことを特徴とする請求項1に記載の検索装置。
The content data is document data composed of a plurality of page data,
The measuring means measures the degree of browsing of the page displayed on the display means, and generates browsing degree information representing the degree of browsing,
The determination unit determines the importance level of each page included in each document and the importance level of each document unit based on the browsing degree information generated by the measurement unit,
The retrieval unit retrieves document data or page data that matches a designated retrieval condition from a plurality of document data stored in the storage unit, and the retrieval unit obtains each document data and each page data by the determination unit. The search device according to claim 1, wherein the output is performed in an output mode corresponding to the degree of importance determined for the page data.
前記表示手段に表示される画像を閲覧するユーザを特定するユーザ特定手段を備え、
前記計測手段は、前記表示手段によって表示された画像が閲覧された程度を表す閲覧程度情報を、当該画像を閲覧するユーザとして前記ユーザ特定手段によって特定されたユーザに割り当てられたユーザ識別情報と対応付けて記憶し、
前記判定手段は、各々のユーザ識別情報に対応付けられて前記計測手段により記憶されている閲覧程度情報に基づき、前記コンテンツデータの重要度を判定する
ことを特徴とする請求項1に記載の検索装置。
Comprising user specifying means for specifying a user who browses an image displayed on the display means;
The measuring means corresponds to browsing degree information indicating the degree to which the image displayed by the display means is browsed, with user identification information assigned to the user specified by the user specifying means as a user who browses the image. Remember,
2. The search according to claim 1, wherein the determination unit determines the importance of the content data based on browsing degree information stored by the measurement unit in association with each user identification information. 3. apparatus.
コンピュータに、
コンテンツデータに基づいて表示手段に表示された画像が閲覧された程度を表す閲覧程度情報に基づいて、前記コンテンツデータの重要度を判定する判定機能と、
複数のコンテンツデータの中から、指定された検索条件に合致するコンテンツデータを検索し、その検索結果を、前記判定機能により各コンテンツデータについて判定された重要度に応じた出力態様で出力する検索機能と
を実現させるためのプログラム。
On the computer,
A determination function for determining the importance of the content data based on browsing degree information indicating the degree to which the image displayed on the display means is browsed based on the content data;
A search function for searching content data that matches a specified search condition from a plurality of content data, and outputting the search result in an output mode corresponding to the importance determined for each content data by the determination function Program to realize and.
JP2006229482A 2006-08-25 2006-08-25 Retrieval device and program Pending JP2008052579A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006229482A JP2008052579A (en) 2006-08-25 2006-08-25 Retrieval device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006229482A JP2008052579A (en) 2006-08-25 2006-08-25 Retrieval device and program

Publications (1)

Publication Number Publication Date
JP2008052579A true JP2008052579A (en) 2008-03-06

Family

ID=39236565

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006229482A Pending JP2008052579A (en) 2006-08-25 2006-08-25 Retrieval device and program

Country Status (1)

Country Link
JP (1) JP2008052579A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010176354A (en) * 2009-01-29 2010-08-12 Fuji Xerox Co Ltd Information processor and information processing program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010176354A (en) * 2009-01-29 2010-08-12 Fuji Xerox Co Ltd Information processor and information processing program
US8527511B2 (en) 2009-01-29 2013-09-03 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and computer-readable medium for setting a retrieval target

Similar Documents

Publication Publication Date Title
JP2960340B2 (en) Data search method and device
US20070150456A1 (en) Search system and method
US7769771B2 (en) Searching a document using relevance feedback
US8612428B2 (en) Image ranking based on popularity of associated metadata
US9665529B1 (en) Relative progress and event indicators
US10229655B2 (en) Contextual zoom
US20130254189A1 (en) Using Anchor Text to Provide Context
US20070150802A1 (en) Document annotation and interface
JP2000227915A (en) Copying system and its method
JP2006344010A (en) Document retrieval device
JP2008257444A (en) Similar file management device, method therefor and program therefor
US9223897B1 (en) Adjusting ranking of search results based on utility
US20170344572A1 (en) Personalized content-based recommendation system with behavior-based learning
US20120030135A1 (en) Literary work of authorship having an embedded recommendation
JPWO2013021696A1 (en) Information retrieval system, method, and program
CN108334588A (en) A kind of user tag construction method and device
JP7290391B2 (en) Information processing device and program
TWI396983B (en) Named entity marking apparatus, named entity marking method, and computer program product thereof
US8140525B2 (en) Information processing apparatus, information processing method and computer readable information recording medium
US8301637B2 (en) File search system, file search device and file search method
JP7230439B2 (en) Information processing device and program
KR20160100316A (en) Entity-based summarization for electronic books
JP2008052579A (en) Retrieval device and program
JP2009294723A (en) Search result display method, search device and computer program
JP2012027841A (en) Retrieval program, retrieval device, retrieval system, retrieval method, and recording medium