JP2006268789A - Apparatus and method for document retrieval - Google Patents

Apparatus and method for document retrieval Download PDF

Info

Publication number
JP2006268789A
JP2006268789A JP2005090054A JP2005090054A JP2006268789A JP 2006268789 A JP2006268789 A JP 2006268789A JP 2005090054 A JP2005090054 A JP 2005090054A JP 2005090054 A JP2005090054 A JP 2005090054A JP 2006268789 A JP2006268789 A JP 2006268789A
Authority
JP
Japan
Prior art keywords
search
intention
document
history data
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005090054A
Other languages
Japanese (ja)
Inventor
Hiroyuki Kato
弘之樹 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005090054A priority Critical patent/JP2006268789A/en
Publication of JP2006268789A publication Critical patent/JP2006268789A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To present a result of retrieval, with high quality by reflecting retriever's intention of retrieval. <P>SOLUTION: A history pattern conversion section 105 converts a retrieval intention inputted from a retrieval intention input section 102 by a retriever into a history pattern. A retrieval section 103 calculates a retrieval score of each document based on a retrieval query inputted from a retrieval query input section 101 and further corrects the retrieval score based on the history pattern. A ranking section 104 presents, to the retriever, a result of retrieval based on the corrected retrieval score. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、電子検索技術に関する。   The present invention relates to an electronic search technique.

電子的に蓄積された文書を対象に検索するとき、検索内容や操作内容の履歴を保持して後で利用する技術がある。例えば、特許文献1は、検索履歴から複合語用例データを抽出して複合語データベースを生成することを提案している。また、特許文献2は検索キーワードや参照文書を日時とともに保持し、ある時間帯でよく使用されたキーワードや参照文書を記録することを提案している。   There is a technique for storing a history of search contents and operation contents to be used later when searching for electronically stored documents. For example, Patent Document 1 proposes to extract compound word example data from a search history to generate a compound word database. Further, Patent Document 2 proposes to hold search keywords and reference documents together with the date and time, and to record keywords and reference documents that are frequently used in a certain time zone.

履歴を活用する技術は数多くあるが、従来は日時を数値としてそのまま扱うものに止まっていた。   There are many technologies that use the history, but in the past only the date and time were treated as numerical values.

ところで、ユーザが文書を参照するときはユーザが意図を持って行なうので、このような意図を切り口にすれば、検索結果の質を向上させることが期待される。本発明者は、検索意図が多くの場合に検索履歴に関連があるという知見に至り、本発明をなすに至った。すなわち、新しい情報を取得したいという意図がある場合には、検索者が少なくとも思い出せる範囲の過去に文書を検索ないし参照していないという履歴パターンが対応する。また、所定の情報を思い出したいという意図があるが場合には、検索者が過去に文書を検索ないし参照したという履歴パターンが対応する。自分の履歴パターンのみでなく他人の履歴パターンが検索意図に関連することもある。例えば他人は知っているが自分は知らない情報を取得したいという意図は、他人が過去に検索ないし参照しているが自分は過去に検索ないし参照していないという履歴パターンに対応する。   By the way, when a user refers to a document, the user has an intention. Therefore, it is expected that the quality of search results will be improved if such an intention is used. The present inventor has come to the knowledge that there are many search intentions related to the search history, and has made the present invention. That is, when there is an intention to acquire new information, a history pattern in which a searcher has not searched or referred to a document at least in a range that can be remembered corresponds. When there is an intention to remember predetermined information, a history pattern that a searcher has searched or referred to a document in the past corresponds. In addition to your own history pattern, other people's history patterns may be relevant to your search intent. For example, the intention to acquire information that others know but does not know corresponds to a history pattern that others have searched or referred to in the past but have not searched or referenced in the past.

本発明は、参照履歴の日時を数値データとしてそのまま扱うのみではなく、その履歴パターンと検索意図の対応づけを行い、もって意図を考慮した検索を実現しようとするものである。
特開2002−251402公報 特開2003−173352公報
The present invention not only treats the date and time of the reference history as numeric data, but also associates the history pattern with the search intention to achieve a search in consideration of the intention.
JP 2002-251402 A JP 2003-173352 A

本発明は、以上の事情を考慮してなされたものであり、検索意図を反映した検索を行なう技術を提供することを目的としている。   The present invention has been made in consideration of the above circumstances, and an object thereof is to provide a technique for performing a search reflecting a search intention.

本発明によれば、上述の目的を達成するために、特許請求の範囲に記載のとおりの構成を採用している。ここでは、発明を詳細に説明するのに先だって、特許請求の範囲の記載について補充的に説明を行なっておく。   According to the present invention, in order to achieve the above-mentioned object, the configuration as described in the claims is adopted. Here, prior to describing the invention in detail, supplementary explanations of the claims will be given.

すなわち、本発明の一側面によれば、上述の目的を達成するために、文書検索装置に:検索条件を入力する検索条件入力手段と;検索意図を入力する検索意図入力手段と;上記検索意図入力手段により入力された検索意図を検索履歴データに変換する検索履歴データ生成手段と;上記検索条件入力手段により入力された検索条件および上記検索履歴データ生成手段により生成された検索履歴データにしたがって文書を検索する文書検索手段とを設けるようにしている。   That is, according to one aspect of the present invention, in order to achieve the above-described object, the document search apparatus includes: a search condition input unit that inputs a search condition; a search intention input unit that inputs a search intention; Search history data generating means for converting the search intention input by the input means into search history data; a document according to the search conditions input by the search condition input means and the search history data generated by the search history data generating means And a document search means for searching.

この構成においては、検索意図を指定して質の高い検索、検索結果の質の高い提示を行なうことができる。   In this configuration, it is possible to designate a search intention and perform high-quality search and high-quality search result presentation.

検索条件は、キーワードまたはキーワード列でもよいし、種々の文書属性を指定しても良いし、また自然文や文書自体を検索条件としても良い。自然文は例えばキーワードに分解して当該キーワードを直接的な検索条件とする。文書自体を検索条件とする場合には例えばその文書の単語ベクトルを用いることができる。   The search condition may be a keyword or a keyword string, various document attributes may be designated, or a natural sentence or the document itself may be used as the search condition. Natural sentences are decomposed into keywords, for example, and the keywords are used as direct search conditions. When the document itself is used as a search condition, for example, a word vector of the document can be used.

この構成において、上記文書検索手段は、上記検索条件にしたがって文書を検索し上記検索履歴データにしたがって検索した文書の絞込みを行なうものでもよい。   In this configuration, the document search means may search for documents according to the search condition and narrow down the documents searched according to the search history data.

例えば、キーワードの有無で検索し、その検索結果中、所望の履歴データのものに絞り込む。   For example, a search is performed based on the presence or absence of a keyword, and the search result is narrowed down to that of desired history data.

また、上記検索手段は、上記検索条件にしたがってスコア付きで文書を検索し、上記検索履歴データにしたがって上記スコアを調整するようなものでもよい。スコアは例えば単語ベクトルを用いて取得できる。検索履歴データによるスコアの調整は、検索意図に依存するが、例えば、思い出したい情報を検索したいという意図の場合には、現時点に近い過去に検索した文書ほど大きなスコアになるようにする。   Further, the search means may search for a document with a score according to the search condition and adjust the score according to the search history data. The score can be acquired using, for example, a word vector. The adjustment of the score based on the search history data depends on the search intention. For example, in the case of the intention of searching for information to be remembered, a document searched in the past close to the current time is set to have a higher score.

また上記検索手段は、上記件条件にしたがってスコアを伴うことなく文書を検索し、当該検索された文書のスコアを上記検索履歴データにしたがって生成してもよい。上述のように思い出したい情報を検索したいという意図の場合には、検索時が現時点に近いほど大きなスコアとなるように新たにスコア付けを行なう。   Further, the search means may search for a document without a score according to the above-mentioned condition, and generate a score for the searched document according to the search history data. As described above, when the intention is to search for information to be remembered, a new scoring is performed so that the closer the search time is to the present time, the higher the score.

上記検索意図は、これに限定されないが、知らない情報を新たに発見したいという意図、および見たことのある情報を思い出したいという意図を含む。   The search intention includes, but is not limited to, an intention to newly discover unknown information and an intention to recall information that has been seen.

また、検索意図は、所属組織のなかで自分だけが知らない情報を得たいという意図、および、所属組織の中で自分だけが活用している情報を得たいという意図を含んでもよい。   In addition, the search intention may include an intention to obtain information that only the user does not know in the affiliated organization, and an intention to obtain information that is utilized only by the user in the affiliated organization.

また、検索意図は、所属組織を含むより大きな組織において一般に有用であるが上記所属組織中では自分だけが活用している情報を得たいという意図、上記大きな組織において一般に有用であるが上記組織内においては知られていない情報を得たいという意図、および上記所属組織では有用だが上記大きな組織では一般に知られていない情報を得たいという意図を含んでもよい。   Search intent is generally useful in larger organizations including the affiliated organization, but in the affiliated organization, it is generally useful in the above-mentioned large organization. May include an intention to obtain information that is unknown to the public, and an intention to obtain information that is useful to the organization to which the user belongs but is not generally known to the large organization.

なお、本発明は装置またはシステムとして実現できるのみでなく、方法としても実現可能である。また、そのような発明の一部をソフトウェアとして構成することができることはもちろんである。またそのようなソフトウェアをコンピュータに実行させるために用いるソフトウェア製品も本発明の技術的な範囲に含まれることも当然である。   The present invention can be realized not only as an apparatus or a system but also as a method. Of course, a part of the invention can be configured as software. Of course, a software product used to cause a computer to execute such software is also included in the technical scope of the present invention.

本発明の上述の側面および他の側面は特許請求の範囲に記載され以下実施例を用いて詳述される。   The above and other aspects of the invention are set forth in the appended claims and are described in detail below using examples.

本発明によれば、検索意図を反映して高品質に検索結果を取得できる。   According to the present invention, a search result can be acquired with high quality reflecting the search intention.

以下、本発明の実施例について説明する。   Examples of the present invention will be described below.

図1は、本発明の実施例の文書検索システム100を示している。この実施例では、コンピュータ200にプログラム201をインストールして文書検索システム100を実現している。以下の機能ブロックはコンピュータ200のハードウェア資源およびソフトウェア資源を協同させて実現される。なお、図では1つのコンピュータ200で文書検索システム100を構築しているが、クライアントサーバシステムで文書検索システム100を構築しても良い。   FIG. 1 shows a document search system 100 according to an embodiment of the present invention. In this embodiment, the document search system 100 is realized by installing a program 201 in a computer 200. The following functional blocks are realized by cooperating the hardware resources and software resources of the computer 200. In the figure, the document search system 100 is constructed by one computer 200, but the document search system 100 may be constructed by a client server system.

図1において、文書検索システム100は、検索クエリ入力部101、検索意図入力部102、検索部103、ランキング部104、履歴パターン変換部105、文書データベース107、参照履歴データベース108、ユーザ情報データベース109等を含んで構成されている。   In FIG. 1, a document search system 100 includes a search query input unit 101, a search intention input unit 102, a search unit 103, a ranking unit 104, a history pattern conversion unit 105, a document database 107, a reference history database 108, a user information database 109, and the like. It is comprised including.

検索クエリ入力部101は、例えば1または複数のキーワードを所定のユーザインタフェースを用いてユーザから受け付けるものである。キーワードに換えて自然文や文書を入力または指定しても良い。検索意図入力部102は、例えば、図5に示すような検索意図を入力するものであり、典型的にはプルダウンメニューを用いて指定入力できる。この例では、検索意図は以下のようなものであるが、これに限定されない。なお、ここでは、検索者が所定のチームに属し、そのチームが組織例えば会社の全体の中にあることを前提とする。   The search query input unit 101 receives, for example, one or a plurality of keywords from a user using a predetermined user interface. Natural sentences and documents may be input or specified instead of keywords. The search intention input unit 102 inputs a search intention as shown in FIG. 5, for example, and can typically be specified and input using a pull-down menu. In this example, the search intention is as follows, but is not limited thereto. Here, it is assumed that the searcher belongs to a predetermined team and the team is in an entire organization such as a company.

(1)自分が知らない情報を新たに発見したい。
(2)見たことのある情報を思い出したい。
(3)自分だけが知らない情報を得たい。
(4)自分だけが活用している情報を知りたい。
(5)チームの中で自分だけが知らない情報を得たい。
(6)チームの中で自分だけが活用している情報を得たい。
(7)一般的に有用であるが、チームの中では自分だけが活用している情報を知りたい。
(8)一般的に有用であるが、チームの中では知られていない情報を得たい。
(9)チームの中では有用だが一般に知られていない情報を得たい。
(1) I want to discover new information that I do not know.
(2) I want to remember the information I have seen.
(3) I want to get information that I don't know.
(4) I want to know information that I am only using.
(5) I want to get information that only my team does not know.
(6) I want to get information that only my team uses.
(7) Although it is generally useful, I would like to know the information that only my team uses.
(8) I would like to obtain information that is generally useful but not known within the team.
(9) I want to obtain information that is useful to the team but is not generally known.

履歴パターン変換部105は、検索意図入力部102から入力された検索意図を履歴パターンに変換するものである。履歴パターンは例えば図5において「自分」、「チーム」、「全体」についてどの履歴頻度を正に重要視するか、負に重要視するか、または考慮しないかのパターンで示される。もちろん、その他の表現手法を採用可能である。例えば、(1)知らない情報を新たに発見したい、という検索意図が選択された場合には、「自分」が「×」で、その他は無関係(「−」)である。したがって、自分が検索または参照している場合にはスコアが小さくなるようにする。スコアの操作の例は後に説明する。   The history pattern conversion unit 105 converts the search intention input from the search intention input unit 102 into a history pattern. For example, in FIG. 5, the history pattern is shown as a pattern indicating which history frequency is positively important, negatively important, or not considered for “self”, “team”, and “whole”. Of course, other expression methods can be adopted. For example, (1) when a search intention is selected to discover new information that you do not know, “self” is “x”, and the others are irrelevant (“−”). Therefore, the score is reduced when the user searches or references. An example of the score operation will be described later.

検索部103は、入力検索クエリに基づいてスコアを各文書のスコアを算出するとともに、履歴パターン変換部105からの履歴パターンに基づいてスコアの補正を行なう。検索クエリに基づくスコアは、例えば、キーワードまたはキーワード列を示す単語ベクトルと文書データベース107から取得した各文書の単語ベクトルとの内積を求めれば良い。文書データベース107は例えば図2に示すようなスコア計算用の情報を文書ごとに保持しており、この文書ベクトルを用いる。スコアの補正は、履歴パターンとユーザ情報データベース109のユーザ情報や組織情報ならびに参照履歴データベース108からの参照履歴を用いる。   The search unit 103 calculates the score of each document based on the input search query, and corrects the score based on the history pattern from the history pattern conversion unit 105. For the score based on the search query, for example, an inner product of a word vector indicating a keyword or a keyword string and a word vector of each document acquired from the document database 107 may be obtained. The document database 107 holds information for score calculation as shown in FIG. 2 for each document, for example, and uses this document vector. The correction of the score uses a history pattern, user information and organization information in the user information database 109, and a reference history from the reference history database 108.

例えば、図5において「自分」が「×」の場合、すなわち、自分が参照した頻度が大きいときに、スコアを小さくする場合には、補正式はつぎのようなものである。   For example, in FIG. 5, when “self” is “x”, that is, when the frequency of reference is large and the score is decreased, the correction formula is as follows.

(式1)
S0×(T−Ta)/Tr (T−Tr<=Ta)
S0 (T−Tr>TaもしくはTaが存在しない)
(Formula 1)
S0 × (T−Ta) / Tr (T−Tr <= Ta)
S0 (T-Tr> Ta or Ta does not exist)

ただし、S0は検索クエリから算出した文書の検索スコア、Tは現時点の時刻、Taは自分が参照した直近の時刻、Trは基準時間である。つまり、自分が参照してから基準時間以上超えている場合には忘れてしまったと考えて当初のスコアS0をそのまま用い、そうでない場合には、直近参照時刻が現時点の時刻に近ければ近いほどスコアが小さくなるようにする。   However, S0 is the search score of the document calculated from the search query, T is the current time, Ta is the latest time referred to by itself, and Tr is the reference time. In other words, if it exceeds the reference time since it was referred to, it is assumed that it was forgotten and the original score S0 is used as it is. Otherwise, the closer the latest reference time is to the current time, the closer the score To be smaller.

図5において「自分」が「○」の場合、すなわち、自分が参照した頻度が大きいときに、スコアを大きくする場合には、当初のスコアに所定数だけ足したり、所定数倍したりすればよい。   In FIG. 5, when “I” is “O”, that is, when the frequency referred to by myself is large, when the score is increased, a predetermined number is added to the initial score or multiplied by a predetermined number. Good.

図5において他人すなわちチームや組織の他人が「×」の場合には、当該他人が参照した頻度に応じてスコアを小さくするように例えばその頻度でスコアを割る等の処理を行なう。   In FIG. 5, when another person, that is, another person of the team or organization is “x”, processing such as dividing the score by the frequency is performed so as to reduce the score according to the frequency referred to by the other person.

図5において他人すなわちチームや組織の他人が丸の場合にには、当初のスコアに所定数だけ足したり、所定数倍したりすればよい。   In FIG. 5, when another person, that is, another person of the team or the organization is a circle, a predetermined number may be added or multiplied by a predetermined number to the initial score.

検索者のチーム内の他人かどうか、検索者のチームを除いた組織全体の他人かどうかは、図4に示すユーザ情報および組織情報レコードを用いて判断する。これらユーザ情報および組織情報はユーザ情報データベース109に保持されている。   It is determined using the user information and organization information record shown in FIG. 4 whether or not the searcher's team is another person and whether or not the searcher's team is the other person in the entire organization. These user information and organization information are held in the user information database 109.

図6は上述実施例の動作を全体として示しており、その処理は以下のとおりである。   FIG. 6 shows the operation of the above-described embodiment as a whole, and the processing is as follows.

[ステップS10]:検索クエリおよび検索意図を入力する。
[ステップS11]:検索クエリを参照して各文書について検索スコアを算出する。
[ステップS12]:検索意図を履歴パターンに変換して、履歴パターンに応じて各文書の参照履歴に基づいて検索スコアを補正する。
[ステップS13]:補正した検索スコアの大きい順にランキングを行い、ユーザに提示する。
[Step S10]: A search query and a search intention are input.
[Step S11]: A search score is calculated for each document with reference to the search query.
[Step S12]: The search intention is converted into a history pattern, and the search score is corrected based on the reference history of each document according to the history pattern.
[Step S13]: Ranking is performed in descending order of corrected search scores and presented to the user.

なお、本発明は上述の実施例に限定されるものではなくその趣旨を逸脱しない範囲で種々変更が可能である。例えば、検索スコアの補正にはつぎのような式を用いることもできる。   In addition, this invention is not limited to the above-mentioned Example, A various change is possible in the range which does not deviate from the meaning. For example, the following formula can be used to correct the search score.

(式2)
S0×(1−C)+((T−Ta)/Tr)×C (T−Ta<=Tr)
S0×(1−C)+C (T−Ta>TrもしくはTaが存在しない)
(Formula 2)
S0 * (1-C) + ((T-Ta) / Tr) * C (T-Ta <= Tr)
S0 × (1-C) + C (T−Ta> Tr or Ta does not exist)

ここでCはスコアリング重み(0<=C<=1)であり、Cが大きいほど参照履歴を重視したスコアに補正される。   Here, C is a scoring weight (0 <= C <= 1), and the larger C is, the more the correction is made to a score that emphasizes the reference history.

また、他人の参照履歴を利用する場合にはつぎの式を用いることができる。   Further, when using another person's reference history, the following equation can be used.

(式3)
S0×A/Ar (A<=Ar)
S0 (A>Ar)
(Formula 3)
S0 × A / Ar (A <= Ar)
S0 (A> Ar)

ただしAは他人の参照回数、Arは基準回数(0<Ar)とし、Arは予め設定しておく。先の例のように   However, A is the reference count of others, Ar is the reference count (0 <Ar), and Ar is set in advance. Like the previous example

(式4)
S0×(1−C)+(A/Ar)×C (A<=Ar)
S0×(1−C)×C (A>Ar)
と参照履歴の重みを可変で切るようにしても良い。
(Formula 4)
S0 × (1-C) + (A / Ar) × C (A <= Ar)
S0 × (1-C) × C (A> Ar)
And the weight of the reference history may be cut variable.

また、式2においてC=1とすれば元々検索スコアがない場合、すなわちヒットしたかヒットしないかの2者択一の検索結果の場合にも対処できる。   Further, if C = 1 in Expression 2, it is possible to deal with a case where there is originally no search score, that is, a case where the search result is a choice between hit and not hit.

すなわちつぎのようなものである。   That is, it is as follows.

(式5)
((T−Ta)/Tr)×C (T−Ta<=Tr)
C (T−Ta>TrもしくはTaが存在しない)
(Formula 5)
((T-Ta) / Tr) × C (T-Ta <= Tr)
C (T-Ta> Tr or Ta does not exist)

また、ユーザが文書を参照したときに、ユーザ名と参照日時の組の参照履歴データベース108に保持するが、過去の参照履歴があるときには参照日時を上書き(更新書き込み)する。上書きするのでなくすべての参照履歴を保持しても良いし、参照回数と最終参照日時を保持してこれを利用しても良い。   Further, when the user refers to the document, it is stored in the reference history database 108 of the combination of the user name and the reference date, but when there is a past reference history, the reference date is overwritten (updated writing). Instead of overwriting, all reference histories may be retained, or the reference count and the last reference date may be retained and used.

まず図3に示すように参照履歴はどの程度文書を読んだかを示すフラグやパーセンテージを用いて、読み終わった文書、途中まで呼んだ文書、まったく読んでいない文書等の観点から検索意図を指定しても良い。この場合は、ユーザがフラグ値や読んだ分量(パーセンテージ)を参照時に入力しても良いし、参照アプリケーションから分量を自動的に取得できる場合にはそれを用いても良い。また、最後まで読んだ場合には、その文書の把握が十分であるから参照を空にしてもよい。   First, as shown in FIG. 3, the reference history uses a flag and percentage indicating how much the document has been read, and specifies the search intention from the viewpoint of the document that has been read, the document that has been called halfway, the document that has not been read at all, etc. May be. In this case, the user may input the flag value or the read amount (percentage) at the time of reference, or may be used when the amount can be automatically acquired from the reference application. In addition, when reading to the end, the reference may be empty because the document is sufficiently grasped.

本発明の実施例を全体として示すブロック図である。It is a block diagram which shows the Example of this invention as a whole. 上述実施例の文書の検索スコアを算出するためのデータ例を説明する図である。It is a figure explaining the example of data for calculating the search score of the document of the above-mentioned Example. 上述実施例の参照履歴のデータ例を説明する図である。It is a figure explaining the example of data of the reference history of the above-mentioned Example. 上述実施例のユーザ情報のデータ例を説明する図である。It is a figure explaining the example of data of the user information of the above-mentioned Example. 上述実施例の検索意図を履歴パターンに変換する例を説明する図である。It is a figure explaining the example which converts the search intention of the above-mentioned Example into a history pattern. 上述実施例の動作を説明する図である。It is a figure explaining operation | movement of the said Example.

符号の説明Explanation of symbols

100 文書検索システム
101 検索クエリ入力部
102 検索意図入力部
103 検索部
104 ランキング部
105 履歴パターン変換部
107 文書データベース
108 参照履歴データベース
109 ユーザ情報データベース
200 コンピュータ
201 プログラム
DESCRIPTION OF SYMBOLS 100 Document search system 101 Search query input part 102 Search intention input part 103 Search part 104 Ranking part 105 History pattern conversion part 107 Document database 108 Reference history database 109 User information database 200 Computer 201 Program

Claims (9)

検索条件を入力する検索条件入力手段と、
検索意図を入力する検索意図入力手段と、
上記検索意図入力手段により入力された検索意図を検索履歴データに変換する検索履歴データ生成手段と、
上記検索条件入力手段により入力された検索条件および上記検索履歴データ生成手段により生成された検索履歴データにしたがって文書を検索する文書検索手段とを有することを特徴とする文書検索装置。
Search condition input means for inputting search conditions;
A search intention input means for inputting a search intention;
Search history data generating means for converting the search intention input by the search intention input means into search history data;
A document search apparatus comprising: a document search unit that searches for a document according to the search condition input by the search condition input unit and the search history data generated by the search history data generation unit.
上記文書検索手段は、上記検索条件にしたがって文書を検索し上記検索履歴データにしたがって検索した文書の絞込みを行なう請求項1記載の文書検索装置。   2. The document search apparatus according to claim 1, wherein the document search means searches for a document according to the search condition and narrows down the searched documents according to the search history data. 上記検索手段は、上記検索条件にしたがってスコア付きで文書を検索し、上記検索履歴データにしたがって上記スコアを調整する請求項1記載の文書検索装置。   2. The document search apparatus according to claim 1, wherein the search means searches for a document with a score according to the search condition, and adjusts the score according to the search history data. 上記検索手段は、上記件条件にしたがってスコアを伴うことなく文書を検索し、当該検索された文書のスコアを上記検索履歴データにしたがって生成する請求項1記載の文書検索装置。   The document search apparatus according to claim 1, wherein the search means searches for a document without a score according to the condition, and generates a score of the searched document according to the search history data. 上記検索意図は、知らない情報を新たに発見したいという意図、および見たことのある情報を思い出したいという意図を含む請求項1〜4のいずれかに記載の文書検索装置。   The document search apparatus according to claim 1, wherein the search intention includes an intention of newly discovering unknown information and an intention of recalling information that has been seen. 上記検索意図は、所属組織のなかで自分だけが知らない情報を得たいという意図、および、所属組織の中で自分だけが活用している情報を得たいという意図を含む請求項1〜5のいずれかに記載の文書検索装置。   The search intention includes the intention of obtaining information that only the user does not know in the affiliated organization and the intention of obtaining information utilized only by the user in the affiliated organization. The document search device according to any one of the above. 上記検索意図は、所属組織を含むより大きな組織において一般に有用であるが上記所属組織中では自分だけが活用している情報を得たいという意図、上記大きな組織において一般に有用であるが上記組織内においては知られていない情報を得たいという意図、および上記所属組織では有用だが上記大きな組織では一般に知られていない情報を得たいという意図を含む請求項1〜6のいずれかに記載の文書検索装置。   The above search intention is generally useful in larger organizations including the affiliated organization, but in the affiliated organization, the intent to obtain information utilized only by itself is generally useful in the large organization, but within the organization The document search apparatus according to claim 1, which includes an intention to obtain unknown information and an intention to obtain information that is useful in the organization to which the user belongs but is not generally known in the large organization. . 検索条件入力手段が検索条件を入力するステップと、
検索意図入力手段が検索意図を入力するステップと、
検索履歴データ生成手段が上記検索意図入力手段により入力された検索意図を検索履歴データに変換するステップと、
文書検索手段が上記検索条件入力手段により入力された検索条件および上記検索履歴データ生成手段により生成された検索履歴データにしたがって文書を検索するステップとを有することを特徴とする文書検索方法。
A step for the search condition input means to input the search condition;
A step of inputting a search intention by a search intention input means;
A search history data generating means for converting the search intention input by the search intention input means into search history data;
A document search method characterized in that the document search means includes a step of searching for a document according to the search condition input by the search condition input means and the search history data generated by the search history data generation means.
検索条件を入力する検索条件入力手段と、
検索意図を入力する検索意図入力手段と、
上記検索意図入力手段により入力された検索意図を検索履歴データに変換する検索履歴データ生成手段と、
上記検索条件入力手段により入力された検索条件および上記検索履歴データ生成手段により生成された検索履歴データにしたがって文書を検索する文書検索手段とを実現するためにコンピュータで実行されることを特徴とする文書検索用コンピュータプログラム。
Search condition input means for inputting search conditions;
A search intention input means for inputting a search intention;
Search history data generating means for converting the search intention input by the search intention input means into search history data;
It is executed by a computer to realize a document search means for searching for a document according to the search condition input by the search condition input means and the search history data generated by the search history data generation means. Computer program for document retrieval.
JP2005090054A 2005-03-25 2005-03-25 Apparatus and method for document retrieval Pending JP2006268789A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005090054A JP2006268789A (en) 2005-03-25 2005-03-25 Apparatus and method for document retrieval

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005090054A JP2006268789A (en) 2005-03-25 2005-03-25 Apparatus and method for document retrieval

Publications (1)

Publication Number Publication Date
JP2006268789A true JP2006268789A (en) 2006-10-05

Family

ID=37204633

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005090054A Pending JP2006268789A (en) 2005-03-25 2005-03-25 Apparatus and method for document retrieval

Country Status (1)

Country Link
JP (1) JP2006268789A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218343A (en) * 2009-03-18 2010-09-30 Konica Minolta Business Technologies Inc Information providing method, information providing device, and computer program
JP2016062519A (en) * 2014-09-22 2016-04-25 カシオ計算機株式会社 Information display apparatus, information display program and information display method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218343A (en) * 2009-03-18 2010-09-30 Konica Minolta Business Technologies Inc Information providing method, information providing device, and computer program
JP2016062519A (en) * 2014-09-22 2016-04-25 カシオ計算機株式会社 Information display apparatus, information display program and information display method

Similar Documents

Publication Publication Date Title
CN100483416C (en) Character input method, input method system and method for updating word stock
US10929603B2 (en) Context-based text auto completion
US20060179039A1 (en) Method and system for performing secondary search actions based on primary search result attributes
JP2003114889A (en) Method, system, and program for relating translated resources to categorized dictionaries
JP2009087347A (en) Information search system
JP2007188352A (en) Page reranking apparatus, and page reranking program
US11573989B2 (en) Corpus specific generative query completion assistant
JP2007140603A (en) Early adapter extraction method and device and program and topic word prediction method and device and program
JP2005135113A (en) Electronic equipment, related word extracting method, and program
JP2006178599A (en) Document retrieval device and method
JP5044707B1 (en) Information processing system, information processing apparatus, and program
JP2008117351A (en) Search system
JP2006268789A (en) Apparatus and method for document retrieval
JP2009093581A (en) Control system for synonym search
JP5127553B2 (en) Information processing apparatus, information processing method, program, and recording medium
JP5072792B2 (en) Retrieval method, program and server for preferentially displaying pages according to amount of information
JP2003108584A (en) Information retrieving system and program
JP2008146209A (en) Document retrieval device, document retrieval method and document retrieval program
JP2010015394A (en) Link destination presentation device and computer program
JP4671212B2 (en) Document search apparatus, document search method, program, and recording medium
JP2011022624A (en) System, method, server and program for retrieving web page
US20110022591A1 (en) Pre-computed ranking using proximity terms
US20130091166A1 (en) Method and apparatus for indexing information using an extended lexicon
JP2009157865A (en) Information search device, information search program and information search method
JP2002117043A (en) Device and method for document retrieval, and recording medium with recorded program for implementing the same method