JP2007233752A - Retrieval device, computer program and recording medium - Google Patents
Retrieval device, computer program and recording medium Download PDFInfo
- Publication number
- JP2007233752A JP2007233752A JP2006055315A JP2006055315A JP2007233752A JP 2007233752 A JP2007233752 A JP 2007233752A JP 2006055315 A JP2006055315 A JP 2006055315A JP 2006055315 A JP2006055315 A JP 2006055315A JP 2007233752 A JP2007233752 A JP 2007233752A
- Authority
- JP
- Japan
- Prior art keywords
- search
- score
- data set
- data
- acquired
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、記憶手段に格納された電子データから必要度や重要度に応じて検索する検索装置、この検索装置で実行されるコンピュータプログラム、及びこのコンピュータプログラムを記録した記録媒体に関する。 The present invention relates to a search device that searches electronic data stored in a storage means according to necessity or importance, a computer program executed by the search device, and a recording medium on which the computer program is recorded.
電子データに対する検索技術、あるいは検索結果の表示技術は、検索対象の情報量の増大による検索結果数の増大のため、ますます重要な技術となっている。なぜなら、求める情報が大量の検索結果に埋もれてしまい、見つけることが困難になっているからである。このような検索に関して、利用者がデータを記憶した記憶装置に蓄積された電子データから参照する電子データを特定する場合に用いる機能としてブラウジングと一覧とがある。ブウラウジングとは格納されている電子データ(電子文書−以下同様)から利用者が階層構造やリンクによりたどる操作を行い、目的の電子データに到達する方法である。この方法は、例えばWindows(登録商標)のExplorerでフォルダ階層をたどる操作や、WebブラウザによりWWW上の文書からリンクをたどる操作に相当する。この方法では、例えば、同一階層に大量の電子データがある場合に目的の電子データに到達するのが難しいという問題がある。 Search technology for electronic data or search result display technology has become an increasingly important technology because of the increase in the number of search results due to an increase in the amount of information to be searched. This is because the information that is sought is buried in a large amount of search results, making it difficult to find. As for such a search, browsing and a list are functions used when a user specifies electronic data to be referred to from electronic data stored in a storage device that stores the data. Browsing is a method in which a user performs an operation that follows a stored electronic data (an electronic document—the same applies hereinafter) using a hierarchical structure or a link to reach the target electronic data. This method corresponds to, for example, an operation of tracing a folder hierarchy with an Explorer of Windows (registered trademark) or an operation of following a link from a document on the WWW by a Web browser. In this method, for example, when there is a large amount of electronic data in the same hierarchy, there is a problem that it is difficult to reach the target electronic data.
一方、一覧とは、電子データの集合に対して利用者が条件を指定し、その条件を満たす電子文書を列挙させてその一覧から目的の電子データを探す方法である。この方法は、例えばWindows(登録商標)のExplorerでのファイル検索やWWWにおけるサーチエンジンの提供する機能に相当する。この方法では、例えば同一階層に大量の電子データがある場合に、目的の電子データに到達するのが難しいという問題がある。これら2種の方法における前記問題に対しては、並べ替えを行うことにより解決を図るという技術が一般に知られている。 On the other hand, a list is a method in which a user designates a condition for a set of electronic data, enumerates electronic documents that satisfy the condition, and searches for desired electronic data from the list. This method corresponds to a function provided by a search engine on the WWW or a file search in Windows (registered trademark) Explorer, for example. In this method, for example, when there is a large amount of electronic data in the same hierarchy, there is a problem that it is difficult to reach the target electronic data. A technique for solving the problems in these two methods by rearranging is generally known.
一方、これら2種の方法に代わるものとして、画面上に電子データを配置する位置を用いた方法、利用者が指定した条件を満たす電子データの集合を2次元平面上に配置し、類似度の高い文書が近くに配置されるようにした方法、あるいは、検索対象のデータに付随する属性値のうち2つを用いてデータの分布を2次元平面に射影する方法などがある。 On the other hand, as an alternative to these two methods, a method using a position where electronic data is arranged on the screen, a set of electronic data satisfying conditions specified by the user are arranged on a two-dimensional plane, There are a method in which a high document is arranged nearby, or a method in which the distribution of data is projected onto a two-dimensional plane using two of the attribute values associated with the data to be searched.
また、これらよりもさらに進んだ方法として、検索条件を満たす情報の一覧をただ表示するのではなく、検索結果を適合度で順位付けして表示し、あるいは検索結果を多次元で表示して閲覧性を高めたりするものもある(特許文献1及び2参照)。あるいは、多次元表示以外にも複数の順序付け方法を用いて検索する方法も知られている(特許文献3参照)。さらに、限定された集合を利用して再検索する方法も知られている(特許文献4参照)。この方法では、一度目の検索で得られた文書集合と得られなかった文書集合を用いて、単語と検索語との関連度を計算して、再度検索している。
しかし、特許文献1及び2に開示されているような多次元表示では、新たに加えられた次元には、単なるあいうえお順や数の昇順で表示され、スコアが付いていなかったり、スコアが付いていても固定的なものであったりで、十分な表示方法ではなかった。前者に対してはスコア付けしている方と比較して閲覧性に劣るのは明らかであり、後者に対しては最初の検索結果で得られた検索結果の集合を使っていない点で不十分であった。なぜなら、この集合はある検索条件によって限定された集合なので、この集合を利用してスコア付けをすれば、固定的なスコア付け、つまり全体の集合を利用してスコア付けするのと比較して、より適したスコア付けが可能となるにもかかわらず、こうした処理をしていないためである。 However, in the multi-dimensional display as disclosed in Patent Documents 1 and 2, the newly added dimension is simply displayed in the order of increasing number or ascending order, with no score or with a score. However, it was fixed and was not an adequate display method. It is clear that the former is inferior in viewability compared to the scored one, and the latter is insufficient because it does not use the set of search results obtained from the first search result Met. Because this set is a set limited by a certain search condition, if scoring using this set, compared to fixed scoring, that is, scoring using the whole set, This is because such processing is not performed even though more suitable scoring is possible.
また、特許文献3に開示されている方法では、複数の順序付け方法で検索し、それらの検索結果を組み合わせることによってあらたな順序付けを定義しているが、それぞれの順序付け方法でどのような集合を利用するかについては触れられていない。 Further, in the method disclosed in Patent Document 3, a new ordering is defined by searching by a plurality of ordering methods and combining the search results, but what set is used for each ordering method. There is no mention of what to do.
さらに、特許文献4に開示されているような限定された集合を利用して再検索する方法では、得られた関連度は再検索のためのキーワードの選択などに使われるだけで、個々の文書のスコアや個々の文書の属性のスコアをつけているわけではない。また、スコアを付ける対象は単語に限定されている。そのため、ユーザは一度目の検索結果を見て対話的に新たな属性を指定することもできない。できるのは、あくまで単語のスコアであって個々のデータや個々のデータの属性のスコアではないことから、検索結果の多次元表示などにも使うことができない。 Furthermore, in the method of re-searching using a limited set as disclosed in Patent Document 4, the obtained relevance is only used for selecting keywords for re-searching, and the like. It does not give the score of the attribute or the attribute of each document. Moreover, the object to be scored is limited to words. Therefore, the user cannot interactively specify a new attribute by looking at the first search result. What can be done is only the score of the word, not the score of the individual data or the attribute of the individual data, so it cannot be used for multidimensional display of search results.
本発明は、このような背景に鑑みてなされたもので、解決すべき課題は、よりユーザの検索目標に近いデータを効率的に検索することができるようにすることにある。 The present invention has been made in view of such a background, and a problem to be solved is to make it possible to efficiently search data closer to a user's search target.
前記課題を解決するため、第1の手段は、指定された検索語又は検索文に基づいてデータベースから検索対象を検索し、検索結果を出力する検索装置において、入力された検索要求を解析して検索条件を設定する設定手段と、前記設定手段によって設定した検索条件に基づいて前記データベースを検索し、検索結果のデータ集合を取得する取得手段と、前記取得手段によって取得したデータ集合の個々のデータに対して所望の順序付けを行うためのスコアを算出する演算手段とを備えていることを特徴とする。 In order to solve the above-mentioned problem, the first means analyzes a search request input in a search device that searches a database based on a designated search word or search sentence and outputs a search result. Setting means for setting search conditions, acquisition means for searching the database based on the search conditions set by the setting means, and acquiring a data set of search results, and individual data of the data set acquired by the acquisition means And calculating means for calculating a score for performing a desired ordering.
第2の手段は、第1の手段において、前記演算手段が前記データ集合の個々のデータに加え、スコアを付けるデータの属性を指定してスコアを算出することを特徴とする。 A second means is characterized in that, in the first means, the calculation means calculates a score by specifying an attribute of data to be scored in addition to individual data of the data set.
第3の手段は、第1の手段において、前記演算手段が前記取得手段によって取得したデータ集合の一部を用いてスコアを算出することを特徴とする。 The third means is characterized in that, in the first means, the calculation means calculates a score using a part of the data set acquired by the acquisition means.
第4の手段は、第1の手段において、前記演算手段が前記取得手段によって取得したデータ集合の予め設定した上位スコアの部分を用いて新たなスコアを算出することを特徴とする。 The fourth means is characterized in that, in the first means, a new score is calculated by using the part of the preset higher score of the data set obtained by the obtaining means by the computing means.
第5の手段は、第1の手段において、前記演算手段が前記取得手段によって取得したデータ集合に付与されているスコアを用いて新たなスコアを演算することを特徴とする。 The fifth means is characterized in that, in the first means, the calculation means calculates a new score using the score assigned to the data set acquired by the acquisition means.
第6の手段は、第1ないし第5のいずれかの手段において、前記演算手段は、前記取得手段によって取得したデータ集合のうち指定されたデータ集合を用いて得られたスコアと、指定されたデータ集合に含まれなかったデータ集合を用いて得られたスコアとの演算から新たなスコアを求めることを特徴とする。 A sixth means is any one of the first to fifth means, wherein the computing means is designated with a score obtained by using a designated data set among the data sets obtained by the obtaining means. A new score is obtained from a calculation with a score obtained using a data set that is not included in the data set.
第7の手段は、第1ないし第6のいずれかの手段において、前記演算手段は、前記取得手段によって取得したデータ集合を用いて得られたスコアと、取得しなかったデータ集合を用いて得られたスコアとの演算からスコアを求めることを特徴とする。 A seventh means is any one of the first to sixth means, wherein the calculation means obtains a score obtained by using the data set obtained by the obtaining means and a data set that has not been obtained. The score is obtained from the calculation with the obtained score.
第8の手段は、第1ないし第7のいずれかの手段において、ユーザ端末、クライアント端末及びサーバを含み、前記データベースがサーバ側に、前記設定手段がクライアント端末側に、前記取得手段がクライアント端末側又はサーバ側に、前記演算手段がクライアント端末側又はサーバ側に設けられていることを特徴とする。 The eighth means includes a user terminal, a client terminal and a server in any one of the first to seventh means, wherein the database is on the server side, the setting means is on the client terminal side, and the acquisition means is the client terminal The computing means is provided on the client terminal side or server side on the server side or server side.
第9の手段は、第1ないし第8のいずれかの手段において、前記検索結果を2次元座標上に表示する表示手段を備えていることを特徴とする。 A ninth means is characterized in that, in any one of the first to eighth means, a display means for displaying the search result on a two-dimensional coordinate is provided.
第10の手段は、コンピュータにロードされ、検索手段に備えられたコンピュータによって実行されるコンピュータプログラムにおいて、検索要求を受け取り、当該検索要求を解析して検索条件を設定する第1の手順と、前記第1の手順で得られた検索条件に基づいてデータベースを検索し、検索した結果得られたデータ集合を取得する第2の手順と、前記第2の手順で得られたデータ集合の個々のデータに対して所望の順序付けを行うためのスコアを算出する第3の手順とを含んでいることを特徴とする。 A tenth means is a computer program loaded on a computer and executed by a computer provided in the search means. The first procedure receives a search request, analyzes the search request and sets a search condition, A second procedure for searching a database based on the search condition obtained in the first procedure and obtaining a data set obtained as a result of the search, and individual data in the data set obtained in the second procedure And a third procedure for calculating a score for performing a desired ordering.
第11の手段は、第10の手段において、前記検索要求が前記スコアを付けるデータの属性の指定を含むことを特徴とする。 The eleventh means is characterized in that, in the tenth means, the search request includes designation of an attribute of data to which the score is attached.
第12の手段は、第10の手段において、前記第3の手順において、前記第2の手順で取得したデータ集合の一部、前記データ集合の予め設定した上位スコアの部分、前記データ集合に付与されているスコアを検索条件に含む部分、及び前記データ集合のうち指定されたデータ集合と指定されたデータ集合に含まれなかったデータ集合部分のいずれか1つの部分を用いて新たなスコアを演算することを特徴とする。 The twelfth means is the tenth means, wherein in the third procedure, a part of the data set acquired in the second procedure, a part of the upper score set in advance of the data set, and the data set A new score is calculated using either the part that includes the specified score in the search condition and the part of the data set that is not included in the specified data set or the specified data set. It is characterized by doing.
第13の手段は、第10ないし第12のいずれかに記載のコンピュータプログラムが、コンピュータによって読み取られ実行可能に記録媒体に記録されていることを特徴とする。 A thirteenth means is characterized in that the computer program according to any one of the tenth to twelfth is recorded on a recording medium so as to be read and executed by a computer.
なお、後述の実施形態では、データベースは符号31に、設定手段は検索要求解析手段22に、取得手段は検索手段32に、演算手段はスコア演算手段33に、ユーザ端末は符号10に、クライアント端末は符号20に、サーバは符号30に、表示手段は表示装置40及びメイン画面41にそれぞれ対応する。
In the embodiment described later, the database is denoted by
本発明によれば、検索結果集合を用いて新たなスコアを算出するので、よりユーザの検索目標に近いデータを効率的に検索することができる。 According to the present invention, since a new score is calculated using the search result set, data closer to the user's search target can be efficiently searched.
以下、図面を参照し、本発明の実施形態について説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図1は実施例1における検索システムの概要を示すブロック図である。この検索システムは書籍検索システムとして構成されたものであり、ここでは、「料理」という言葉を検索語としたときの例を挙げて説明する。本実施例に係る検索システムは、ユーザ(端末)10、クライアント(端末)20及びサーバ30から構成されている。なお、ユーザ及びクライアントはパーソナルコンピュータから構成されている。クライアント20には、入力手段21、検索要求解析手段22、及び出力手段23が設けられ、サーバ30には、データベース31、検索手段32及びスコア演算手段33が設けられている。
FIG. 1 is a block diagram illustrating an outline of a search system according to the first embodiment. This search system is configured as a book search system, and here, an example where the word “cooking” is used as a search word will be described. The search system according to this embodiment includes a user (terminal) 10, a client (terminal) 20, and a
ユーザ10からは、検索要求11が出力され、検索結果12が入力される。検索要求11は、ユーザなどの本システム外からの要求で、検索語、検索文、検索方法や検索対象の指定などからなる。検索結果12はクライアント20側から入力された検索結果が出力(表示)される。
A
クライアント20は、入力手段21、検索要求解析手段22及び出力手段23を備えている。入力手段21は検索要求11を受け取る本システムのインターフェースである。検索要求解析手段22は、検索要求11を解析して、検索手段32に必要なデータの取得を要求し、また、取得したデータを出力手段23に渡す。出力手段23は検索結果を出力するための本システムのインターフェースである。
The
サーバ30はデータベース31、検索手段32及びスコア演算手段33を備えている。データベース31は検索対象のデータが格納されている。検索手段32は指定された条件でデータベース31からデータを取得する。スコアが必要な場合は、スコア演算手段33にスコアを要求する。スコア演算手段33はデータのスコアを計算する。スコア演算手段33は検索手段32からデータベースの部分集合を受け取って、その集合に応じて値の付け方が変わるようなスコア計算を行うことができる。
The
なお、検索要求解析手段22、検索手段32及びスコア演算手段33はソフトウェアによって構成され、クライアント20及びサーバ30の図示しないCPUが前記ソフトウェアを実行することにより、各種の制御が行われる。
The search
データベース31には、例えば、表1に示すようなデータが格納されている。
この実施例においては、例えば、ユーザ10は検索語「料理」を入力し、タイトルに含まれることを指定する。システムは、検索結果をタイトルの適合度順にユーザ10側に返す。次にユーザ10は検索結果を再配置させる属性として著者を選択する。システムは、検索結果集合を利用して、著者のスコア付けを行う。ユーザ10は、著者のスコアに応じて並べられた検索結果を得る。このような検索を行う場合の処理手順についてフローチャートを参照して説明する。図2は検索全体の処理手順を示すフローチャートである。
In this embodiment, for example, the
同図において、ユーザ10側から検索語や検索対象を入力し、検索要求の入力があると(ステップS101)、検索要求解析手段22では、ユーザの検索要求を解析する(ステップS102)。ここでは再検索要求かどうかで処理が異なる。次いで、検索手段32がデータベース31の検索対象からなる集合に対して検索を実行し(ステップS103)、スコア計算の必要性の有無をチェックする(ステップS104)。必要ならば指定のスコア計算方式でスコアを計算し(ステップS105)、その計算結果に基づいて検索結果を出力する(ステップS106)。必要なければ、そのまま検索結果を出力する(ステップS106)。そして、再検索が要求されればステップS101に戻って再度検索し、要求されなければその状態で処理を終える(ステップS107)。
In the figure, when a search term or search target is input from the
ステップS102では、前述のようにユーザの検索要求を解析する。図3はこの解析の処理手順を示すフローチャートである。同図において、検索要求を受け取ると(ステップS201)、再検索か否かをチェックし(ステップS202)、再検索であれば前回の検索要求を取得し(ステップS203)、取得対象に「著者」と「著者のスコア」を追加設定して(ステップS204)検索手段32に検索要求を返す(ステップS206)。一方、ステップS202で再検索でなければ、検索語に「料理」、検索対象に「タイトル」、取得対象に「タイトル」と「タイトルの適合度」を設定し(ステップS205)、ステップS206で検索要求を返す。 In step S102, the user's search request is analyzed as described above. FIG. 3 is a flowchart showing the processing procedure of this analysis. In the figure, when a search request is received (step S201), it is checked whether or not it is a re-search (step S202), and if it is a re-search, the previous search request is acquired (step S203), and the acquisition target is “author”. And “author score” are additionally set (step S204), and a search request is returned to the search means 32 (step S206). On the other hand, if the search is not performed again in step S202, "cooking" is set as the search term, "title" is set as the search target, "title" and "title suitability" are set as the acquisition target (step S205), and search is performed in step S206. Returns the request.
ステップS103では検索が実行されるが、この検索の実行とは、ユーザが要求するデータを取得するための検索を実行し、検索結果集合をスコア演算手段33あるいは検索要求解析手段22側に返すことである。取得した検索結果集合の例を下記の表2に示す。
ステップS106では、検索結果を出力するが、出力された検索結果は、ここではユーザ10の表示画面に表示される。この表示画面40を図4に示す。この表示画面40のメイン画面41では、表2に示したようにタイトルの適合度の高い順から縦方向にタイトルを並べて表示している。また、第1のサブ画面42には、検索語である「料理」と検索対象である「タイトル」が表示され、第2のサブ画面43には、さらに絞り込む場合の検索語と検索対象を入力するための画面が表示されている。この表示に対して、ステップS107でユーザ10から再検索の要求があれば再検索する。再検索では、ステップS101の検索要求の入力で、ユーザは再検索の指定を入力する。例えば、最初の検索で得られた検索結果を著者でスコア付けすると指定する。次いで、ステップS102で検索要求を解析し、例えば、「料理」がタイトルに含まれる書籍を著者でスコア付けする場合は、まず「料理」をタイトルに含む書籍の取得を要求し、さらにその検索結果集合に含まれる書籍の著者をそれぞれ数え上げることを要求する。ステップS103の検索の実行では、例えば、スコアが必要で検索結果から直接スコアが得られない場合は、スコアを計算する。スコアの計算では、指定のスコア計算方式でスコアを計算する。例えば、著者のスコアが、ある集合にその著者が含まれる書籍の件数で示される場合、検索結果集合を受け取り、その検索結果集合に現れる著者をそれぞれ数え上げて検索結果に追加する。
In step S106, the search result is output. The output search result is displayed on the display screen of the
図5はスコアの計算の処理手順を示すフローチャートである。スコアを計算する場合、まず、タイトル、タイトルのスコア、著者からなる検索結果集合を受け取り(ステップS301)、著者の出現個数を格納するリストを用意する(ステップS302)。次いで、検索結果集合から1件取り出し(ステップS303,S304)、との取り出した1件からさらに著者を取り出し、既に取得済みかどうかを調べる(ステップS305)。取得済みであれば(ステップS306−YES)、リストの該当する著者の出現回数を1増やし、ステップS303に戻る。取得済みでなければ(ステップS306−NO)、リストにその著者の項目を追加し、出現回数を1としてステップS303に戻る。この処理を検索結果集合の全てについて実行し、検索結果集合の各データに著者の出現回数を著者のスコアとして追加し(ステップS309)、検索結果集合を検索手段32に返す(ステップS310)。 FIG. 5 is a flowchart showing a processing procedure of score calculation. When calculating a score, first, a search result set including a title, a title score, and an author is received (step S301), and a list for storing the number of appearances of the author is prepared (step S302). Next, one author is extracted from the retrieved result set (steps S303 and S304), and an author is further extracted from the retrieved one item to check whether it has already been acquired (step S305). If already acquired (step S306—YES), the number of appearances of the corresponding author in the list is incremented by 1, and the process returns to step S303. If not acquired (NO in step S306), the item of the author is added to the list, the appearance count is set to 1, and the process returns to step S303. This process is executed for all of the search result sets, and the number of times the author appears as an author score is added to each data of the search result set (step S309), and the search result set is returned to the search means 32 (step S310).
表3はステップS304で全て取り出した検索結果集合に含まれる各著者の書籍件数を数え上げたリストの例である。
表3に示したステップS304のリストに対してステップS309で著者のスコアを追加した検索結果集合は表4に示すようになる。
図6は表4に示した再検索結果集合の出力表示画面を示す図である。この表示画面では、メイン画面41に検索結果が出力されている。例えば、縦方向に上からタイトルの適合度の高い順に並べ、横方向に著者のスコアの高い順に並べる場合、タイトルの適合度と著者のスコアで得られる位置にタイトルが表示される。ちなみに本実施例では、一度検索して検索結果集合を得てから検索結果を再検索する場合について説明したが、はじめから全て指定をすることも可能である。ただしその場合は、どの検索結果集合を用いてどのスコアを付けるか指定する必要がある。
FIG. 6 is a diagram showing an output display screen of the re-search result set shown in Table 4. In this display screen, the search result is output to the
また、本実施例では、毎回検索することとして説明したが、前回の検索条件と今回の検索条件の差分がスコア演算によって取得できるデータだけであれば、すでに取得済みの検索結果集合を用いることにより再検索を省略してスコアの計算だけを実行することも可能である。ただし、その場合は、検索手段等が前回の検索条件を保存しておき今回の検索条件と比較する必要がある。 Further, in the present embodiment, it is described that the search is performed every time. However, if the difference between the previous search condition and the current search condition is only data that can be acquired by the score calculation, the already acquired search result set is used. It is also possible to omit the re-search and execute only the score calculation. However, in that case, the search means or the like needs to store the previous search condition and compare it with the current search condition.
以上のように本実施例によれば、ある検索条件によって限定された集合を利用して著者のスコアを付けているので、全体の集合を利用してスコア付けするのと比較して、より適切なスコア計算が可能となる。例えば、本実施例では料理関係の書籍を多く書いている人が高い著者スコアを持つようにスコアを計算でき、その他の分野で多くの書籍を書いていても著者スコアは高くならない。 As described above, according to the present embodiment, the author's score is assigned using a set limited by a certain search condition, so that it is more appropriate than scoring using the entire set. Score calculation is possible. For example, in this embodiment, the score can be calculated so that a person who has written many dishes-related books has a high author score, and the author score does not increase even if many books are written in other fields.
実施例2は実施例1に対してスコアの計算方法が異なる例である。
この実施例では、検索結果集合の全件を使わず、例えば登録が一年以内のもので制限した検索結果部分集合からスコアを計算する。図7はこのときの処理手順を示すフローチャートである。この図7のフローチャートは、実施例1の図3に示したフローチャートのステップ204の処理の検索条件に「登録日」を加えたものである。すなわち、図7のフローチャートでは、ステップS203で前回の検索要求を取得した後、取得対象に「著者」、「著者のスコア」及び「登録日」を追加設定し(ステップS204a)、検索手段32に検索要求を返す(ステップS206)ようにしている。その他の各ステップは図3の処理と同一である。
The second embodiment is an example in which the score calculation method is different from the first embodiment.
In this embodiment, the score is calculated from the search result subset that is not limited to all the search result sets, for example, those registered within one year. FIG. 7 is a flowchart showing the processing procedure at this time. The flowchart of FIG. 7 is obtained by adding “registration date” to the search condition of the process in step 204 of the flowchart shown in FIG. 3 of the first embodiment. That is, in the flowchart of FIG. 7, after the previous search request is acquired in step S203, “author”, “author score”, and “registration date” are additionally set as acquisition targets (step S204a). A search request is returned (step S206). Other steps are the same as those in FIG.
また、スコアの計算は図8に示すフローチャートに示した処理手順で行われる。この処理手順では、図5のステップS301の処理に登録日を加えた検索結果集合、すなわち、タイトル、タイトルのスコア、著者、及び登録日からなる検索結果集合を受け取り(ステップS301a)、この集合に対してステップS302からステップS310の処理を実行する。ただし、登録日を加えたことによりステップS305に代えてステップS305a、S305b、S305cの処理を実行する。すなわち、登録日を取り出して一年以内かどうかを調べ(ステップS305a)、一年以内のもの(ステップS305b)の中から、著者を取り出してすでに取得済みか否かを調べる(ステップS305c)。その後、ステップS306以降の処理を実行する。 The score is calculated according to the processing procedure shown in the flowchart of FIG. In this processing procedure, a search result set obtained by adding a registration date to the process of step S301 in FIG. 5, that is, a search result set including a title, a title score, an author, and a registration date is received (step S301a). On the other hand, the processing from step S302 to step S310 is executed. However, the processing of steps S305a, S305b, and S305c is executed instead of step S305 due to the addition of the registration date. That is, it is checked whether or not the registration date is within one year (step S305a), and the author is taken out from those within one year (step S305b) to check whether or not it has already been acquired (step S305c). Thereafter, the processing after step S306 is executed.
この図8のフローチャートの処理手順で処理した検索結果集合、すなわち、タイトルに「料理」を含み、かつ登録が一年以内の検索結果集合は例えば表5のようになる。
表5の結果に対して登録日で限定された検索結果集合に含まれる各著者の書籍件数を数え上げると表6に示すようになる。
図8のフローチャートにおけるステップS304のリスト(表6)に対してステップS309で著者のスコアを追加した検索結果集合は表7に示すようになる。
図9は本実施例における検索結果の表示画面の一例を示す図で、縦軸に登録日が、横軸に著者がそれぞれパラメータに設定されている。これによりどの作者がこの一年間のどの時期にどのようなタイトルの料理に関係する本を出版したかが2次元座標上に表示される。 FIG. 9 is a diagram showing an example of a search result display screen in this embodiment, in which the registration date is set on the vertical axis and the author is set on the horizontal axis. As a result, it is displayed on the two-dimensional coordinates which author has published a book related to what kind of dish at what time of the year.
その他、特に説明しない各部は前述の実施例1と同等に構成され、同等に機能する。また、図7及び図8に示したフローチャート以外の制御も実施例1と同等である。 Other parts not specifically described are configured in the same manner as in the first embodiment and function in the same manner. Controls other than the flowcharts shown in FIGS. 7 and 8 are the same as those in the first embodiment.
このように構成した実施例2では、実施例1よりもさらに限定した集合を利用できるので、より適切なスコア計算が可能となる。例えば、本実施例では表7から分かるように最近出版されたり入荷されたりした「料理」関係の書籍を多く書いている人が高いスコアを持つようにスコアを計算でき、最近料理関係書籍を書いていない人は著者スコアが高くならない。したがって、より現況がわかるような検索結果が得られる。 In the second embodiment configured as described above, a more limited set than in the first embodiment can be used, so that more appropriate score calculation can be performed. For example, in this example, as can be seen from Table 7, the score can be calculated so that a person who has written a lot of “cooking” books that have been published or received recently has a high score. Those who do not have high author scores. Therefore, a search result that gives a better understanding of the current situation can be obtained.
実施例3は実施例1に対してスコアの計算方法が異なるさらに他の例である。
この実施例は、検索結果集合の全件を使わず、例えば初回の検索で得られたタイトルの適合度上位N件で制限した検索結果部分集合からスコアを計算するものである。図10はこのスコア計算の処理手順を示すフローチャートである。この処理手順では、実施例1における図5のフローチャートのステップS303の処理に対してタイトルのスコアの大きい方から一件取り出すようにし(ステップS303a)、取り出したタイトルに対してステップS304ないしステップS310の処理を実行する。その際、ステップS305の前段にステップS305d及びS305eの処理手順を実行する。すなわち、ステップS305dでは、ステップS303aで取り出したタイトルの件数がN件以下かどうかを調べ、N件より大きければ(ステップS305e−NO)ステップS309に移行し、N件以下であれば(ステップS305e−YES)、ステップS305の処理、すなわち、著者を取り出し、すでに取得済みか否かを調べ、ステップS306以降の処理に以降する。
The third embodiment is still another example in which the score calculation method is different from the first embodiment.
In this embodiment, the score is calculated from a subset of search results restricted by, for example, the top N matching levels of titles obtained by the first search without using all the search result sets. FIG. 10 is a flowchart showing a processing procedure of this score calculation. In this processing procedure, one item having a larger title score is extracted from the processing of step S303 in the flowchart of FIG. 5 in the first embodiment (step S303a), and steps S304 to S310 are performed on the extracted title. Execute the process. At that time, the processing procedure of steps S305d and S305e is executed before the step S305. That is, in step S305d, it is checked whether the number of titles extracted in step S303a is N or less. If the number is larger than N (step S305e-NO), the process proceeds to step S309. YES), the process of step S305, that is, the author is taken out and it is checked whether or not it has already been acquired, and the process after step S306 is followed.
表8はタイトルに「料理」に関連した語を含む検索結果集合の例である。この表から分かるように、「料理」と関連があると判定された「教室」をタイトルに含む書籍も検索されている。
表8に示した検索結果集合をタイトルの適合度上位5件に制限すると表9に示すようになる。
また、表9に示したタイトルの適合度で限定された検索結果集合に含まれる各著者の書籍件数を数え上げてリスト化すると表10に示すようになる。
表9の結果に著者のスコアを追加すると、検索結果集合は表11に示すようになる。
図11は本実施例における検索結果の表示画面の一例を示す図で、縦軸に登録日が、横軸に著者がそれぞれパラメータに設定されている。これにより初回の検索で得られたタイトルの適合度の上位にランク付けされた作者と書籍の検索結果部分集合が2次元座標上に表示される。 FIG. 11 is a diagram showing an example of a search result display screen in this embodiment, in which the registration date is set on the vertical axis and the author is set on the horizontal axis. As a result, the search result subset of the author and the book ranked higher in the degree of suitability of the title obtained in the first search is displayed on the two-dimensional coordinates.
その他、特に説明しない各部は前述の実施例1と同等に構成され、同等に機能する。また、図7及び図8に示したフローチャート以外の制御も実施例1と同等である。 Other parts not specifically described are configured in the same manner as in the first embodiment and function in the same manner. Controls other than the flowcharts shown in FIGS. 7 and 8 are the same as those in the first embodiment.
このように構成した実施例3では、実施例2とは異なる限定方法で実施例1よりもさらに限定した集合を利用することができるので、より適切なスコア計算が可能となる。例えば、本実施例では、最初の検索で「料理」をタイトルに含む書籍ではなく、「料理」の関連語をタイトルに含む書籍を検索したとする。この場合「料理」は含まないが、「クッキング」とか「食卓」などをタイトルに含む書籍も検索できる。 In the third embodiment configured as described above, a more limited set than that in the first embodiment can be used in a limiting method different from that in the second embodiment, so that more appropriate score calculation can be performed. For example, in this embodiment, it is assumed that a book including “related words” in the title is searched for in the first search, not a book including “dishes” in the title. In this case, although “cooking” is not included, a book including “cooking” or “dinner” in the title can be searched.
しかし、適切な関連語が選ばれるとは限らないので料理とは関係がなさそうな書籍も検索結果集合に含まれてしまう。この例では「英会話教室」などである。ただし、このような料理と関係がなさそうな書籍は、タイトルの適合度も小さいことが多いので、著者のスコアを付ける際にタイトルの適合度が上位のものだけに制限すれば、これらの書籍をスコア計算から排除したうえで、「料理」関係の書籍を多く書いている人が高いスコアを持つようにスコア計算を行うことができる。 However, since an appropriate related word is not always selected, a book that does not seem to be related to cooking is also included in the search result set. In this example, it is “English conversation class”. However, books that do not seem to be related to such dishes often have low titles, so if you restrict the titles to only the top ones when assigning the author's score, these books Can be calculated so that a person who has written many books related to “cooking” has a high score.
実施例4は実施例1に対してスコアの計算方法がさらに異なる他の例である。
この実施例は最初の検索で得られたスコアに応じてカウント件数に重みを付けてスコア計算するものである。図12はこの実施例におけるスコア計算の処理手順を示すフローチャートである。このフローチャートは実施例1における図5のフローチャートのステップS307,S308,S309の処理が実施例1とは異なっている。すなわち、ステップS301からステップS306まで処理した後、著者を取得していれば、リストの該当する著者の重み付け出現回数をタイトルのスコア分増やし(ステップS307a)、取得していなければ、リストにその著者の項目を追加し、重み付き出現回数にタイトルのスコアを設定する(ステップS308a)。この動作を検索結果集合の全てに対して実行した後(ステップS304)、検索結果集合の各データに著者の重み付き出現回数を著者のスコアと追加し(ステップS309a)、ステップS310の処理を実行する。
The fourth embodiment is another example in which the score calculation method is further different from the first embodiment.
In this embodiment, the score is calculated by weighting the number of counts according to the score obtained in the first search. FIG. 12 is a flowchart showing a score calculation processing procedure in this embodiment. This flowchart differs from that of the first embodiment in the processing of steps S307, S308, and S309 of the flowchart of FIG. That is, after the processing from step S301 to step S306, if the author is acquired, the weighted appearance count of the corresponding author in the list is increased by the title score (step S307a), and if not, the author is added to the list. The title score is set as the weighted appearance count (step S308a). After performing this operation on all search result sets (step S304), the author's weighted appearance count is added to each data of the search result set (step S309a), and the process of step S310 is executed. To do.
このようにしてスコアを計算した初回検索結果集合の一例を表12に示す。
また、検索結果集合に含まれる各著者の重み付き書籍件数は例えば表13として示したリストのようになる。
表12のリストに著者のスコアを追加した検索結果集合は例えば表14に示すようになる。
その他、特に説明しない各部は前述の実施例1と同等に構成され、同等に機能する。また、図12に示したフローチャート以外の制御も実施例1と同等である。 Other parts not specifically described are configured in the same manner as in the first embodiment and function in the same manner. Controls other than the flowchart shown in FIG. 12 are the same as those in the first embodiment.
このように構成され、処理される本実施例によれば、初回の検索結果集合の内容を反映したスコア計算ができるので、より適切なスコア計算が可能となる。例えば、件数の変わりに表13に示したようなタイトルの適合度の合計を使えば、タイトルの適合度が高い書籍数が多い著者のスコアが高くなり、件数が多いだけの著者のスコアは低くなる。このような結果に基づいて前述のように表示画面40のメイン画面41に表示すれば、重み付けされた著者のスコアをパラメータとする画面で検索結果の表示が可能となる。
According to this embodiment configured and processed in this way, score calculation reflecting the contents of the initial search result set can be performed, and thus more appropriate score calculation can be performed. For example, if the total suitability of titles as shown in Table 13 is used instead of the number of cases, the score of authors with many books with high title suitability will be high, and the score of authors with only a large number of books will be low. Become. If the result is displayed on the
実施例5は実施例1に対してスコアの計算方法がさらに異なる例である。 The fifth embodiment is an example in which the score calculation method is further different from the first embodiment.
この実施例は全体の集合も利用してスコア付けするが、最初の検索で得られた集合に重みを付けてスコア計算するものである。例えば、ある著者の書籍が検索結果集合に含まれる場合は2件としてカウントし、検索結果集合に含まれていない書籍は1件としてカウントし、スコア計算する。図13はこの実施例におけるスコア計算の処理手順を示すフローチャートである。このフローチャートは実施例1における図5のフローチャートのステップS308の後段にステップS308b,S308cを設けたものである。すなわち初めて著者名が出てきたときに(ステップS306−NO)、ステップS308でリストにその著者の項目を追加し、出現回数を1とした後、検索語として検索する著者名、検索対象に著者、取得対象に書籍の件数で検索して検索結果を取得し(ステップS308b)、得られた件数を出現回数に設定し(ステップS3008c)、ステップS302に戻り、当該ステップ以降の処理を繰り返す。 In this embodiment, scoring is performed using the entire set, but the score is calculated by weighting the set obtained in the first search. For example, when a book of a certain author is included in the search result set, it is counted as two, and a book not included in the search result set is counted as one and the score is calculated. FIG. 13 is a flowchart showing a processing procedure of score calculation in this embodiment. In this flowchart, steps S308b and S308c are provided after step S308 in the flowchart of FIG. That is, when an author name appears for the first time (step S306-NO), an item of the author is added to the list in step S308, and the number of appearances is set to 1, and then the author name to be searched as a search term and the author as the search target Then, a search result is acquired by searching for the number of books to be acquired (step S308b), the obtained number is set as the number of appearances (step S3008c), the process returns to step S302, and the processes after the step are repeated.
その他、特に説明しない各部は前述の実施例1と同等に構成され、同等に機能する。また、図12に示したフローチャート以外の制御も実施例1と同等である。 Other parts not specifically described are configured in the same manner as in the first embodiment and function in the same manner. Controls other than the flowchart shown in FIG. 12 are the same as those in the first embodiment.
このように構成され、処理される本実施例によれば、集合が限定されすぎた場合などでも、適切なスコア計算が可能となる。例えば、検索結果集合が少なくてほとんどの著者が1件しか書いていない場合は、著者のスコアの差がでない。そこで、検索結果集合以外の情報も加味することにより著者のスコアの差を出すことができる。 According to this embodiment configured and processed in this way, an appropriate score can be calculated even when the set is too limited. For example, if there are few search result sets and most authors have written only one, there is no difference in author scores. Therefore, by taking into account information other than the search result set, the author's score difference can be calculated.
10 ユーザ(端末)
20 クライアント(端末)
22 検索要求解析手段
30 サーバ
31 データベース
32 検索手段
33 スコア演算手段
10 users (terminals)
20 clients (terminals)
22 Search request analysis means 30
Claims (13)
入力された検索要求を解析して検索条件を設定する設定手段と、
前記設定手段によって設定した検索条件に基づいて前記データベースを検索し、検索結果のデータ集合を取得する取得手段と、
前記取得手段によって取得したデータ集合の個々のデータに対して所望の順序付けを行うためのスコアを算出する演算手段と、
を備えていることを特徴とする検索装置。 In a search device that searches a search object from a database based on a specified search word or search sentence and outputs a search result,
A setting means for analyzing the input search request and setting search conditions;
An acquisition unit that searches the database based on the search condition set by the setting unit and acquires a data set of search results;
Computing means for calculating a score for performing a desired ordering on individual data of the data set obtained by the obtaining means;
A search apparatus comprising:
検索要求を受け取り、当該検索要求を解析して検索条件を設定する第1の手順と、
前記第1の手順で得られた検索条件に基づいてデータベースを検索し、検索した結果得られたデータ集合を取得する第2の手順と、
前記第2の手順で得られたデータ集合の個々のデータに対して所望の順序付けを行うためのスコアを算出する第3の手順と、
を含んでいることを特徴とするコンピュータプログラム。 In a computer program loaded on a computer and executed by a computer provided in the search means,
A first procedure for receiving a search request, analyzing the search request and setting search conditions;
A second procedure for searching a database based on the search condition obtained in the first procedure and acquiring a data set obtained as a result of the search;
A third procedure for calculating a score for performing a desired ordering on each piece of data of the data set obtained in the second procedure;
The computer program characterized by including.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006055315A JP2007233752A (en) | 2006-03-01 | 2006-03-01 | Retrieval device, computer program and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006055315A JP2007233752A (en) | 2006-03-01 | 2006-03-01 | Retrieval device, computer program and recording medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007233752A true JP2007233752A (en) | 2007-09-13 |
Family
ID=38554283
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006055315A Pending JP2007233752A (en) | 2006-03-01 | 2006-03-01 | Retrieval device, computer program and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007233752A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8041688B2 (en) | 2008-04-10 | 2011-10-18 | Ricoh Company Limited | Data search device, data search method, and recording medium |
US8229927B2 (en) | 2008-01-11 | 2012-07-24 | Ricoh Company, Limited | Apparatus, system, and method for information search |
US8370344B2 (en) | 2008-05-02 | 2013-02-05 | Ricoh Company, Ltd. | Information processing apparatus, information processing method, information processing program and recording medium for determining an order of displaying search items |
US8612429B2 (en) | 2008-01-18 | 2013-12-17 | Ricoh Company, Limited | Apparatus, system, and method for information search |
-
2006
- 2006-03-01 JP JP2006055315A patent/JP2007233752A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8229927B2 (en) | 2008-01-11 | 2012-07-24 | Ricoh Company, Limited | Apparatus, system, and method for information search |
US8612429B2 (en) | 2008-01-18 | 2013-12-17 | Ricoh Company, Limited | Apparatus, system, and method for information search |
US8041688B2 (en) | 2008-04-10 | 2011-10-18 | Ricoh Company Limited | Data search device, data search method, and recording medium |
US8326812B2 (en) | 2008-04-10 | 2012-12-04 | Ricoh Company, Limited | Data search device, data search method, and recording medium |
US8370344B2 (en) | 2008-05-02 | 2013-02-05 | Ricoh Company, Ltd. | Information processing apparatus, information processing method, information processing program and recording medium for determining an order of displaying search items |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4893243B2 (en) | Image summarization method, image display device, k-tree display system, k-tree display program, and k-tree display method | |
US10140368B2 (en) | Method and apparatus for generating a recommendation page | |
JP6050327B2 (en) | Dynamic image display area and image display in web search results | |
US7607082B2 (en) | Categorizing page block functionality to improve document layout for browsing | |
US7769771B2 (en) | Searching a document using relevance feedback | |
US7783644B1 (en) | Query-independent entity importance in books | |
US7548936B2 (en) | Systems and methods to present web image search results for effective image browsing | |
US9652558B2 (en) | Lexicon based systems and methods for intelligent media search | |
JP2020024698A (en) | Generation method, device, apparatus of knowledge graph, and computer-readable storage medium | |
US7562085B2 (en) | Systems and methods for displaying linked information in a sorted context | |
JP5990180B2 (en) | Browsing related image search result sets | |
JP4746439B2 (en) | Document search server and document search method | |
US20080172380A1 (en) | Information retrieval based on information location in the information space. | |
CN105723364B (en) | Transitioning from a first search results environment to a second search results environment | |
US8458180B2 (en) | Information exploration | |
CN111159431A (en) | Knowledge graph-based information visualization method, device, equipment and storage medium | |
CN107003829B (en) | Request-related result regions within and outside of view for each result category | |
EP2354975A1 (en) | Automatic association of informational entities | |
JP2007233752A (en) | Retrieval device, computer program and recording medium | |
WO2018103642A1 (en) | Systems, apparatuses, and methods for searching and displaying information available in large databases according to the similarity of chemical structures discussed in them | |
JP2010224625A (en) | Method and program for visualizing keyword two-dimensional | |
US20080104510A1 (en) | Graphical Interface for Search Engine | |
WO2018084226A1 (en) | Document search method and device | |
US20050262054A1 (en) | Item type specific structured search | |
JP2005128872A (en) | Document retrieving system and document retrieving program |