JP2012173794A - ランキングモデル選択機能を有する文書検索装置、ランキングモデル選択機能を有する文書検索方法およびランキングモデル選択機能を有する文書検索プログラム - Google Patents

ランキングモデル選択機能を有する文書検索装置、ランキングモデル選択機能を有する文書検索方法およびランキングモデル選択機能を有する文書検索プログラム Download PDF

Info

Publication number
JP2012173794A
JP2012173794A JP2011032317A JP2011032317A JP2012173794A JP 2012173794 A JP2012173794 A JP 2012173794A JP 2011032317 A JP2011032317 A JP 2011032317A JP 2011032317 A JP2011032317 A JP 2011032317A JP 2012173794 A JP2012173794 A JP 2012173794A
Authority
JP
Japan
Prior art keywords
query
database
model
optimal
ranking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011032317A
Other languages
English (en)
Other versions
JP5432936B2 (ja
Inventor
Yoshihiko Kazuhara
良彦 数原
Jun Suzuki
潤 鈴木
Yoshihito Yasuda
宜仁 安田
Yoshimasa Koike
義昌 小池
Ryoji Kataoka
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011032317A priority Critical patent/JP5432936B2/ja
Publication of JP2012173794A publication Critical patent/JP2012173794A/ja
Application granted granted Critical
Publication of JP5432936B2 publication Critical patent/JP5432936B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】入力クエリに対して最適なランキングモデルを選択することができるランキングモデル選択機能を有する文書検索装置を提供する。
【解決手段】クエリ間の検索評価指標値(MAP値)から、クエリ間の類似度が高くなる変換行列を作成し、最大類似度を持つクエリのランキングモデルを、クエリに対する最適モデルとして最適モデルDB106に格納しておく。入力された検索クエリに対応する最適モデルを前記DB106から取得し、該最適モデルのクエリに対応する、ランキングモデルDB103内のスコア要因重みと、クエリ処理部150により算出された、検索結果集合とスコア要因を要素とするスコア要因値行列とを検索スコア計算部160で積算し、該算出された検索スコアの降順に入力検索クエリに対応する検索結果を提示する。
【選択図】図1

Description

本発明は、文書の検索結果を提示する装置およびその方法に関するものである。
ウェブ検索システムのような検索システムにおいては、TF−IDF(Term Frequency−Inverse Document Frequency)のようなクエリ頻度に基づくスコアや、PageRankのようなリンク解析に基づくスコアなど、多数の要因(スコア要因と呼ぶ)を用いて最終的なランキングに用いる検索スコアを算出する(非特許文献1参照)。そして、算出された検索スコアの降順に並べることによって、ランキングを行った検索結果を提示する方法が広く用いられている。
クエリ毎に最適なランキングモデルが異なるため、クエリ毎に最適なランキングモデルを選択し、適用する方法がある。非特許文献2では,クエリ毎にランキングモデルを生成し、入力されたクエリに対して、当該クエリの特徴表現において、ユークリッド距離が最も短いランキングモデルを選択する。この際、それぞれのランキングモデル生成手法としては、たとえば非特許文献3の技術などを用いる。
尚、本発明の文書検索装置で利用する変換行列は、下記非特許文献4に記載されている。
竹野浩、井上孝史、「分散型高速情報収集/全文検索システムInfoBee/Evangelist」、NTT R&D Vol.52 No.2 2003、pp.78≡84。 Xiubo Geng,Tie−Yan Liu,Tao Qin,Andrew Arnold,Hang Li and Heung−Yeung Shum,"Query Dependent Ranking Using K−Nearest Neighbor",In Proceedings of the 31st annual international ACM SIGIR conference on Research and development in information retrieval(SIGIR ’08),2008,pp.115−122. Thorsten Joachims,"Optimizing Search Engines using Clickthrough Data",In Proceedings of the eighth ACM international conference on Knowledge Discovery and Data mining(KDD ’02),2002,pp.133−142. Eric P. Xing and Andrew Y. Ng and Michael I. Jordan and Stuart Russell,"Distance Metric Learning, with Application to Clustering with Side− Information",Proceedings of the 16th annual conference on Neural Information Processing Systems(NIPS ’02),2002,pp.505−512.
クエリ毎にランキングモデルを選択するために従来技術で用いられたクエリ類似度の計算方法は、事前に設定された特徴空間における距離であり、入力されたクエリに対して、この特徴空間における最近傍のクエリを用いて生成されたランキングモデルが最適であるという仮定に基づいている。
しかしながら、実際にはクエリの特徴表現における最近傍のモデルと、実際に最適なモデルは一致するとは限らないため、適切に類似度を計算することができず、高精度なランキングを実現する最適なモデルを選択できないという課題がある。
本発明は上記課題を解決するものであり、その目的は、入力クエリに対して最適なランキングモデルを選択することができるランキングモデル選択機能を有する文書検索装置、方法、プログラムを提供することにある。
上記課題を解決するための本発明のランキングモデル選択機能を有する文書検索装置は、N個のクエリ各々に対してM次元の特徴で表現したクエリ表現データが格納されたクエリ表現データベースと、N個のクエリに対する文書の検索結果の適合度と、M次元のベクトルで表される特徴表現とを有した訓練データが格納された訓練データデータベースと、前記訓練データを入力とし、各クエリの前記特徴表現に対する重みを保持したランキングモデルを生成してランキングモデルデータベースを構築するランキング関数生成手段と、前記訓練データおよびランキングモデルを入力とし、前記ランキングモデルデータベース内の全モデルに対して最大の検索評価指標値を与えて、訓練データにおける最高精度を示す訓練時最適ランキングモデルを生成し、該訓練時最適ランキングモデルのクエリと前記訓練データのクエリの対のデータを有した訓練時最適モデルデータベースを構築する訓練時最適モデル選択手段と、前記クエリ表現データベースと訓練時最適モデルデータベースの各データを入力とし、クエリ表現データベース内のクエリと、該クエリに相当する前記訓練時最適モデルデータベース内の訓練時最適ランキングモデルのクエリとの距離が最小となる変換行列を学習して生成し、変換行列データベースを構築する距離学習手段と、前記クエリ表現データベース、ランキングモデルデータベースおよび変換行列データベースの各データを入力とし、クエリ表現データベース内の各クエリについて、前記変換行列を利用して各クエリ間の類似度を計算し、最大の類似度を持つクエリを選択し、該選択されたクエリのランキングモデルを前記ランキングモデルデータベースから取得し、該取得されたランキングモデルをクエリに対する最適モデルとして最適モデルデータベースを構築する最適モデルデータベース作成手段と、予めWebページから収集した文書を基に作成された文書インデクスが格納された文書インデクスデータベースと、入力された検索クエリに対する検索結果集合を前記文書インデクスデータベースから取得し、該検索結果集合と複数のスコア要因とでスコア要因値行列を算出するクエリ処理手段と、前記クエリ処理手段で算出されたスコア要因値行列と、前記ランキングモデルデータベースおよび最適モデルデータベースの各データとを入力とし、前記入力された検索クエリに対応する最適モデルを前記最適モデルデータベースから取得し、該取得された最適モデルのクエリに対応する前記ランキングモデルデータベース内のランキングモデルとしての重みと、前記スコア要因値行列とを積算して検索スコアベクトルを計算する検索スコア計算手段と、前記検索スコア計算手段により計算された検索スコアの降順に入力クエリに対する検索結果を提示する検索結果提示手段と、を備えたことを特徴としている。
本発明によれば、検索評価指標を最大にするようなクエリを特徴空間における近傍に近づけるクエリ特徴空間の変換を行っているので、入力されたクエリに対する類似度計算が改善され、これにより、ランキングモデルの選択の性能を向上し、検索ランキングの精度向上を実現することができる。
本発明の一実施形態例の文書検索装置全体の構成図。 図1の最適モデルDBを作成する装置の構成図。 図2の変換行列DBを生成する装置の構成図。 図3の訓練時最適モデル選択部120の処理の流れを示すフローチャート。 図2の最適モデルDB作成部140の処理の流れを示すフローチャート。 図1の文書検索装置の処理の流れを示すフローチャート。
以下、図面を参照しながら本発明の実施の形態を説明するが、本発明は下記の実施形態例に限定されるものではない。まず本発明の一実施形態例の全体構成の概要を図1〜図3とともに説明する。
本実施形態例の文書検索装置100は、図1に示すように、予めWebページから収集した文書を基に作成された文書インデクスデータが格納された文書インデクスDB(データベース)107、ランキングモデルのデータが格納されたランキングモデルDB103、最適モデルのデータが格納された最適モデルDB106、クエリ処理手段としてのクエリ処理部150、検索スコア計算手段としての検索スコア計算部160および検索結果提示手段としての検索結果提示部170を備えている。
図1の最適モデルDB106は、図2に示すクエリ表現DB101、ランキングモデルDB103および変換行列DB105に格納されている各データに基づいて、最適モデルDB作成手段としての最適モデルDB作成部140の処理によって構築される。
図1のランキングモデルDB103は、図3に示す訓練データDB102に格納されているデータに基づいて、ランキング関数生成手段としてのランキング関数生成部110の処理によって構築される。
図2の変換行列DB105は、図3に示すクエリ表現DB101、訓練データDB102、ランキングモデルDB103および訓練時最適モデルDB104に格納される各データに基づいて、ランキング関数生成部110、訓練時最適モデル選択手段としての訓練時最適モデル選択部120および距離学習手段としての距離学習部130の各処理によって構築される。
尚、図3のランキングモデルDB103、訓練時最適モデルDB104,ランキング関数生成部110、訓練時最適モデル選択部120および距離学習部130によって変換行列生成装置115を構成している。
図1〜図3に示す文書検索装置100は、例えばコンピュータにより構成され、通常のコンピュータのハードウェアリソース、例えばROM、RAM、CPU、入力装置、出力装置、表示装置、通信インターフェース、ハードディスク、記録媒体およびその駆動装置を備えている。
このハードウェアリソースとソフトウェアリソース(OS、アプリケーションなど)との協働の結果、文書検索装置100は、図1〜図3に示すように、クエリ表現DB101、訓練データDB102、ランキングモデルDB103、訓練時最適モデルDB104、変換行列DB105、最適モデルDB106、文書インデクスDB107、ランキング関数生成部110、訓練時最適モデル選択部120、距離学習部130、最適モデルDB作成部140、クエリ処理部150、検索スコア計算部160および検索結果提示部170を実装する。
前記クエリ表現DB101、訓練データDB102、ランキングモデルDB103、訓練時最適モデルDB104、変換行列DB105、最適モデルDB106、文書インデクスDB107は、ハードディスクあるいはRAMなどの保存手段・記憶手段に構築されているものとする。
次に、上記のように構成された装置の詳細を説明する。
まず図3において、変換行列生成装置115は、クエリ表現DB101と、訓練データDB102を入力として受け取り、変換行列DB105を生成する。訓練データDB102のデータ構造の例を表1に示す。
Figure 2012173794
この例では、N個のクエリに対する検索結果(文書)それぞれに対して、適合度が付与された訓練データを表している。各行が、当該クエリに対するある文書の適合度と特徴表現を表している。文書は、この例においてはM個の特徴によって表現され、M次元のベクトルを用いて表すことができる。
<ランキング関数生成部110>
ランキング関数生成部110は、訓練データDB102を入力として受け取り、ランキングモデルDB103を生成する。ランキング関数生成部110には、例えば非特許文献3の技術を用いることができる。ランキングモデルDB103のデータ構造の例を表2に示す。
Figure 2012173794
表2において、i番目の行がクエリqiの訓練データをランキング関数生成部110に入力し、得られたランキングモデルを表している。表2は、N個のクエリそれぞれに対するランキングモデルの例である。ランキングモデルは入力された文書の特徴表現に対する重みとして表現することができる。すなわち、表2の例においてwiが表1のxiに対する重みを表している。文書がM次元の特徴表現xで表す場合、ランキングモデルも同様にM次元の重みwで表すことができる。
<訓練時最適モデル選択部120>
訓練時最適モデル選択部120は、訓練データDB102とランキングモデルDB103を入力として受け取り、図4のステップS121〜S124に示す処理を行って訓練時最適モデルDB104を出力する。
前記訓練時最適モデル選択部120が内部で利用するデータ構造の例を表3に示し、訓練時最適モデル選択部120が出力する訓練時最適モデルDB104のデータ構造の例を表4に示す。
Figure 2012173794
Figure 2012173794
まず図4のステップS121において、訓練データDB102から未処理のクエリqを取得する。
次にステップS122において、ランキングモデルDB103に含まれる全てのランキングモデルについて、最大の評価値(検索評価指標値)を与えるクエリpを決定する。
次にステップS123において、訓練時最適モデルDB104にクエリp(例えば表4の最適モデルのクエリID)とq(例えば表4のクエリID)を出力する。
そしてステップ124において、訓練データDB102内の全てのクエリの処理が終わるまでステップS121〜S123の処理を繰り返し実行する。
例えば、各クエリ毎に当該クエリを除いた検索評価指標が大きい最上位のクエリの訓練データを用いることができる。ここで検索評価指標は、MAP(Mean Average Precision)やNDCG(Normalized Discounted Cumulative Gain)などを用いることができる。以降、説明のため検索評価指標にはMAPを用いることとする。
上記のような処理によって、訓練データ(訓練データDB102)における最高精度を示すランキングモデルの結果を生成する。表3の例では、クエリq1に対して、クエリq2を用いて生成されたランキングモデルによって0.7のMAP値、クエリqNを用いて生成されたランキングモデルによって0.4のMAP値が得られたことを表している。
<距離学習部130>
距離学習部130では、クエリ表現DB101と訓練時最適モデルDB104を入力として受け取り、変換行列DB105を出力する。クエリ表現DB101のデータ構造例を表5、変換行列DB105のデータ構造例を表6に示す。
Figure 2012173794
Figure 2012173794
表5の例では、クエリ表現DB101はN個のクエリの特徴表現を格納しており、あるクエリにおけるfiの値が、当該クエリのi番目の特徴の値を示している。この例では、各クエリがM次元の特徴で表現されている。
クエリqiのクエリ表現ベクトルをxi、クエリqjのクエリ表現ベクトルをxjとすると、ふたつのクエリ表現ベクトルの距離は、
Figure 2012173794
を用いて算出することができる。ここで変換行列AはM次元の特徴空間をM次元の特徴空間に写像するM次元正方行列で、A=Iとする場合、ユークリッド距離となる。
表3の例では、q1に対しては、q2を用いて生成されたランキングモデルが最も高いMAP値を示したため、q1のクエリ表現ベクトルx1と、q2のクエリ表現ベクトルx2の距離を小さくするように変換行列Aの学習を行う。このように全てのクエリqi(i=1...N)について最良の結果を示すランキングモデルを選択し、選択されたクエリと当該クエリの距離が最小となるように変換行列の生成を行う。この変換行列Aの生成には、例えば非特許文献4の技術を用いることができる。
次に図2の最適モデルDB作成装置の詳細を説明する。
<最適モデルDB作成部140>
最適モデルDB作成部140は、図3の変換行列生成装置115によって生成された変換行列DB105と、クエリ表現DB101、ランキングモデルDB103を各々入力とし、図5のステップS141〜S146に示す処理を行なって最適モデルDB106を出力する。
最適モデルDB106のデータ構造の例を表7に示す。
Figure 2012173794
尚表7は、訓練時最適モデルDB104のクエリ数Nよりも多い件数のクエリqN+Lについて最適モデルを出力した例を示している。このようにqN+L個の最適モデルを構築することにより、後述の文書検索処理時における入力クエリ数がqNよりも多い場合にも対処できる。
まず図5のステップS141において、クエリ表現DB101から未処理のクエリqを取得する。
次にステップS142において、クエリ表現DB101に含まれる各クエリについて、変換行列DB105を利用して類似度dを計算する。
次にステップS143において、最大の類似度dを持つクエリpを選択する。
次にステップS144において、ランキングモデルDB103から、前記選択されたクエリpに相当するランキングモデルwを取得する。
次にステップS145において、クエリqに対する最適モデルを前記取得されたwとして最適モデルDB106に出力する。
そしてステップS146において、クエリ表現DB101内の全てのクエリの処理が終わるまでステップS141〜S146の処理を繰り返し実行する。
次に図1の文書検索装置100の詳細を図6のフローチャートとともに説明する。
<クエリ処理部150>
クエリ処理部150は、検索クエリを入力として受け取り、該検索クエリを含む検索結果集合(文書)を文書インデクスDB107から取得し、該検索結果集合と複数のスコア要因とでスコア要因値行列を算出する(ステップS150)。
具体的には、M個のスコア要因を用いて、文書インデクスDB107からN件の検索結果集合を取得した際、そのスコア要因値行列は、
Figure 2012173794
と表現する。ここで、Dのi行目がi番目の検索結果のスコア要因値を表している。例えば、d23は、2番目の文書に対する3番目のスコア要因値である。
<検索スコア計算部160>
検索スコア計算部160は、クエリ処理部150が出力したスコア要因値行列D、ランキングモデルDB103のデータ、最適モデルDB106のデータ、および入力された検索クエリqinputを各々入力として受け取る。
検索スコア計算部160は、最適モデルDB106から、入力された検索クエリqinputに対応する最適モデルのクエリIDqbestを取得し、当該最適モデルのクエリの重みw(スコア要因重み)をランキングモデルDB103から取得し、該スコア要因重みとスコア要因値行列Dを元に検索スコアベクトルを計算する(ステップS160)。
検索ランキングに用いるための検索スコアベクトルsは、スコア要因値行列Dと、スコア要因重みw(qbest)の積によって得られる。
Figure 2012173794
すなわちi番目の文書に対する検索スコアsiは、
Figure 2012173794
によって算出する。
<検索結果提示部170>
検索結果提示部170は、検索スコアベクトルsを受け取り、検索スコアsiの降順に、クエリに対する検索結果を提示する(表示、又はデータとして出力する)(ステップS170)。
また、本実施形態のランキングモデル選択機能を有する文書検索装置における各手段の一部もしくは全部の機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行して本発明を実現することができること、本実施形態のランキングモデル選択機能を有する文書検索方法における手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータに実行させることができることは言うまでもなく、コンピュータでその機能を実現するためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えばFD(Floppy(登録商標) Disk)や、MO(Magneto−Optical disk)、ROM(Read Only Memory)、メモリカード、CD(Compact Disk)−ROM、DVD(Digital Versatile Disk)−ROM、CD−R、CD−RW、HDD、リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。また、上記のプログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。
100…文書検索装置
101…クエリ表現DB
102…訓練データDB
103…ランキングモデルDB
104…訓練時最適モデルDB
105…変換行列DB
106…最適モデルDB
107…文書インデクスDB
110…ランキング関数生成部
120…訓練時最適モデル選択部
130…距離学習部
140…最適モデルDB作成部
150…クエリ処理部
160…検索スコア計算部
170…検索結果提示部

Claims (3)

  1. N個のクエリ各々に対してM次元の特徴で表現したクエリ表現データが格納されたクエリ表現データベースと、
    N個のクエリに対する文書の検索結果の適合度と、M次元のベクトルで表される特徴表現とを有した訓練データが格納された訓練データデータベースと、
    前記訓練データを入力とし、各クエリの前記特徴表現に対する重みを保持したランキングモデルを生成してランキングモデルデータベースを構築するランキング関数生成手段と、
    前記訓練データおよびランキングモデルを入力とし、前記ランキングモデルデータベース内の全モデルに対して最大の検索評価指標値を与えて、訓練データにおける最高精度を示す訓練時最適ランキングモデルを生成し、該訓練時最適ランキングモデルのクエリと前記訓練データのクエリの対のデータを有した訓練時最適モデルデータベースを構築する訓練時最適モデル選択手段と、
    前記クエリ表現データベースと訓練時最適モデルデータベースの各データを入力とし、クエリ表現データベース内のクエリと、該クエリに相当する前記訓練時最適モデルデータベース内の訓練時最適ランキングモデルのクエリとの距離が最小となる変換行列を学習して生成し、変換行列データベースを構築する距離学習手段と、
    前記クエリ表現データベース、ランキングモデルデータベースおよび変換行列データベースの各データを入力とし、クエリ表現データベース内の各クエリについて、前記変換行列を利用して各クエリ間の類似度を計算し、最大の類似度を持つクエリを選択し、該選択されたクエリのランキングモデルを前記ランキングモデルデータベースから取得し、該取得されたランキングモデルをクエリに対する最適モデルとして最適モデルデータベースを構築する最適モデルデータベース作成手段と、
    予めWebページから収集した文書を基に作成された文書インデクスが格納された文書インデクスデータベースと、
    入力された検索クエリに対する検索結果集合を前記文書インデクスデータベースから取得し、該検索結果集合と複数のスコア要因とでスコア要因値行列を算出するクエリ処理手段と、
    前記クエリ処理手段で算出されたスコア要因値行列と、前記ランキングモデルデータベースおよび最適モデルデータベースの各データとを入力とし、前記入力された検索クエリに対応する最適モデルを前記最適モデルデータベースから取得し、該取得された最適モデルのクエリに対応する前記ランキングモデルデータベース内のランキングモデルとしての重みと、前記スコア要因値行列とを積算して検索スコアベクトルを計算する検索スコア計算手段と、
    前記検索スコア計算手段により計算された検索スコアの降順に入力クエリに対する検索結果を提示する検索結果提示手段と、
    を備えたことを特徴とするランキングモデル選択機能を有する文書検索装置。
  2. ランキング関数生成手段が、N個のクエリに対する文書の検索結果の適合度と、M次元のベクトルで表される特徴表現とを有した訓練データが格納された訓練データデータベース内の訓練データを入力とし、各クエリの前記特徴表現に対する重みを保持したランキングモデルを生成してランキングモデルデータベースを構築するランキング関数生成ステップと、
    訓練時最適モデル選択手段が、前記訓練データおよびランキングモデルを入力とし、前記ランキングモデルデータベース内の全モデルに対して最大の検索評価指標値を与えて、訓練データにおける最高精度を示す訓練時最適ランキングモデルを生成し、該訓練時最適ランキングモデルのクエリと前記訓練データのクエリの対のデータを有した訓練時最適モデルデータベースを構築する訓練時最適モデル選択ステップと、
    距離学習手段が、N個のクエリ各々に対してM次元の特徴で表現したクエリ表現データが格納されたクエリ表現データベースと前記訓練時最適モデルデータベースの各データを入力とし、クエリ表現データベース内のクエリと、該クエリに相当する前記訓練時最適モデルデータベース内の訓練時最適ランキングモデルのクエリとの距離が最小となる変換行列を学習して生成し、変換行列データベースを構築する距離学習ステップと、
    最適モデルデータベース作成手段が、前記クエリ表現データベース、ランキングモデルデータベースおよび変換行列データベースの各データを入力とし、クエリ表現データベース内の各クエリについて、前記変換行列を利用して各クエリ間の類似度を計算し、最大の類似度を持つクエリを選択し、該選択されたクエリのランキングモデルを前記ランキングモデルデータベースから取得し、該取得されたランキングモデルをクエリに対する最適モデルとして最適モデルデータベースを構築する最適モデルデータベース作成ステップと、
    クエリ処理手段が、入力された検索クエリに対する検索結果集合を、予めWebページから収集した文書を基に作成された文書インデクスが格納された文書インデクスデータベースから取得し、該検索結果集合と複数のスコア要因とでスコア要因値行列を算出するクエリ処理ステップと、
    検索スコア計算手段が、前記クエリ処理手段で算出されたスコア要因値行列と、前記ランキングモデルデータベースおよび最適モデルデータベースの各データとを入力とし、前記入力された検索クエリに対応する最適モデルを前記最適モデルデータベースから取得し、該取得された最適モデルのクエリに対応する前記ランキングモデルデータベース内のランキングモデルとしての重みと、前記スコア要因値行列とを積算して検索スコアベクトルを計算する検索スコア計算ステップと、
    検索結果提示手段が、前記検索スコア計算手段により計算された検索スコアの降順に入力クエリに対する検索結果を提示する検索結果提示ステップと、
    を備えたことを特徴とするランキングモデル選択機能を有する文書検索方法。
  3. コンピュータを請求項1に記載の各手段として機能させるランキングモデル選択機能を有する文書検索プログラム。
JP2011032317A 2011-02-17 2011-02-17 ランキングモデル選択機能を有する文書検索装置、ランキングモデル選択機能を有する文書検索方法およびランキングモデル選択機能を有する文書検索プログラム Expired - Fee Related JP5432936B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011032317A JP5432936B2 (ja) 2011-02-17 2011-02-17 ランキングモデル選択機能を有する文書検索装置、ランキングモデル選択機能を有する文書検索方法およびランキングモデル選択機能を有する文書検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011032317A JP5432936B2 (ja) 2011-02-17 2011-02-17 ランキングモデル選択機能を有する文書検索装置、ランキングモデル選択機能を有する文書検索方法およびランキングモデル選択機能を有する文書検索プログラム

Publications (2)

Publication Number Publication Date
JP2012173794A true JP2012173794A (ja) 2012-09-10
JP5432936B2 JP5432936B2 (ja) 2014-03-05

Family

ID=46976678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011032317A Expired - Fee Related JP5432936B2 (ja) 2011-02-17 2011-02-17 ランキングモデル選択機能を有する文書検索装置、ランキングモデル選択機能を有する文書検索方法およびランキングモデル選択機能を有する文書検索プログラム

Country Status (1)

Country Link
JP (1) JP5432936B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015039106A (ja) * 2013-08-19 2015-02-26 株式会社日立製作所 生体署名システム
JP2017225194A (ja) * 2017-09-25 2017-12-21 株式会社日立製作所 ベクトル変換システム及びベクトル変換方法
JP2021071957A (ja) * 2019-10-31 2021-05-06 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
CN114201581A (zh) * 2021-11-29 2022-03-18 中国科学院深圳先进技术研究院 一种基于对比学习的长文本检索模型
CN114547251A (zh) * 2022-02-28 2022-05-27 陕西师范大学 基于bert的两阶段民间故事检索方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006301920A (ja) * 2005-04-20 2006-11-02 Fujitsu Ltd 文書分類プログラム、文書分類方法および文書分類装置
JP2007018389A (ja) * 2005-07-08 2007-01-25 Just Syst Corp データ検索装置、データ検索方法、データ検索プログラムおよびコンピュータに読み取り可能な記録媒体
JP2009528627A (ja) * 2006-02-27 2009-08-06 マイクロソフト コーポレーション 伝搬されるドキュメントの関連性を用いたランキング機能のトレーニング
JP2010033377A (ja) * 2008-07-29 2010-02-12 Yahoo Japan Corp Webクエリに対する検索要求属性を自動推定する検索装置、検索方法及びプログラム
JP2010061420A (ja) * 2008-09-04 2010-03-18 Yahoo Japan Corp 商品情報検索装置、方法及びシステム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006301920A (ja) * 2005-04-20 2006-11-02 Fujitsu Ltd 文書分類プログラム、文書分類方法および文書分類装置
JP2007018389A (ja) * 2005-07-08 2007-01-25 Just Syst Corp データ検索装置、データ検索方法、データ検索プログラムおよびコンピュータに読み取り可能な記録媒体
JP2009528627A (ja) * 2006-02-27 2009-08-06 マイクロソフト コーポレーション 伝搬されるドキュメントの関連性を用いたランキング機能のトレーニング
JP2010033377A (ja) * 2008-07-29 2010-02-12 Yahoo Japan Corp Webクエリに対する検索要求属性を自動推定する検索装置、検索方法及びプログラム
JP2010061420A (ja) * 2008-09-04 2010-03-18 Yahoo Japan Corp 商品情報検索装置、方法及びシステム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015039106A (ja) * 2013-08-19 2015-02-26 株式会社日立製作所 生体署名システム
JP2017225194A (ja) * 2017-09-25 2017-12-21 株式会社日立製作所 ベクトル変換システム及びベクトル変換方法
JP2021071957A (ja) * 2019-10-31 2021-05-06 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
JP7464814B2 (ja) 2019-10-31 2024-04-10 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
CN114201581A (zh) * 2021-11-29 2022-03-18 中国科学院深圳先进技术研究院 一种基于对比学习的长文本检索模型
CN114547251A (zh) * 2022-02-28 2022-05-27 陕西师范大学 基于bert的两阶段民间故事检索方法
CN114547251B (zh) * 2022-02-28 2024-03-01 陕西师范大学 基于bert的两阶段民间故事检索方法

Also Published As

Publication number Publication date
JP5432936B2 (ja) 2014-03-05

Similar Documents

Publication Publication Date Title
US8761512B1 (en) Query by image
Smirnova et al. A user-oriented model for expert finding
KR101426765B1 (ko) 협업 파트너 검색 서비스를 제공하는 시스템 및 방법
Sheth Semantic Services, Interoperability and Web Applications: Emerging Concepts: Emerging Concepts
EP2774061A1 (en) Method and apparatus of ranking search results, and search method and apparatus
JP5432936B2 (ja) ランキングモデル選択機能を有する文書検索装置、ランキングモデル選択機能を有する文書検索方法およびランキングモデル選択機能を有する文書検索プログラム
JP6308708B1 (ja) 特許要件適否予測装置および特許要件適否予測プログラム
JP6123143B1 (ja) 特許要件適否予測装置および特許要件適否予測プログラム
CN108986872B (zh) 用于大数据电子病历约简的多粒度属性权重Spark方法
JP4711761B2 (ja) データ検索装置、データ検索方法、データ検索プログラムおよびコンピュータに読み取り可能な記録媒体
JP5497105B2 (ja) 文書検索装置および方法
CN110046713A (zh) 基于多目标粒子群优化的鲁棒性排序学习方法及其应用
JP2020091857A (ja) 電子文書の分類
JP2016018286A (ja) 行動タイプ判定装置、行動タイプ判定方法及び行動タイプ判定プログラム
JP4931111B2 (ja) 文書分類装置及びプログラム
CN116932730A (zh) 基于多叉树和大规模语言模型的文档问答方法及相关设备
Chen et al. Overview of the NTCIR-16 session search (SS) task
JP6976178B2 (ja) 抽出装置、抽出方法、及び抽出プログラム
Tran et al. Dense retrieval with entity views
JP2005092442A (ja) 多次元空間モデル表現装置および多次元空間モデル表現方法
JP5486667B2 (ja) クエリ結果を多様化するための方法および装置
KR101592670B1 (ko) 인덱스를 이용하는 데이터 검색 장치 및 이를 이용하는 방법
JP6232358B2 (ja) 次発話候補ランキング装置、方法、及びプログラム
JP5284761B2 (ja) 文書検索装置及び方法及びプログラム及びプログラムを記録した記録媒体
JP5820784B2 (ja) 検索結果出力装置、検索結果出力方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131206

R150 Certificate of patent or registration of utility model

Ref document number: 5432936

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees