JP5292322B2 - 文書検索方法、文書検索装置、文書検索プログラム - Google Patents

文書検索方法、文書検索装置、文書検索プログラム Download PDF

Info

Publication number
JP5292322B2
JP5292322B2 JP2010012675A JP2010012675A JP5292322B2 JP 5292322 B2 JP5292322 B2 JP 5292322B2 JP 2010012675 A JP2010012675 A JP 2010012675A JP 2010012675 A JP2010012675 A JP 2010012675A JP 5292322 B2 JP5292322 B2 JP 5292322B2
Authority
JP
Japan
Prior art keywords
explanation
word
document
score
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010012675A
Other languages
English (en)
Other versions
JP2011150611A (ja
Inventor
宜仁 安田
由美子 松浦
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010012675A priority Critical patent/JP5292322B2/ja
Publication of JP2011150611A publication Critical patent/JP2011150611A/ja
Application granted granted Critical
Publication of JP5292322B2 publication Critical patent/JP5292322B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、電子文書群中からユーザが投入した検索語(クエリ)を含む電子文書を検索する文書検索の技術に関する。
現在、インターネット上に公開された電子文書(Webページ)群からユーザの必要とする電子文書を的確に検索する検索エンジンの重要性が高まっている。
概略を説明すれば、例えばロボット型検索エンジンでは、クローラ(ロボット・スパイダー)を用いてWWW(World Wide Web)上に存在する電子文書を収集し、収集した各電子文書の文書索引(文書インデックス)を作成しておく。作成した文書索引に基づきユーザが端末を通じて投入した検索語(クエリ)を含む電子文書を検索し、該各電子文書をランキング順に並べ替えた検索結果をユーザの端末に返信する。このランキングは、例えば非特許文献1に示すように、検索語と電子文書との関連性および電子文書自体の重要性などを組み合わせて算出されたスコアに従って決定されている。
竹野 浩,井上 孝史 「分散型高速情報収集/全文検索システム InfoBee/Evangelist」 NTT R&D,vol.52,No.2 2003,pp78−84
しかしながら、従来の検索エンジンは、スコア算出にあたって検索対象の電子文書の難易度あるいは専門度などを考慮していないため、ユーザが検索語について分かり易い電子文書を探している場合や、逆に専門的な電子文書を探している場合などにユーザの期待する電子文書が上位にランキングされず、ユーザの希望に沿った検索結果が得られないおそれがある。
本発明は、上述のような従来技術の問題点を解決するためになされたものであり、ユーザ希望の専門性や難易度に沿った検索結果を提示することを解決課題としている。
そこで、本発明は、通常のキーワード検索に加えて、事前に準備された説明スコアと単語専門度を用いて、ユーザ希望の専門度(難易度)に沿った文書検索を行う。本発明の一態様は、電子文書群中からユーザ入力の検索語を含む電子文書を検索し、該検索語に対する専門度・難易度のランキング要求を示すユーザ入力の要求専門度方向性に応じた検索結果を求める文書検索方法であって、説明スコア算出手段が、事前に検索対象の各電子文書に含まれる単語間の説明関係に基づき被説明単語に対する説明単語の説明スコアを算出しておく説明スコア算出ステップと、文書専門度算出手段が、検索結果として特定された各電子文書の検索語に対する専門度を、少なくとも検索語を被説明単語としたときの説明単語の説明スコアと、該説明単語に対して事前に定められた専門度とに基づき推定する文書専門度推定ステップと、スコア決定手段が、前記要求専門度方向性にしたがって前記文書専門度推定ステップの推定結果を前記特定された各電子文書のランキングスコアの決定に反映させるスコア決定ステップと、を有する。
本発明の他の態様は、電子文書群中からユーザ入力の検索語を含む電子文書を検索し、該検索語に対する専門度・難易度のランキング要求を示すユーザ入力の要求専門度方向性に応じた検索結果を求める文書検索装置であって、事前に検索対象の各電子文書に含まれる単語間の説明関係に基づき被説明単語に対する説明単語の説明スコアを算出する説明スコア算出手段と、検索結果として特定された各電子文書の検索語に対する専門度を、少なくとも検索語を被説明単語としたときの説明単語の説明スコアと、該説明単語に対して事前に定められた専門度とに基づき推定する文書専門度推定手段と、前記要求専門度方向性にしたがって前記文書専門度推定ステップの推定結果を前記特定された各電子文書のランキングスコアの決定に反映させるスコア決定手段と、を備える。
なお、本発明は、前記装置としてコンピュータを機能させるプログラムの態様としてもよい。このプログラムは、ネットワークや記録媒体などを通じて提供することができる。
本発明によれば、ユーザの希望する専門性(難易度)に沿った検索結果が提示される。
本発明の実施形態に係る文書検索装置の構成図。 同 前処理部の文字列パターン例。
図1に基づき本発明の実施形態に係る文書検索装置を説明する。ここでは文書検索装置1は、図示省略のユーザ端末(例えばパーソナルコンピュータや携帯電話など)とインターネット経由で接続されているものとする。
文書検索装置1は、ユーザ端末から検索指示された検索語に基づき電子文書群の検索処理を行う検索エンジンのシステムを構成し、通常のコンピュータのハードウェアリソース、例えばCPU、メモリ(RAM)、ハードディスクドライブ装置、通信デバイスなどを備える。このハードウェアリソースとソフトウェアリソース(OS,アプリケーションなど)との協働の結果、WWW上から収集した電子文書群(文書集合S)に対して検索処理の事前準備を行う前処理部2と、検索エンジンの検索処理を行う検索処理部3と、を実装する。
前処理部2は、文書集合Sが与えられたときに文書索引(文書インデックス)を生成する文書索引作成部4と、文書集合Sの各電子文書内に出現する各単語間の説明関係に基づき被説明単語に対する説明単語の説明スコアを算出する説明スコア算出部5と、を備える。この文書索引作成部3の生成結果は文書索引DB6に保存され、説明スコア算出部5の算出結果は単語−説明単語DB7に保存される。なお、文書集合Sの各電子文書内に出現する各単語は、予めその専門度が単語専門度DB8に保存されている。この各DB6〜8は、ハードディスクドライブ装置あるいはメモリ(RAM)などの保存・記憶手段に構築される。
検索処理部3には、ユーザ端末から送信された検索語および該検索語に対する専門度・難易度のランキング要求を示す要求専門度方向性が入力され、文書索引DB6の保存データに基づき検索語を含む電子文書群の検索結果を特定する文書集合特定部9と、該文書集合特定部9で検索結果として特定された各電子文書の専門性を前記各DB7.8の保存データに基づき推定する文書専門度推定部10と、該文書専門度推定部10の推定結果を前記要求専門度にしたがって前記特定された各電子文書のランキングスコア決定に反映させるスコア決定部11と、を備えている。
文書専門度推定部10は、検索語を被説明単語に置き換えて単語−説明単語DB7から取得した各説明単語の説明スコアと、前記DB8から取得した検索語の専門度と、前記特定された各電子文書内における検索語の出現回数との乗算和に基づき前記専門度を推定する。
スコア決定部11は、文書専門度推定部10の推定結果を前記要求専門度にしたがって前記特定された各電子文書のランキングスコア決定に反映させるため、ユーザの希望する専門性の電子文書が上位にランキングされる。このランキング順に前記特定された各電子文書をソートした検索結果が、最終的にユーザ端末に返信されるため、ユーザ希望の専門度を考慮した検索結果が提示される。以下、前記各処理部2.3を構成する機能ブロック4〜11の詳細を説明する。
≪前処理部2≫
(1)文書索引作成部4
文書索引作成部4は、矢印Aに示すように、WWWからクローラを用いて収集した文書集合Sが与えられ、与えられた各電子文書の文書索引を作成する(文書索引作成ステップ)。この文書索引は、文書集合Sの各電子文書に出現したすべての単語に対して作成され、単語をキーとして該単語が出現する電子文書の番号および該電子文書内での単語出現回数を格納するものとする。文書索引の作成には一般的な転置インデックスの作成処理を利用することができる。作成された文書索引は、矢印Bに示すように、前記DB6に保存される。
(2)説明スコア算出部5
説明スコア算出部5は、矢印Cに示すように、文書集合Sが与えられると該文書集合Sの各電子文書を解析する。ここでは各電子文書内に出現したすべての単語を対象単語、即ち被説明単語とし、該被説明単語を説明するための説明単語を求め、スコア付けを行う(説明スコア算出ステップ)。
詳細を説明すれば、まず各電子文書中で被説明単語wtの周辺に出現した各単語を説明単語候補wcとし、あらかじめ定義された説明関係を示す基準(a)〜(d)に応じて各説明単語候補wcの説明サブスコアEa(wt,wc)、Eb(wt,wc)、Ec(wt,wc)、Ed(wt,wc)を算出する。この各基準を以下に説明する。
(a)係り受け解析結果の係り元になるか否か
説明単語候補wcが、被説明単語wtの係り元として出現している場合には説明サブスコアEa(wt,wc)を算出する。説明サブスコアEa(wt,wc)の算出には式1を用いる。
式1:Ea(wt,wc)=文書集合Sの全体において説明単語候補wcが被説明単語wtの係り元になった回数/文書集合Sの全体において説明単語wcが任意の単語の係り元になった回数
(b)説明単語候補wcが被説明単語wtの前後に出現するか否か
説明単語候補wcが、被説明単語wtの前後に出現している場合には説明サブスコアEb(wt,wc)を算出する。説明サブスコアEb(wt,wc)の算出には式2を用いる。
式2:Eb(wt,wc)=文書集合Sの全体において説明単語候補wcが被説明単語wtの前後に出現した回数/文書集合Sの全体において説明単語候補wcが出現した回数
(c)被説明単語wtの直後の括弧内に説明単語候補wcが含まれているか否か
説明単語候補wcが、被説明単語wtの直後に存在する括弧内に含まれている場合には説明サブスコアEc(wt,wc)を算出する。説明サブスコアEc(wt,wc)の算出には式3を用いる。
式3:Ec(wt,wc)=文書集合Sの全体において説明単語候補wcが被説明単語wtの直後の括弧内に含まれていた回数/文書集合Sの全体において説明単語候補wcが括弧内に出現した回数
(d)事前に定めた文字列パターンに該当するか否か
説明単語候補wcが、被説明単語wtを対象とした図2の文字列パターンなどに該当する場合には説明サブスコアEd(wt,wc)を算出する。説明サブスコアEd(wt,wc)の算出には式4を用いる。
式4:Ed(wt,wc)=文書集合Sの全体において被説明単語wtに対して説明単語候補wcが文字列パターンにマッチした回数/文書集合Sの全体において任意の単語に対して説明単語候補wcが文字列パターンにマッチした回数
つぎに説明単語候補wcの被説明単語wtに対する説明スコアE(wt,wc)を、説明サブスコアEa(wt,wc)、Eb(wt,wc)、Ec(wt,wc)、Ed(wt,wc)の重みつき和によって算出する。具体的には、各説明単語候補wcの被説明単語wtに対する説明スコアE(wt,wc)は、式5を用いて算出される。
式5:E(wt,wc)=kea・Ea(wt,wc)+keb・Eb(wt,wc)+kec・Ec(wt,wc)+ked・Ed(wt,wc)
式5中の「kea」、「keb」、「kec」、「ked」は、事前に定めた各サブスコアの重みを示す定数を示している。このように算出された説明スコアE(wt,wc)の値が「0」でなければ、該説明単語候補wtを被説明単語wcに対する説明単語とみなし、矢印Dに示すように、説明スコアE(wt,wc)とペアにして前記DB7に保存する。
Figure 0005292322
表1は、前記DB7の保存データ例を示している。ここでは前記説明スコア算出部5で処理された説明単語の集合が被説明単語毎に保存されている。この説明単語の集合は、各説明単語とその説明スコアとをペアに保持している。なお、前記DB7には、必ずしもすべての説明単語を保存する必要は無く、例えば処理の高速化のため、説明スコアの高い上位の説明単語のみを保存してもよい。
(3)単語専門度DB8
単語専門度DB8には、対象単語、即ち文書集合Sを構成する各電子文書に含まれる単語自体がどの程度専門的な語かを数値化した専門性スコアが保存されている。表2は、前記単語専門度DB8の保存データ例を示している。
Figure 0005292322
専門性スコアとしては、情報検索の分野で一般的に利用されている式6のIDF値を用いることができる。
式6:単語tのIDF=log(文書集合内の文書総数/t(単語)が出現した文書の総数)
≪検索処理部3≫
検索処理部3の処理は、ユーザの検索処理命令に基づき開始される。ここでは検索処理部3は、前記ユーザ端末のブラウザに検索画面を表示させる。この検索画面には、ユーザ希望の検索語(クエリ)と該検索語に対する専門度・難易度のランキング要求を示す要求専門度方向性とが入力可能なものとする。
この要求専門度方向性は、(a)検索語について専門度の高い順に並べて欲しいのか、(b)専門度を考慮せずに通常の検索として並べて欲しいのか、(c)検索語についての専門度の低い順、即ち検索語について分かり易い順に並べて欲しいのかを示すものとする。
具体的には、ユーザは、ユーザ端末のブラウザに表示された検索画面に検索語Qwと、検索語Qwに対する要求専門度方向性Qo(∈{−1,0,+1})を入力・送信し、前記検索処理部3に検索命令を指示するものとする。ここでは「Qo=−1」は検索語について分かり易い順に並べて欲しいことを示し、「Qo=0」は専門度を考慮せずに通常の検索として並べて欲しいことを示し、「Qo=+1」は検索語について専門度の高い順に並べて欲しいことを示す値とする。なお、検索処理部3は、ユーザ端末から受信した検索語Qwと要求専門度方向性Qo(∈{−1,0,+1})とを文書集合検索部9に送るものとする。
(1)文書集合特定部9
文書集合特定部9は、ユーザ端末から送信された検索語Qwに基づき通常の検索エンジンの検索処理を実施する。すなわち、文書索引DB6内を検索し、矢印Eに示すように、検索語Qwが少なくとも1度は出現する電子文書の文書集合を特定する(文書集合特定ステップ)。ここでは一般的な転置インデックスを利用した文書集合の特定方法を用いることができる。
検索結果として特定された文書集合と検索語Qwとは、矢印Fに示すように、文書専門度推定部10に送られる一方、前記特定された文書集合・検索語Qw・要求専門度方向性Qo(∈{−1,0,+1})は、矢印Jに示すように、スコア決定部11に送られる。
(2)文書専門度推定部10
文書専門度推定部10は、文書集合検索部9から送られた文書集合と検索語Qwを処理対象とし、前記各DB7.8を参照して該各電子文書の検索語Qwに対する専門度を推定する(文書専門度推定ステップ)。
ここで文書dの専門度推定例を説明すれば、まず検索語Qwを被説明単語に置き換えて単語−説明単語DB7の保存データを探索し、検索語Qwの説明単語集合TEを特定する。また、特定した説明単語集合TE内の各要素、即ち各説明単語te∈TEの検索語Qwに対する説明スコアE(Qw,te)を取得する。
例えば検索語Qwが「微分」であれば、表1の単語−説明単語D7Bの保存データから被説明単語(対象単語)「微分」に応じた説明単語集合「TE=積分,解析,係数,傾き,...」と、その各説明スコア「E(微分,積分)=531.5、E(微分,解析)=131.5,E(微分,係数)=57.2,E(微分,傾き)=43.1,...」と、を取得する。
つぎに説明単語集合に対して、単語専門度DB8を参照して各説明単語te∈TEの専門度s(te)を取得する。例えば説明単語集合「TE=積分,解析,係数,傾き,...」のそれぞれに対して、専門度s(te)「s(積分)=10.412,s(解析)=7.357,s(係数)=9.248,s(傾き)=9.318,...」を取得する。
最後に取得した説明スコアE(Qw,te)と専門度s(te)とを用いて文書dの検索語Qwに対する専門度S(Qw,d)を推定結果として算出する。この算出には式7が用いられる。
Figure 0005292322
式7中、「te」の文書dでの出現回数は、文書DB作成部によって作成された転置インデクスを参照することができるため、文書自体を走査することなく高速に得られる。このような専門度推定処理を、文書集合検索部9から送られた文書集合の電子文書毎に実施し、それぞれの専門度を算出する。算出された各専門度を矢印Iに示すように、スコア決定部11に送られる。
(3)スコア決定部11
スコア決定部11は、文書集合・検索語Qw・要求専門度方向性Qoおよび文文書集合の各専門度とを受け取ると、受け取った各電子文書のランキングスコアを決定する(スコア決定ステップ)。
ここでは文書専門度推定部10と同様に文書dを、処理対象とするスコア決定例を説明する。スコアは、以下に示す関連度サブスコア・検索語非依存度サブスコア・専門度サブスコアの重み和によって求める。
(a)関連度サブスコア
関連度サブスコアは、検索語Qwと文書dとの関連度を示し、文書検索において一般的に利用されているTF・IDFスコアや、BM25スコアなどを用いることができる。
(b)検索語非依存度サブスコア
検索語非依存度サブスコアは、文書d自体の重要度を示し、文書検索において一般的に利用されているWWW上のリンク数に基づくスコアや、有害文書であるか否かを示すスコアなどを用いることができる。なお、検索語非依存度サブスコアは、必ずしも利用する必要は無く、該サブスコアを利用しなくともよい。利用しない場合は検索語非依存度サブスコアには「0」の値を用いる。
(c)専門度サブスコア
専門度サブスコアは、文書専門度推定部10から送られた文書dの検索語Qwに対する専門度S(Qw,d)と、文書集合検索部9から送られた要求専門度方向性Qoとを用いて、「Qo・S(Qw,d)」と定義される。
この各サブスコアから検索語Qw,要求専門度方向性Qoに対する文書dのランキングスコアを、「α・関連度サブスコア+β・検索語非依存サブスコア+γ・専門度サブスコア」として算出する。この「α」、「β」、「γ」は、事前に定めた各サブスコアの重みを示す定数である。このようなランキングスコアを電子文書毎に算出する。
ここで算出されたランキングスコア順に文書集合検索部9から送られた文書集合が並べ替えられるため、ユーザが希望する専門度・難易度の電子文書が上位にランキングされる。したがって、検索エンジンの検索処理において検索語に対するユーザ希望の専門度・難易度が検索結果のランキングに反映され、かかる検索結果が最終的にユーザ端末に送信され、ブラウザ上に表示される。
その結果、文書検索装置1によれば、ユーザが探している電子文書について、専門的な電子文書順を希望するか、あるいは分かり易い電子文書順を希望するかを要求専門度方向性の入力で指定させることにより、ユーザ希望に沿った文書検索が行われ、その検索結果がユーザに提示される。
このとき文書検索装置1では、検索処理の事前準備を通じて前記各DB7.8には検索対象(文書集合S)の各電子文書の専門度のデータが保存されているため、任意の検索語に対する専門度を算出することが可能である。また、検索処理時の専門度算出は、前記各DB6〜8の保存データ、即ち説明単語の説明スコア・専門度・単語の出現回数を計数し、その乗算和を求めるだけでよく、高速に検索を行うこともできる。
なお、本発明は、上記実施形態に限定されるものではなく、装置構成や処理内容などは各請求項に記載した範囲内で変形することができる。例えば、文書検索装置1を検索エンジンのシステムサーバではなく、社内ネットワークの文書検索用サーバとして構成することも可能である。また、説明単語と被説明単語との説明関係を示す基準は、必ずしも基準(a)〜(d)を用いる必要はなく、他の基準を用いてもよい。
≪プログラムなど≫
本発明は、文書検索装置1の各部4〜11の一部もしくは全部として、コンピュータを機能させる文書検索プログラムとして構成することもできる。このプログラムによれば、前記各ステップの一部あるいは全部をコンピュータに実行させることが可能となる。
前記プログラムは、Webサイトや電子メールなどネットワークを通じて提供することができる。また、前記プログラムは、CD−ROM,DVD−ROM,CD−R,CD−RW,DVD−R,DVD−RW,MO,HDD,BD−ROM,BR−R,BD−REなどの記録媒体に記録して、保存・配布することも可能である。この記録媒体は、記録媒体駆動装置を利用して読み出され、そのプログラムコード自体が前記実施形態の処理を実現するので、該記録媒体も本発明を構成する。
1…文書検索装置
2…前処理部
3…検索処理部
4…文書索引作成部
5…説明スコア算出部(説明スコア算出手段)
6…文書索引DB
7…単語−説明単語DB(説明データベース)
8…単語専門度DB(専門度データベース)
9…文書集合特定部
10…文書専門度推定部(文書専門度推定手段)
11…スコア決定部(スコア決定手段)

Claims (9)

  1. 電子文書群中からユーザ入力の検索語を含む電子文書を検索し、該検索語に対する専門度・難易度のランキング要求を示すユーザ入力の要求専門度方向性に応じた検索結果を求める文書検索方法であって、
    説明スコア算出手段が、事前に検索対象の各電子文書に含まれる単語間の説明関係に基づき被説明単語に対する説明単語の説明スコアを算出しておく説明スコア算出ステップと、
    文書専門度推定手段が、検索結果として特定された各電子文書の検索語に対する専門度を、少なくとも検索語を被説明単語としたときの説明単語の説明スコアと、該説明単語に対して事前に定められた専門度とに基づき推定する文書専門度推定ステップと、
    スコア決定手段が、前記要求専門度方向性にしたがって前記文書専門度推定ステップの推定結果を前記特定された各電子文書のランキングスコアの決定に反映させるスコア決定ステップと、
    を有することを特徴とする文書検索方法。
  2. 前記説明スコア算出ステップは、あらかじめ定義された説明単語と被説明単語との説明関係を示す複数の基準に応じて説明単語のサブスコアを算出し、該各サブスコアの重み和をもって説明単語の説明スコアを算出する
    ことを特徴とする請求項1記載の文書検索方法。
  3. 前記文書専門度推定ステップは、前記説明スコア算出手段の算出した説明スコアを保存する説明スコアデータベースと、前記各説明単語の専門度を保存する専門度データベースとを参照し、
    前記説明スコアデータベースに保存された説明単語の説明スコアと、前記専門度データベースに保存された該説明単語の専門度と、該説明単語の出現回数との乗算和に基づき前記推定結果を求める
    ことを特徴とする請求項1または2のいずれか1項に記載の文書検索方法。
  4. 前記スコア決定ステップは、前記要求方向性の値と前記推定結果の値とを乗じて算出したサブスコアを前記ランキングスコアに加味する
    ことを特徴とする請求項1〜3のいずれか1項に記載の文書検索方法。
  5. 電子文書群中からユーザ入力の検索語を含む電子文書を検索し、該検索語に対する専門度・難易度のランキング要求を示すユーザ入力の要求専門度方向性に応じた検索結果を求める文書検索装置であって、
    事前に検索対象の各電子文書に含まれる単語間の説明関係に基づき被説明単語に対する説明単語の説明スコアを算出する説明スコア算出手段と、
    検索結果として特定された各電子文書の検索語に対する専門度を、少なくとも検索語を被説明単語としたときの説明単語の説明スコアと、該説明単語に対して事前に定められた専門度とに基づき推定する文書専門度推定手段と、
    前記要求専門度方向性にしたがって前記文書専門度推定ステップの推定結果を前記特定された各電子文書のランキングスコアの決定に反映させるスコア決定手段と、
    を備えることを特徴とする文書検索装置。
  6. 前記説明スコア算出手段は、あらかじめ定義された説明単語と被説明単語との説明関係を示す複数の基準に応じて説明単語のサブスコアを算出し、該各サブスコアの重み和をもって説明単語の説明スコアを算出する
    ことを特徴とする請求項5記載の文書検索装置。
  7. 前記文書専門度推定手段は、前記説明スコア算出手段の算出した説明スコアを保存する説明スコアデータベースと、前記各説明単語の専門度を保存する専門度データベースとを参照し、
    前記説明スコアデータベースに保存された説明単語の説明スコアと、前記専門度データベースに保存された該説明単語の専門度と、該説明単語の出現回数との乗算和に基づき前記推定結果を求める
    ことを特徴とする請求項5または6のいずれか1項に記載の文書検索装置。
  8. 前記スコア決定手段は、前記要求方向性の値と前記推定結果の値とを乗じて算出したサブスコアを前記ランキングスコアに加味する
    ことを特徴とする請求項5〜7のいずれか1項に記載の文書検索装置。
  9. 請求項5〜請求項8のいずれか1項に記載の文書検索装置としてコンピュータを機能させるための文書検索プログラム
JP2010012675A 2010-01-25 2010-01-25 文書検索方法、文書検索装置、文書検索プログラム Expired - Fee Related JP5292322B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010012675A JP5292322B2 (ja) 2010-01-25 2010-01-25 文書検索方法、文書検索装置、文書検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010012675A JP5292322B2 (ja) 2010-01-25 2010-01-25 文書検索方法、文書検索装置、文書検索プログラム

Publications (2)

Publication Number Publication Date
JP2011150611A JP2011150611A (ja) 2011-08-04
JP5292322B2 true JP5292322B2 (ja) 2013-09-18

Family

ID=44537509

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010012675A Expired - Fee Related JP5292322B2 (ja) 2010-01-25 2010-01-25 文書検索方法、文書検索装置、文書検索プログラム

Country Status (1)

Country Link
JP (1) JP5292322B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016178337A1 (ja) * 2015-05-01 2016-11-10 ソニー株式会社 情報処理装置、情報処理方法及びコンピュータプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08235204A (ja) * 1995-02-28 1996-09-13 Canon Inc 文書検索方法及び装置
JP2001344246A (ja) * 2000-05-30 2001-12-14 Kansai Electric Power Co Inc:The 用語集データベース作成方法および電子文書検索方法
JP2004171535A (ja) * 2002-10-28 2004-06-17 Fuji Xerox Co Ltd 文書検索方法および装置並びにプログラム
JP4877930B2 (ja) * 2006-03-22 2012-02-15 株式会社リコー 文書処理装置及び文書処理方法

Also Published As

Publication number Publication date
JP2011150611A (ja) 2011-08-04

Similar Documents

Publication Publication Date Title
US11194872B2 (en) Dynamic inference graph
US10726083B2 (en) Search query transformations
RU2501078C2 (ru) Ранжирование результатов поиска с использованием расстояния редактирования и информации о документе
US8285702B2 (en) Content analysis simulator for improving site findability in information retrieval systems
US9342607B2 (en) Dynamic inference graph
US10007705B2 (en) Display of boosted slashtag results
US20180004850A1 (en) Method for inputting and processing feature word of file content
JP4746439B2 (ja) 文書検索サーバおよび文書検索方法
US20150169576A1 (en) Dynamic Search Results
JP2013196435A (ja) 検索装置、検索方法およびプログラム
JP2010097461A (ja) 文書検索装置、文書検索方法および文書検索プログラム
JP4912384B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP2003173352A (ja) 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体
JP4759600B2 (ja) 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体
JP2013054606A (ja) 文書検索装置及び方法及びプログラム
JP5358481B2 (ja) 文書検索装置、文書検索方法、文書検索プログラム
JP5292322B2 (ja) 文書検索方法、文書検索装置、文書検索プログラム
JP2011100191A (ja) 文書検索装置、文書検索方法、及び文書検索プログラム
JP5286007B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP5416552B2 (ja) ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム
JP5292336B2 (ja) 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム
JP2012027841A (ja) 検索プログラム、検索装置、検索システム、検索方法及び記録媒体
JP2009146013A (ja) コンテンツ検索方法及び装置並びにプログラム
JP2012043258A (ja) 検索システム、検索装置、検索プログラム、記録媒体及び検索方法
JP5384884B2 (ja) 情報検索装置および情報検索プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120308

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130610

R150 Certificate of patent or registration of utility model

Ref document number: 5292322

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees