JP5292336B2 - 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム - Google Patents

検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム Download PDF

Info

Publication number
JP5292336B2
JP5292336B2 JP2010035081A JP2010035081A JP5292336B2 JP 5292336 B2 JP5292336 B2 JP 5292336B2 JP 2010035081 A JP2010035081 A JP 2010035081A JP 2010035081 A JP2010035081 A JP 2010035081A JP 5292336 B2 JP5292336 B2 JP 5292336B2
Authority
JP
Japan
Prior art keywords
field
user
amount estimation
knowledge amount
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010035081A
Other languages
English (en)
Other versions
JP2011170699A (ja
Inventor
大祐 佐藤
宜仁 安田
由美子 松浦
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010035081A priority Critical patent/JP5292336B2/ja
Publication of JP2011170699A publication Critical patent/JP2011170699A/ja
Application granted granted Critical
Publication of JP5292336B2 publication Critical patent/JP5292336B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、電子文書の検索技術に関し、特にユーザの、分野ごとにおける知識量や知識の深さといった背景を推定する技術に関する。
文書検索では、ユーザが自分の探している情報を得るために、情報に関連しそうなキーワードを指定して検索を実施する。検索の精度を向上させるためには、検索を行うユーザの背景を知るための情報の獲得が重要であることが知られており、このため従来では、ユーザの指定したキーワード履歴や、閲覧した電子文書の履歴から、どの分野に関して関心があるかといった嗜好分野を推定する先行研究がなされてきた(例えば特許文献1参照)。
特開2000−148773号公報
しかし、上記のような嗜好推定では、ユーザのよく調べる情報の分野を推定できても、ユーザがその分野において、どの程度精通しているのかといったことは推定できない。
例えば、パソコンの知識が少ないユーザが、パソコンについて精通しているユーザ向けの文書を結果として与えられ、語句がわからなくて理解できないケースがある。あるいは、京都に何回も訪れたことのある旅行者が、初めて京都を観光する旅行者に対して書かれた文書を結果として与えられ、それはユーザにとって有用でない。従来技術で推定される、ユーザの嗜好分野情報の利用では、これらの問題に対処することはできない。
本発明は上記課題を解決するものであり、その目的は、検索システムのユーザのシステム利用履歴から、ユーザの分野ごとにおける知識量や知識の深さといった背景を推定することができる、検索システムユーザの分野ごとにおける知識量推定装置、方法、プログラムを提供することにある。
従来では、検索システムのユーザの検索ログを利用することによって、ユーザの嗜好に関する背景を推定するアプローチがとられていたが、本発明は、検索システムのユーザログの一部であるクエリログを利用することによって、ユーザの知識量に関する背景を推定するように構成した。
すなわち、本発明の検索システムユーザの分野ごとにおける知識量推定装置は、ユーザを特定する情報と、前記ユーザが電子文書を検索する際に入力したクエリと、前記クエリの属する分野とを対応付けて構築したユーザ−クエリ−分野データベースと、前記ユーザと、前記分野と、前記ユーザ−クエリ−分野データベース内のクエリに含まれる特殊語句に予め設定した特殊語句効果値とを対応付けて構築したユーザ−分野−特殊語句効果値データベースと、前記ユーザ−クエリ−分野データベースを参照し、あるクエリが、対象分野に属する全クエリ中に出現する頻度の逆数IQF(Inverse Query Frequency)を算出し、該頻度の逆数IQFに基づく、ユーザのある分野における第1の知識量推定要素値を算出し、ユーザ名と分野名と第1の知識量推定要素値とを対応付けた第1の知識量推定要素値データベースを作成する第1の知識量推定要素値データベース作成手段と、前記ユーザ−分野−特殊語句効果値データベースを参照し、特殊語句に基づく第2の知識量推定要素値を算出し、ユーザ名と分野名と第2の知識量推定要素値とを対応付けた第2の知識量推定要素値データベースを作成する第2の知識量推定要素値データベース作成手段と、電子文書を検索するユーザ名と分野名とを入力とし、前記入力されたユーザ名および分野名に該当する、前記第1の知識量推定要素値データベース内の第1の知識量推定要素値と、前記第2の知識量推定要素値データベース内の第2の知識量推定要素値とを加算して知識量推定値を求める知識量推定手段と、を備えたことを特徴としている。
本発明によれば、ユーザの分野ごとにおける知識量を推定し、数値として得ることが可能となる。これにより、ユーザのある分野における知識量に見合った、ユーザに、より適した情報を提供することの実現に寄与することができる。
本発明の一実施形態例の概略構成図。 本発明の一実施形態例のハードウェア構成図。 本発明の一実施形態例で構築されるクエリログデータベースの説明図。 本発明の一実施形態例で構築される語句−分野データベースの説明図。 本発明の一実施形態例で構築される特殊語句データベースの説明図。 本発明の一実施形態例で構築されるユーザ−クエリ−分野データベースの説明図。 本発明の一実施形態例で構築されるユーザ−分野−特殊語句効果値データベースの説明図。 本発明の一実施形態例で構築される知識量推定要素値C1データベースの説明図。 本発明の一実施形態例で構築される知識量推定要素値C2データベースの説明図。 本発明の一実施形態例における知識量推定要素値C1データベース作成のフローチャート。 本発明の一実施形態例における知識量推定要素値C2データベース作成のフローチャート。 本発明の一実施形態例における知識量推定部の処理のフローチャート。
以下、図面を参照しながら本発明の実施の形態を説明するが、本発明は下記の実施形態例に限定されるものではない。図1は本発明の検索システムユーザの分野ごとにおける知識量推定装置の一実施形態例を示し、図2は図1の各部の機能を達成するハードウェア構成を示している。
本実施形態例では、ユーザの検索システム利用履歴から作成されるクエリログデータベース101、語句と分野の関連をリスト化した語句‐分野データベース102、知識量を指し示すような語句とその語句が知識量の推定に与える効果をリスト化した特殊語句データベース103を用意する。
クエリログデータベース101は、図3に示すように、ユーザが検索システムを利用して電子文書を探す際に入力するクエリに関するログを使用する。これをクエリログと呼ぶ。クエリログは、打ち込まれたクエリと打ち込んだユーザを特定する情報の2つを含む。
語句−分野データベース102は、図4に示すように、各語句がどの分野に属するかを参照するための、語句と分野の対応リストを持つ。
複数の語句を一つのクエリとして検索する場合、それらの語句の中にユーザの知識量を示す語句が含まれることがある。特殊語句データベース103は、図5に示すように、ユーザの知識量が推定できるような特殊語句と、その特殊語句にそれぞれあらかじめ設定された特殊語句効果値sをリストとして持つ。たとえば、比較的知識量が少ないことを示す語句としては、「入門」や「初心者」などであり、逆に知識量が多いことを示す語句としては「マニア」や「おたく」などである。
105は、後述する分野参照部104の処理によって構築されるユーザ−クエリ−分野データベースである。このデータベース105は、例えば図6に示すように、ユーザuを特定する情報と、前記ユーザが電子文書を検索する際に入力したクエリと、前記クエリの属する分野dとを対応付けて構成される。
107は、後述する特殊語句効果値参照部106の処理によって構築されるユーザ−分野−特殊語句効果値データベースである。このデータベース107は、例えば図7に示すように、ユーザuと、分野dと、前記ユーザ−クエリ−分野データベース105内のクエリに含まれる特殊語句に予め設定した特殊語句効果値sとを対応付けて構成される。
108は、前記ユーザ−クエリ−分野データベース105を参照し、あるクエリが、対象分野に属する全クエリ中に出現する頻度の逆数IQF(Inverse Query Frequency)を算出し、該頻度の逆数IQFに基づく、ユーザのある分野における知識量推定要素値C1(第1の知識量推定要素値)を算出し、知識量推定要素値C1データベース(第1の知識量推定要素値データベース)109を作成する、第1の知識量推定要素値データベース作成手段としての知識量推定要素値C1データベース作成部である。
110は、前記ユーザ−分野−特殊語句効果値データベース107を参照し、特殊語句に基づく知識量推定要素値C2(第2の知識量推定要素値)を算出し、知識量推定要素値C2データベース(第2の知識量推定要素値データベース)111を作成する、第2の知識量推定要素値データベース作成手段としての知識量推定要素値C2データベース作成部である。
112は、電子文書を検索するユーザ名と分野名とを入力とし、前記入力されたユーザ名および分野名に該当する、前記知識量推定要素値C1データベース109内の知識量推定要素値C1と、前記知識量推定要素値C2データベース111内の知識量推定要素値C2とを加算して知識量推定値Kを求める知識量推定手段としての知識量推定部である。
図1の知識量推定装置は、例えばコンピュータシステムにより構成され、図2に示すように、通常のコンピュータのハードウェアリソース、例えばROM11、RAM12、CPU13、通信インタフェース(I/F)14、ハードディスクドライブ装置15、記録媒体駆動装置16、記録媒体17、入力装置(キーボードなどを含む)18、出力装置(ディスプレイなどを含む)19等を備えている。
このハードウェアリソースとソフトウェアリソース(OS,アプリケーションなど)との協働の結果、図2のコンピュータシステムは、図1に示す分野参照部104、特殊語句効果値参照部106、知識量推定要素値C1データベース作成部108、知識量推定要素値C2データベース作成部110および知識量推定部112を実装している。
また、図1のクエリログデータベース101、語句−分野データベース102、特殊語句データベース103、ユーザ−クエリ−分野データベース105、ユーザ−分野−特殊語句効果値データベース107、知識量推定要素値C1データベース109および知識量推定要素値C2データベース111は、図2のハードディスクドライブ装置15のハードディスクあるいはRAM(メモリ)12などの保存手段・記憶手段に構築されている、又は構築されるものである。
また、図1の知識量推定部112に対するユーザ名、分野名の入力は、図2の入力装置18を介して実行され、知識量推定部112で求められた知識量推定値は図2の出力装置19を介して出力される。
次に上記のように構成された知識量推定装置の動作を説明する。まず分野参照部104は、クエリログデータベース101(図3)からユーザ名とクエリがペアとなったデータを読み込み、各ペアについて以下の処理を行う。クエリをキーとして、語句‐分野データベース102(図4)を参照し、クエリと一致する語句があれば語句の属する分野をそのクエリの属する分野とし、ユーザ‐クエリ‐分野データベース105(図6)に格納する。一致しない場合、当該クエリはユーザ−クエリ−分野データベース105に格納しない。
クエリログデータベース101中に、同一のユーザ、クエリのペアが複数ある場合、重複を許す方法と、重複しているものは1つにまとめる方法が考えられる。
次に特殊語句効果値参照部106は、ユーザ−クエリ−分野データベース105の各クエリについて以下の処理を行う。特殊語句データベース103(図5)を参照し、クエリが特殊語句を含むのであれば参照した値をそのクエリの属する分野の特殊語句効果値としてユーザ−分野−特殊語句効果値データベース107(図7)に格納する。クエリが特殊語句を含まない場合はユーザ−分野−特殊語句効果値データベース107に格納しない。
知識量推定要素値C1データベース作成部108は、ユーザ−クエリ−分野データベース105を読み込み、各分野においてのユーザ専門性の指標を調べるため、IQF(Inverse Query Frequency)を算出する。ここでのIQFは当該分野におけるクエリ全体の中に占める、そのクエリの頻度の割合の逆数を用いたもので、以下に、分野dにおけるクエリtのIQFを表すiqfd(t)を求める式を示す(式(1))。
Figure 0005292336
ここでNdは、ユーザ−クエリ−分野データベース105中の対象分野dに属する全クエリの数、qf(t)は、ユーザ−クエリ−分野データベース105中のクエリtの出現回数である。
iqfd(t)が高いほど、語句tは分野dに対して専門性の高い語句であると判断される。これは、ある分野においてクエリとして入力される頻度の低い語句を使って検索するユーザは、その分野において高い専門性を持っているとの仮定に基づいている。例えば、「野球」という分野において、「ジャイアンツ」や「イチロー」といった、全ユーザを対象としたクエリログにおいて、頻度の高いと思われるクエリを入力する人よりも、「クイックモーション」や「ツーシーム」といった、入力される頻度の低い語句をクエリとして選んでいる人のほうが、「野球」について詳しいと考えられる。
ユーザ−クエリ−分野データベース105において、あるユーザuの、ある分野dに属する語句全てのIQFの集合をQu,dとして、IQFに基づくユーザのある分野における知識量推定要素値C1(Qu,d)を求める。以下にC1(Qu,d)を求める式の一例を示す(式(2))。
Figure 0005292336
ここで、Nu,dは、ユーザuのクエリログに残る、対象分野dに属する全語句がクエリとして入力された回数である。上記の例ではiqfd(t)の相加平均をとっているが、他にも相乗平均や調和平均をとる方法が考えられる。Nu,dの値が小さいときには、知識量の推定精度が低いと考えられるため、外れ値を除く方法や、Nu,dがあらかじめ設定されたしきい値を超えるまでは0とするといった方法も考えられる。
算出されたC1(Qu,d)は、知識量推定要素値C1データベース109(図8)にユーザuと分野dと対応付けて格納される。
知識量推定要素値C1データベース作成部108が行なう、データベース作成のフローチャートを図10に示す。図10において、step1では、ユーザ−クエリ−分野データベース105(図6)から1行分のデータを読み取り、ユーザu、分野d、クエリtを受け取る。
次にstep2において、分野dを含む行数Ndのカウントが済んでいるか否かを判定し、済んでいない場合はstep3においてユーザ−クエリ−分野データベース105中の分野dを含む行数Ndをカウントする。
次にstep4ではユーザ−クエリ−分野データベース105中のクエリtを含む行数qf(t)をカウントし、step5では前記式(1)を計算して、分野dにおけるクエリtのIQFを表すiqfd(t)を求め、step6では前記データベース105中のユーザu、分野dを含む行数Nu,dに1を足す。
次にstep7において、ユーザ−クエリ−分野データベース105中のユーザu、分野dを含む行全てのqf(t)を出したか否かを判定し、出していない場合はstep1に戻り、出した場合はstep8に進む。
次にstep8では前記式(2)を計算して、IQFに基づくユーザのある分野における知識量推定要素値C1(Qu,d)を求め、step9ではユーザu、分野dおよび前記要素値C1を知識量推定要素値C1データベース109に書き込む。
次にstep10において、ユーザ−クエリ−分野データベース105中の全ての行を読み込んだか否かを判定し、読み込んでいない場合はstep1に戻り、読み込んだ場合は処理を終了する。
知識量推定要素値C2データベース作成部110は、ユーザ−分野−特殊語句効果値データベース107(図7)を読み込み、ユーザuの分野dにおける特殊語句効果値sの集合をSu,dとして、特殊語句に基づく知識量推定要素値C2(Su,d)を算出する。以下にC2(Su,d)を求める式の一例を示す(式(3))。
Figure 0005292336
ここで、Nu,d,sは、ユーザuのクエリログに残る、対象分野dに属し、且つ特殊語句効果値が定義されている全語句がクエリとして入力された回数である。上記の例では相加平均をとっているが、他にも相乗平均や調和平均をとる方法が考えられる。
算出されたC2(Su,d)は、知識量推定要素値C2データベース111(図9)にユーザuと分野dと対応付けて格納される。
知識量推定要素値C2データベース作成部110が行なう、データベース作成のフローチャートを図11に示す。図11において、step11では、ユーザ−分野−特殊語句効果値データベース107(図7)から1行分のデータを読み取り、ユーザu、分野d、特殊語句効果値Su,d(t)を受け取る。
次にstep12では、前記ユーザ−分野−特殊語句効果値データベース107中のユーザu、分野dを含む行数Nu,d,sに1を足す。
次にstep13において、ユーザu、分野dを含む行全てを読み込んだか否かを判定し、読み込んでいない場合はstep11に戻り、読み込んだ場合はstep14に進む。
step14では前記式(3)を計算して、特殊語句に基づく知識量推定要素値C2(Su,d)を求め、step15ではユーザu、分野dおよび前記要素値C2を知識量推定要素値C2データベース111に書き込む。
次にstep16において、ユーザ−分野−特殊語句効果値データベース107中の全ての行を読み込んだか否かを判定し、読み込んでいない場合はstep11に戻り、読み込んだ場合は処理を終了する。
次に知識量推定部112はユーザu、分野dを入力として受け取る。そしてu、dの対をキーとして知識量推定要素値C1データベース109を参照し、C1(Qu,d)の値を得る。次に知識量推定部112は知識量推定要素値C2データベース111に対しても同様にユーザu、分野dをキーとして参照し、C2(Su,d)の値を得る。以下に知識量推定値K(C1(Qu,d),C2(Su,d))を算出する式の一例を示す(式(4))。
K(C1(Qu,d),C2(Su,d))=w11(Qu,d)+w22(Su,d)…(4)
ここで、w1,w2はC1,C2にそれぞれかかる重みを示すための、あらかじめ調整された定数である。知識量推定部112は、上記の式(4)によって算出された知識量推定値K(C1(Qu,d),C2(Su,d))を出力として返す。
知識量推定部112が行なう処理のフローチャートを図12に示す。図12において、step17では、入力されたユーザ名u、分野名dを受け取る。
次にstep18において、知識量推定要素値C1データベース109中にユーザu、分野dを含む行が存在するか否かを判定し、存在する場合はstep19に進み、存在しない場合はstep20に進む。
step19では知識量推定要素値C1データベース109から、ユーザu、分野dを含む行中の知識量推定要素値C1を受け取る。
次にstep20において、知識量推定要素値C2データベース111中にユーザu、分野dを含む行が存在するか否かを判定し、存在する場合はstep21に進み、存在しない場合はstep22に進む。
次にstep22において、前記知識量推定要素値C1、C2のどちらかに値があるか否かを判定し、値が無い場合は処理を終了し、値がある場合はstep23において前記式(4)を計算して知識量推定値Kを求めた後、処理を終了する。
上記のように本実施形態例によれば、ユーザの分野ごとにおける知識量を推定し、数値として得ることが可能となり、ユーザのある分野における知識量に見合った、ユーザにより適した情報を提供することの実現に寄与することができる。
例えば発明が解決しようとする課題の欄で挙げた、京都の例で具体的に説明すると、あるユーザが過去に、京都に関して、十分な回数検索システムを用いて電子文書を検索、閲覧していたとする。従来技術では、このユーザが京都に関して興味を持っていることがわかる。本発明では、データベースによって分野の特定ができ、且つ他のユーザが検索クエリとして選択することの少ないクエリで、京都に関する電子文書をよく検索していた場合、前記式(2)の知識量推定要素値C1が大となって式(4)の知識量推定値Kが大となるため、このユーザには「京都」という分野に関して高い知識量推定値が与えられ、京都に関して豊富な知識を持っているということがわかる。
また、本実施形態の検索システムユーザの分野ごとにおける知識量推定装置における各手段の一部もしくは全部の機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行して本発明を実現することができること、本実施形態の検索システムユーザの分野ごとにおける知識量推定方法における手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータに実行させることができることは言うまでもなく、コンピュータでその機能を実現するためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えばFD(Floppy(登録商標) Disk)や、MO(Magneto−Optical disk)、ROM(Read Only Memory)、メモリカード、CD(Compact Disk)−ROM、DVD(Digital Versatile Disk)−ROM、CD−R、CD−RW、HDD、リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。また、上記のプログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。
11…ROM
12…RAM
13…CPU
14…I/F
15…ハードディスクドライブ装置
16…記録媒体駆動装置
17…記録媒体
18…入力装置
19…出力装置
101…クエリログデータベース
102…語句−分野データベース
103…特殊語句データベース
104…分野参照部
105…ユーザ−クエリ−分野データベース
106…特殊語句効果値参照部
107…ユーザ−分野−特殊語句効果値データベース
108…知識量推定要素値C1データベース作成部
109…知識量推定要素値C1データベース
110…知識量推定要素値C2データベース作成部
111…知識量推定要素値C2データベース
112…知識量推定部

Claims (5)

  1. ユーザを特定する情報と、前記ユーザが電子文書を検索する際に入力したクエリと、前記クエリの属する分野とを対応付けて構築したユーザ−クエリ−分野データベースと、
    前記ユーザと、前記分野と、前記ユーザ−クエリ−分野データベース内のクエリに含まれる特殊語句に予め設定した特殊語句効果値とを対応付けて構築したユーザ−分野−特殊語句効果値データベースと、
    前記ユーザ−クエリ−分野データベースを参照し、あるクエリが、対象分野に属する全クエリ中に出現する頻度の逆数IQF(Inverse Query Frequency)を算出し、該頻度の逆数IQFに基づく、ユーザのある分野における第1の知識量推定要素値を算出し、ユーザ名と分野名と第1の知識量推定要素値とを対応付けた第1の知識量推定要素値データベースを作成する第1の知識量推定要素値データベース作成手段と、
    前記ユーザ−分野−特殊語句効果値データベースを参照し、特殊語句に基づく第2の知識量推定要素値を算出し、ユーザ名と分野名と第2の知識量推定要素値とを対応付けた第2の知識量推定要素値データベースを作成する第2の知識量推定要素値データベース作成手段と、
    電子文書を検索するユーザ名と分野名とを入力とし、前記入力されたユーザ名および分野名に該当する、前記第1の知識量推定要素値データベース内の第1の知識量推定要素値と、前記第2の知識量推定要素値データベース内の第2の知識量推定要素値とを加算して知識量推定値を求める知識量推定手段と、
    を備えたことを特徴とする検索システムユーザの分野ごとにおける知識量推定装置。
  2. 前記第1の知識量推定要素値データベース作成手段は、前記ユーザ−クエリ−分野データベース中の分野dに属する全クエリの数Ndと、前記ユーザ−クエリ−分野データベース中のクエリtの出現回数qf(t)とから、log{Nd/qf(t)}+1を演算することによって、あるクエリが、対象分野に属する全クエリ中に出現する頻度の逆数に基づくiqfd(t)を求め、
    前記ユーザ−クエリ−分野データベース中の、あるユーザuのある分野dに属する語句全てのIQFの集合Qu,dと、ユーザuのクエリログに存在する、対象分野dに属する全語句がクエリとして入力された回数Nu,dとから、Σtiqfd(t)/Nu,dを演算することによって、前記IQFに基づく、ユーザのある分野における第1の知識量推定要素値C1(Qu,d)を求め、
    前記第2の知識量推定要素値データベース作成手段は、前記ユーザ−分野−特殊語句効果値データベース中のユーザuの分野dにおける特殊語句効果値sの集合Su,dと、ユーザuのクエリログに存在する、対象分野dに属し、且つ特殊語句効果値が定義されている全語句がクエリとして入力された回数Nu,d、sとから、Σtu,d(t)/Nu,d、sを演算することによって、特殊語句に基づく第2の知識量推定要素値C2(Su,d)を求め、
    前記知識量推定手段は、前記第1の知識量推定要素値C1(Qu,d)の重みをw1とし、前記第2の知識量推定要素値C2(Su,d)の重みをw2とし、w11(Qu,d)+w22(Su,d)を演算することによって、知識量推定値K(C1(Qu,d),C2(Su,d))を求めることを特徴とする請求項1に記載の検索システムユーザの分野ごとにおける知識量推定装置。
  3. 第1の知識量推定要素値データベース作成手段が、
    ユーザを特定する情報と、前記ユーザが電子文書を検索する際に入力したクエリと、前記クエリの属する分野とを対応付けて構築したユーザ−クエリ−分野データベースを参照し、あるクエリが、対象分野に属する全クエリ中に出現する頻度の逆数IQF(Inverse Query Frequency)を算出するIQF算出ステップと、
    前記頻度の逆数IQFに基づく、ユーザのある分野における第1の知識量推定要素値を算出する第1の知識量推定要素値算出ステップと、
    ユーザ名と分野名と前記第1の知識量推定要素値とを対応付けた第1の知識量推定要素値データベースを作成する第1の知識量推定要素値データベース作成ステップと、
    第2の知識量推定要素値データベース作成手段が、
    前記ユーザと、前記分野と、前記ユーザ−クエリ−分野データベース内のクエリに含まれる特殊語句に予め設定した特殊語句効果値とを対応付けて構築したユーザ−分野−特殊語句効果値データベースを参照し、特殊語句に基づく第2の知識量推定要素値を算出する第2の知識量推定要素値算出ステップと、
    ユーザ名と分野名と第2の知識量推定要素値とを対応付けた第2の知識量推定要素値データベースを作成する第2の知識量推定要素値データベース作成ステップと、
    知識量推定手段が、電子文書を検索するユーザ名と分野名とを入力とし、前記入力されたユーザ名および分野名に該当する、前記第1の知識量推定要素値データベース内の第1の知識量推定要素値と、前記第2の知識量推定要素値データベース内の第2の知識量推定要素値とを加算して知識量推定値を求める知識量推定ステップと、
    を備えたことを特徴とする検索システムユーザの分野ごとにおける知識量推定方法。
  4. 前記IQF算出ステップは、前記ユーザ−クエリ−分野データベース中の分野dに属する全クエリの数Ndと、前記ユーザ−クエリ−分野データベース中のクエリtの出現回数qf(t)とから、log{Nd/qf(t)}+1を演算することによって、あるクエリが、対象分野に属する全クエリ中に出現する頻度の逆数に基づくiqfd(t)を求め、
    前記第1の知識量推定要素値算出ステップは、前記ユーザ−クエリ−分野データベース中の、あるユーザuのある分野dに属する語句全てのIQFの集合Qu,dと、ユーザuのクエリログに存在する、対象分野dに属する全語句がクエリとして入力された回数Nu,dとから、Σtiqfd(t)/Nu,dを演算することによって、前記IQFに基づく、ユーザのある分野における第1の知識量推定要素値C1(Qu,d)を求め、
    前記第2の知識量推定要素値算出ステップは、前記ユーザ−分野−特殊語句効果値データベース中のユーザuの分野dにおける特殊語句効果値sの集合Su,dと、ユーザuのクエリログに存在する、対象分野dに属し、且つ特殊語句効果値が定義されている全語句がクエリとして入力された回数Nu,d、sとから、Σtu,d(t)/Nu,d、sを演算することによって、特殊語句に基づく第2の知識量推定要素値C2(Su,d)を求め、
    前記知識量推定ステップは、前記第1の知識量推定要素値C1(Qu,d)の重みをw1とし、前記第2の知識量推定要素値C2(Su,d)の重みをw2とし、w11(Qu,d)+w22(Su,d)を演算することによって、知識量推定値K(C1(Qu,d),C2(Su,d))を求めることを特徴とする請求項3に記載の検索システムユーザの分野ごとにおける知識量推定方法。
  5. コンピュータを請求項1又は2に記載の各手段として機能させることを特徴とする知識量推定プログラム。
JP2010035081A 2010-02-19 2010-02-19 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム Expired - Fee Related JP5292336B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010035081A JP5292336B2 (ja) 2010-02-19 2010-02-19 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010035081A JP5292336B2 (ja) 2010-02-19 2010-02-19 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム

Publications (2)

Publication Number Publication Date
JP2011170699A JP2011170699A (ja) 2011-09-01
JP5292336B2 true JP5292336B2 (ja) 2013-09-18

Family

ID=44684743

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010035081A Expired - Fee Related JP5292336B2 (ja) 2010-02-19 2010-02-19 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム

Country Status (1)

Country Link
JP (1) JP5292336B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5787717B2 (ja) * 2011-10-24 2015-09-30 ニフティ株式会社 情報処理装置、プログラム及び情報検索システム
JP5583164B2 (ja) * 2012-03-29 2014-09-03 日本電信電話株式会社 専門度推定装置及び方法及びプログラム
JP5351315B1 (ja) 2012-07-31 2013-11-27 楽天株式会社 情報処理装置、カテゴリ表示方法、およびプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000315213A (ja) * 1999-04-30 2000-11-14 Ntt Data Corp 情報提供システム及び情報提供方法
JP2002342344A (ja) * 2001-05-21 2002-11-29 Canon Inc 情報提供方法、情報提供システム、プログラム及び記憶媒体
JP2004192542A (ja) * 2002-12-13 2004-07-08 Nippon Telegr & Teleph Corp <Ntt> 情報推薦装置、情報推薦方法、プログラムおよび記録媒体
KR100553943B1 (ko) * 2003-04-11 2006-02-24 엔에이치엔(주) 온라인 상의 전문가 선출 방법 및 시스템
JP2008234550A (ja) * 2007-03-23 2008-10-02 Nec Corp 専門家情報検索装置、専門家情報検索方法およびプログラム。
US9081852B2 (en) * 2007-10-05 2015-07-14 Fujitsu Limited Recommending terms to specify ontology space

Also Published As

Publication number Publication date
JP2011170699A (ja) 2011-09-01

Similar Documents

Publication Publication Date Title
CN107391687B (zh) 一种面向地方志网站的混合推荐系统
JP5423030B2 (ja) ワードセットに関係するワードの決定
JP5391633B2 (ja) オントロジー空間を規定するタームの推奨
JP5332477B2 (ja) ターム階層の自動生成
JP5391634B2 (ja) 文書の段落分析によるその文書のタグの選択
US8543380B2 (en) Determining a document specificity
US8666984B2 (en) Unsupervised message clustering
JP5391632B2 (ja) ワードと文書の深さの決定
US8832126B2 (en) Custodian suggestion for efficient legal e-discovery
US20090193007A1 (en) Systems and methods for ranking search engine results
JP2009093651A (ja) 統計分布を用いたトピックスのモデリング
JP2009093653A (ja) ユーザ入力に応じた検索空間の絞り込み
CN108241613A (zh) 一种提取关键词的方法及设备
US20130198240A1 (en) Social Network Analysis
US20150120708A1 (en) Information aggregation, classification and display method and system
JP5952711B2 (ja) 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法
JP5367632B2 (ja) 知識量推定装置及びプログラム
JP5292336B2 (ja) 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム
JP5416552B2 (ja) ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム
JP5358481B2 (ja) 文書検索装置、文書検索方法、文書検索プログラム
CN118132818B (zh) 基于意象差异的旅游区域资源评估方法
KR100525616B1 (ko) 연관 검색 쿼리 추출 방법 및 시스템
JP5292322B2 (ja) 文書検索方法、文書検索装置、文書検索プログラム
Li et al. Linking entities in chinese queries to knowledge graph
Alarfaj et al. An Adaptive Window-Size Approach for Expert-Finding.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120131

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130610

R150 Certificate of patent or registration of utility model

Ref document number: 5292336

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees