JP2010257001A - 検索サポートキーワード提示装置、方法及びプログラム - Google Patents

検索サポートキーワード提示装置、方法及びプログラム Download PDF

Info

Publication number
JP2010257001A
JP2010257001A JP2009103369A JP2009103369A JP2010257001A JP 2010257001 A JP2010257001 A JP 2010257001A JP 2009103369 A JP2009103369 A JP 2009103369A JP 2009103369 A JP2009103369 A JP 2009103369A JP 2010257001 A JP2010257001 A JP 2010257001A
Authority
JP
Japan
Prior art keywords
search
user
word
support keyword
trend
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009103369A
Other languages
English (en)
Other versions
JP5366632B2 (ja
Inventor
Satoshi Tokuno
聡 得能
Kazuo Mogi
一男 茂木
Hiroshi Asakura
浩志 朝倉
Katsunori Kawaguchi
克則 川口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Communications Corp
Original Assignee
NTT Communications Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Communications Corp filed Critical NTT Communications Corp
Priority to JP2009103369A priority Critical patent/JP5366632B2/ja
Publication of JP2010257001A publication Critical patent/JP2010257001A/ja
Application granted granted Critical
Publication of JP5366632B2 publication Critical patent/JP5366632B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】利用者毎の特性を加味した第2検索語を生成・提示によりWebページの検索の効率化を図る。
【解決手段】本発明の検索サポートキーワード提示装置は、入力された検索クエリや閲覧されたWebページのURLや当該Webページのコンテンツ等の、全ての利用者の利用履歴情報を逐次蓄積するログ収集サーバと、上記利用者により入力された検索クエリや上記検索結果や上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき、上記利用者の検索動向が絞り込み的であるか発散的であるかを判定する行動分析部と、上記検索動向の判定結果に応じ、上記利用者により入力された検索クエリや上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき第2検索語を生成する第2検索語生成部とを備える。
【選択図】図1

Description

本発明は、検索エンジンを用いたキーワード入力による情報検索の効率化を図るための検索サポートキーワード提示装置、方法及びプログラムに関する。
ネットワーク上で公開される情報の増大に伴い、検索エンジンを用いてキーワード入力により情報検索を行った場合、入力したキーワードによっては多数の情報がヒットする。そのため、このような場合には複数のキーワードを指定したり、キーワードを下位概念化したりするなどにより再検索を行い、情報を絞り込む必要がある。
主要な検索エンジンにおいては、検索結果を絞り込むために第2検索語を提示し、利用者の検索行為をサポートしている。この場合、提示される第2検索語は、検索システムで過去に検索された検索語の履歴や検索対象のコンテンツ中の重要語などから抽出されるのが一般的である。
利用者が検索エンジンを用いて情報検索を行う場合、検索対象に関する知識により、絞り込み・発散の2つの系統に分類することができる。絞り込み的検索は、利用者が主検索語とそれを限定する何らかの1以上の第2検索語とから検索するようなケースであり、例えば主検索語が「東京都」である場合、「東京都 港区」「東京都 新宿区」、また、主検索語が「港区」である場合、「港区 東京都」「港区 大阪市」といったような検索がそれにあたる。一方発散的検索は、利用者が検索したい対象の名称自体を知らないようなケースであり、例えば最近流行の特定の携帯型音楽プレーヤーについて調べたい場合に、直接的な名称ではなく上位概念の「携帯型音楽プレーヤー」を検索語とするというように既知の情報から未知の情報への到達を目指す検索がそれにあたる。
第2検索語を検索エンジン側から提示するに際しては、絞り込み的検索の場合は主検索語に対する下位概念による提示が有効であり、発散的検索の場合は上位概念語や類義語による提示が有効であると考えられる。しかし、検索を実施する利用者の有する知識レベルや思考パターンは個々に異なるところ、従来の検索エンジンではそのような利用者毎の特性を加味せずシステムで画一的に第2検索語を生成・提示しており、効率的に検索をサポートできているとは言い難い。
本発明の目的は、利用者の過去の検索履歴やWebページの閲覧履歴に基づき、検索処理が実行される都度、検索動向(絞り込み的か発散的か)を逐次判定し、その判定結果に応じて利用者の検索動向を反映した第2検索語を生成し、利用者に対し検索結果の提示に先立ち、又は検索結果とともに提示することにより検索の効率化を図ることが可能な検索サポートキーワード提示装置、方法及びプログラムを提供することにある。
本発明の検索サポートキーワード提示装置は、利用者が1以上の検索語からなる検索クエリを検索エンジンやポータルサイトの検索ページに入力することにより第2検索語を生成し、これを利用者に対し検索結果の提示に先立ち、又は検索結果とともに提示する装置であり、ログ収集サーバと行動分析部と第2検索語生成部とを備える。
ログ収集サーバは、入力された検索クエリや閲覧されたWebページのURLや当該Webページのコンテンツ等の、全ての利用者の利用履歴情報を逐次蓄積する。
行動分析部は、上記利用者により入力された検索クエリや上記検索結果や上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき、上記利用者の検索動向が絞り込み的であるか発散的であるかを判定する。
第2検索語生成部は、上記検索動向の判定結果に応じ、上記利用者により入力された検索クエリや上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき第2検索語を生成する。
本発明の検索サポートキーワード提示装置によれば、利用者の過去の検索履歴やWebページの閲覧履歴に基づき、検索処理が実行される都度、検索動向(絞り込み的か発散的か)を逐次判定し、その判定結果に応じて利用者の検索動向を反映した第2検索語を生成し、利用者に対し検索結果の提示に先立ち、又は検索結果とともに提示するため、検索の効率化を図ることができる。
検索サポートキーワード提示装置100の機能構成例を示す図。 検索サポートキーワード提示装置100の処理フロー例を示す図。 行動分析部120での検索動向判定方法の一例を示すフロー図。 αダイバージェンスに基づく第2検索語の抽出イメージを示す図。
図1に本発明の検索サポートキーワード提示装置100の機能構成例を、図2に処理フロー例を示す。
検索サポートキーワード提示装置100は、利用者が利用者PC10から1以上の検索語からなる検索クエリを利用者IDとともに検索エンジン等20の検索ページに入力することにより、検索エンジン等20における検索処理と並行して第2検索語の生成処理を行い、検索結果の提示に先立ち、又は検索結果とともに利用者に提示するために用いる装置である。ここで、検索エンジン等20とは、検索エンジンやポータルサイトなどを指している。
検索サポートキーワード提示装置100は、ログ収集サーバ110と行動分析部120と第2検索語生成部130とから構成される。
ログ収集サーバ110は、利用者PC10から入力された検索クエリや、利用者が閲覧したWebページのURLや、当該Webページのコンテンツ等の全ての利用者の利用履歴情報を、各利用者のIDと関連付けられた形で逐次蓄積する(S1)。利用履歴情報の蓄積期間については、期間が長いほどより適切な第2検索語の生成が期待できるが、反面、処理時間やリソースの問題が生じるため、所望のバランスに応じ適宜設定すればよい。
行動分析部120は、利用者により入力された検索クエリや検索結果やログ収集サーバ110に蓄積された過去の利用履歴情報に基づき、上記利用者の検索動向が絞り込み的であるか発散的であるかを判定する(S2)。各利用者の過去の利用履歴情報は上記のとおり各利用者のIDと関連付けられた形で蓄積されているため、利用者PC10から入力された利用者IDをキーに取り出すことができる。判定方法としては、例えば以下のような方法が挙げられる。
判定方法1(J1):利用者が検索ページに移行する直前に閲覧していたWebページのURLが当該利用者の過去の利用履歴情報に含まれていない場合に、非日常的なページであるとみなし、当該利用者の検索動向が発散的であると判定する。
判定方法2(J2):利用者が検索ページに移行する直前に閲覧していたWebページのURLが検索結果中に含まれていない場合に、非日常的なページであるとみなし、当該利用者の検索動向が発散的であると判定する。
判定方法3(J3):利用者が検索ページに移行する直前に閲覧していたWebページのコンテンツが、当該利用者が過去に閲覧したWebページのコンテンツの傾向と異なる場合に、非日常的なページであるとみなし、当該利用者の検索動向が発散的であると判定する。なお、コンテンツの傾向の類否判断方法としては、例えば、直前に閲覧していたWebページのコンテンツに含まれる単語を分野ごとにクラスタリングし、同様に過去に閲覧したWebページのコンテンツに含まれる単語についてもクラスタリングし、最も多くの単語が含まれる分野が共通する場合に傾向が同様と判断し、そうでない場合は異なると判断するという方法が考えられる。
判定方法4(J4):利用者が入力した検索クエリと当該利用者が直前の検索時に入力した検索クエリとのレーベンシュタイン距離を求め、それに基づき上記利用者の検索動向が絞り込み的であるか発散的であるかを判定する。この判定方法は、入力した検索クエリが2以上の単語から構成されている場合に用いることができる。具体的には、例えば次のような方法で判定する。
(1) 利用者が入力した検索クエリを単語に分解する。例えば、入力語が「徳川家康」であれば「徳川」「家康」と分解する。
(2) 当該利用者が入力した直前の検索時に入力した検索クエリをログ収集サーバ110から取得し単語に分解する。例えば、「徳川」「家光」であったとする。
(3) 利用者が入力した検索クエリの各単語と、直前の検索時に入力した検索クエリの各単語についてレーベンシュタイン距離を求める。上記例では、「徳川」と「徳川」は同じなので距離は0、「家康」と「家光」は1文字を置換した関係にあるので距離は1となる。
(4)距離0の単語があれば主クエリと定義し、他のクエリは検索補助語とみなす。上記例では、「徳川」が主クエリ、「家康」が検索補助語にあたる。
(5)a=(レーベンシュタイン距離/検索補助語の文字数)と定義し、a≧1の場合は発散的と判定し、a<1の場合は絞り込み的と判定する。
判定方法5(J5):利用者が入力した検索クエリに係る検索語について、上記利用者が過去に閲覧したWebページ及びWebページに含まれる単語に対する所定の特徴量を求め、その特徴量から上記利用者の検索動向が絞り込み的であるか発散的であるかを判定する。特徴量としては、例えばtf・idf値を用いることが考えられる。tf・idf値による場合、具体的には例えば次のような方法で判定する。
(1)過去に閲覧した全てのWebページのコンテンツに対し形態素解析を行う。
(2)利用者が入力した検索語wについて、tf値とidf値をそれぞれ次式により求め、v=tf×idfで求めたvの値が所定の閾値t以上の場合には絞り込み的と判定し、閾値t未満の場合は発散的と判定する。
tf=(全てのWebページのコンテンツ中の検索語wの出現数)/全てのWebページのコンテンツの総単語数
idf=log(全Webページ数/検索語wの出現するWebページ数)
なお、利用者が入力した検索クエリに係る検索語wが複数ある場合には、例えば、それぞれの検索語wにつきvの値を求め、vの値が閾値以上の検索語の数が閾値未満の検索語の数より多ければ絞り込み的と判定し、そうでなければ発散的と判定するなどの方法が考えられる。
検索動向の判定に際しては、上記の各方法のうちいずれか1つのみにより判定してもよいし、複数を組み合わせて判定してもよい。上記5つの判定方法すべてを組み合わせて判定を行う場合の処理フローの一例を図3に示す。まず、今回の検索の直前のページも検索ページであったか否かを判定する(J0)。検索ページであれば、J1〜J4の判定を順次行い、検索ページでなければJ5の判定を行うことにより検索動向が絞り込み的か発散的かを判定する。
第2検索語生成部130は、上記検索動向が絞り込み的であるか発散的であるかに応じ、上記利用者により入力された検索クエリや上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき第2検索語を生成する(S3)。第2検索語の生成方法としては、例えば以下のような方法が挙げられる。
生成方法1:検索動向が絞り込み的である場合には検索クエリの下位概念語を、発散的である場合には検索クエリの上位概念語や兄弟概念語を、日本語語彙体系に従い抽出し、これを第2検索語とする。
生成方法2:検索動向が絞り込み的である場合には、利用者が過去に閲覧したWebページに含まれる単語のうち、入力した検索クエリに係る検索語が出現するWebページには必ず含まれるが、出現しないWebページには出現頻度が低い単語を第2検索語として抽出し、上記検索動向が発散的である場合には、上記利用者が過去に閲覧したWebページに含まれる単語のうち、上記検索クエリに係る検索語が出現するWebページには必ず含まれ、かつ、出現しないWebページにおいても出現頻度が高い単語を第2検索語として抽出する。出現頻度が低いか否か、高いか否かについては、それぞれ0%、100%と設定することで第2検索語としての有用度は高まるが、そもそも該当する単語が存在しない恐れが生じるため、抽出可能な程度に例えば20%、80%というように適宜設定すればよい。
生成方法3:利用者が入力した検索クエリに係る検索語と過去に閲覧したWebページに含まれる各単語との間で算出した所定の共起頻度を示す値に基づき第2検索語を抽出する。共起頻度を示す値としては、例えばαダイバージェンス値を用いることが考えられる。αダイバージェンス値を用いる場合、例えばページ1、ページm、ページnにおける単語Xの出現確率をそれぞれV(X)、V(X)、V(X)(V(X)≦V(X) ≦V(X))とし、単語Yの出現確率をそれぞれV(Y)、V(Y)、V(Y)(V(Y)≦V(Y) ≦V(Y))とした時、単語Yの単語Xに対するαダイバージェンス値Dα(X‖Y)は次式により求めることができる。
Figure 2010257001
各単語Yについて、αの値を例えば0、0.5、1、2と変化させたαダイバージェンス値を求めることにより、単語Xの下位概念である単語Yや、単語Xの上位概念である単語Yを抽出することができる。具体的には、α=0の時のαダイバージェンスD(X‖Y)の値が小さい単語Yほど単語Xとの関連度の高い下位概念ということになり、α=0.5の時のαダイバージェンスD0.5(X‖Y)の値が小さい単語Yほど単語Xとの関連度の高い兄弟概念ということになる。また、α=1の時のαダイバージェンスD(X‖Y)の値が小さい単語Yほど単語Xとの関連度の高い上位概念ということになり、α=2の時のαダイバージェンスD(X‖Y)の値が小さい単語Yほど単語Xとの関連度の高い更なる上位概念ということになる。例えば、検索クエリに係る検索語Xが「徳川家康」である場合に、α=0、0.5、1、2のそれぞれについて、過去に閲覧したWebページに含まれる単語Yの、検索語Xに対するαダイバージェンス値を値の小さいものから10個ずつ抽出したイメージを図4に示す。このような結果が得られた時には、検索動向が絞り込み的である場合は、α=0において上位の単語Yを第2検索語として抽出し、検索動向が発散的である場合は、α=0.5やα=1において上位の単語Yを第2検索語として抽出すればよい。
生成方法4:検索動向が絞り込み的である場合に、利用者が入力した検索クエリに係る検索語が含まれる検索クエリを過去の利用履歴情報から抽出し、当該抽出した検索クエリに含まれる当該検索語以外の検索語を第2検索語として抽出する。ここで利用する過去の利用履歴情報は全ての利用者の利用履歴情報を対象としても構わない。例えば、利用者が入力した検索クエリが「特許査定 特許料」であり、過去の利用履歴情報から抽出された検索クエリが「特許査定 存続期間」であるとき、「存続期間」を第2検索語として抽出する。
生成方法5:検索動向が発散的である場合に、利用者が入力した検索クエリと同じ検索クエリによる検索結果に基づき過去に閲覧されたWebページのURLを利用者履歴情報から抽出し、更に、当該検索クエリに含まれない別の検索語による検索結果に基づき当該Webページが閲覧されたとの利用者履歴情報を抽出して、当該別の検索語を第2検索語として抽出する。ここで利用する過去の利用履歴情報は全ての利用者の利用履歴情報を対象としても構わない。例えば、利用者が検索クエリ「沖縄」で検索した場合、まず過去の利用者履歴情報からある利用者が「沖縄」という検索クエリよる検索結果に基づきアクセスしたWebページのURLを抽出する。続いて、当該URLに別の検索語による検索結果に基づきアクセスされていたかどうか過去の利用者履歴情報を確認し、例えばある利用者が「離島」という検索語に基づき当該URLにアクセスしていた場合には、「離島」を第2検索語として抽出する。
なお、第2検索語の利用者への提示方法として、検索結果とともに提示する方法と、検索結果の提示に先立ち提示する方法とが考えられる。前者については、例えば検索クエリが「徳川家康」であった場合に、利用者が利用者端末10にて当該検索クエリ及び検索実行指示を入力することにより、検索エンジン等20での検索処理と並行して検索サポートキーワード提示装置100の各処理を実行し、利用者に検索結果とともに第2検索語を提示する。
一方後者については、例えば利用者10が文字を入力するごとに、その時点での中途語句が検索サポートキーワード提示装置100に自動的に送られるように構成し、サポートキーワード提示装置100は当該中途語句を検索クエリとして処理を実行して、その都度第2検索語を提示する。具体的には、全体としての入力語句が「徳川家康」であった場合に、まず「徳」が入力された時点で「徳」に対する第2検索語を提示し、続いて「川」が入力された時点で「徳川」に対する第2検索語を提示し、更に「家」が入力された時点で「徳川家」に対する第2検索語を提示する。このように中途語句の入力段階で逐次第2検索語を提示する構成をとることにより、必ずしも並行して検索エンジン等20を動作させる必要がなく、また語句を途中まで入力するだけで検索のヒントとなる第2検索語が提示されるため、より検索の効率化を図ることができる。なお、利用者10が文字を入力するごとに、その時点での中途語句が検索サポートキーワード提示装置100に自動的に送られるように構成する方法としては、例えば検索ページやポータルサイトのHTMLソースにJavaScript(登録商標)により、キー入力情報が自動的に送信される旨をプログラミングしておく方法が考えられる。
以上のように、本発明の検索サポートキーワード提示装置100によれば、利用者の過去の検索履歴やWebページの閲覧履歴に基づき、検索処理が実行される都度、検索動向(絞り込み的か発散的か)を逐次判定し、その判定結果に応じて利用者の検索動向を反映した第2検索語を生成して、利用者に対し検索結果の提示に先立ち、又は検索結果とともに提示する。そのため、検索の効率化を図ることができる。
なお、上記の各実施形態の検索サポートキーワード提示装置の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。この場合、処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。また、上述の各種処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。

Claims (23)

  1. 利用者が1以上の検索語からなる検索クエリを検索エンジンやポータルサイトの検索ページに入力することにより第2検索語を生成し、上記利用者に提示する検索サポートキーワード提示装置であって、
    入力された検索クエリや閲覧されたWebページのURLや当該Webページのコンテンツ等の、全ての利用者の利用履歴情報を逐次蓄積するログ収集サーバと、
    上記利用者により入力された検索クエリや上記検索結果や上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき、上記利用者の検索動向が絞り込み的であるか発散的であるかを判定する行動分析部と、
    上記検索動向が絞り込み的であるか発散的であるかに応じ、上記利用者により入力された検索クエリや上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき第2検索語を生成する第2検索語生成部と、
    を備え、
    上記第2検索語を、検索結果の提示に先立ち、又は検索結果とともに、上記利用者に提示する検索サポートキーワード提示装置。
  2. 請求項1に記載の検索サポートキーワード提示装置であって、
    上記行動分析部は、上記利用者が上記検索ページに移行する直前に閲覧していたWebページのURLが、上記利用者の過去の利用履歴情報に含まれていない場合に、上記利用者の検索動向が発散的であると判定することを特徴とする検索サポートキーワード提示装置。
  3. 請求項1に記載の検索サポートキーワード提示装置であって、
    上記行動分析部は、上記検索結果中に上記利用者が上記検索ページに移行する直前に閲覧していたWebページのURLが含まれていない場合に、上記利用者の検索動向が発散的であると判定することを特徴とする検索サポートキーワード提示装置。
  4. 請求項1に記載の検索サポートキーワード提示装置であって、
    上記行動分析部は、上記利用者が上記検索ページに移行する直前に閲覧していたWebページのコンテンツが、上記利用者が過去に閲覧したWebページのコンテンツの傾向と異なる場合に、上記利用者の検索動向が発散的であると判定することを特徴とする検索サポートキーワード提示装置。
  5. 請求項1に記載の検索サポートキーワード提示装置であって、
    上記行動分析部は、上記利用者により入力された検索クエリと上記利用者が直前の検索時に入力した検索クエリとのレーベンシュタイン距離を求め、それに基づき上記利用者の検索動向が絞り込み的であるか発散的であるかを判定することを特徴とする検索サポートキーワード提示装置。
  6. 請求項1に記載の検索サポートキーワード提示装置であって、
    上記行動分析部は、上記利用者により入力された検索クエリに係る検索語について、上記利用者が過去に閲覧したWebページ及びWebページに含まれる単語に対する所定の特徴量を求め、その特徴量から上記利用者の検索動向が絞り込み的であるか発散的であるかを判定することを特徴とする検索サポートキーワード提示装置。
  7. 請求項1乃至6のいずれかに記載の検索サポートキーワード提示装置であって、
    上記第2検索語生成部は、上記検索動向が絞り込み的である場合には上記利用者により入力された検索クエリの下位概念語を、発散的である場合には上記利用者により入力された検索クエリの上位概念語や兄弟概念語を、日本語語彙体系に従い抽出して第2検索語とすることを特徴とする検索サポートキーワード提示装置。
  8. 請求項1乃至6のいずれかに記載の検索サポートキーワード提示装置であって、
    上記第2検索語生成部は、上記検索動向が絞り込み的である場合には、上記利用者が過去に閲覧したWebページに含まれる単語のうち、上記利用者により入力された検索クエリに係る検索語が出現するWebページには必ず含まれるが、出現しないWebページには出現頻度が低い単語を第2検索語として抽出し、上記検索動向が発散的である場合には、上記利用者が過去に閲覧したWebページに含まれる単語のうち、上記利用者により入力された検索クエリに係る検索語が出現するWebページには必ず含まれ、かつ、出現しないWebページにおいても出現頻度が高い単語を第2検索語として抽出することを特徴とする検索サポートキーワード提示装置。
  9. 請求項1乃至6のいずれかに記載の検索サポートキーワード提示装置であって、
    上記第2検索語生成部は、上記利用者により入力された検索クエリに係る検索語と上記利用者が過去に閲覧したWebページに含まれる各単語との間で算出した所定の共起頻度を示す値に基づき第2検索語を抽出することを特徴とする検索サポートキーワード提示装置。
  10. 請求項1乃至6のいずれかに記載の検索サポートキーワード提示装置であって、
    上記第2検索語生成部は、上記検索動向が絞り込み的である場合に、上記利用者により入力された検索クエリに係る検索語が含まれる検索クエリを過去の利用履歴情報から抽出し、当該抽出した検索クエリに含まれる当該検索語以外の検索語を第2検索語として抽出することを特徴とする検索サポートキーワード提示装置。
  11. 請求項1乃至6のいずれかに記載の検索サポートキーワード提示装置であって、
    上記第2検索語生成部は、上記検索動向が発散的である場合に、上記利用者により入力された検索クエリと同じ検索クエリによる検索結果に基づき過去に閲覧されたWebページのURLを利用者履歴情報から抽出し、更に、当該検索クエリに含まれない別の検索語による検索結果に基づき当該Webページが閲覧されたとの利用者履歴情報を抽出して、当該別の検索語を第2検索語として抽出することを特徴とする検索サポートキーワード提示装置。
  12. 利用者が1以上の検索語からなる検索クエリを検索エンジンやポータルサイトの検索ページに入力することにより第2検索語を生成し、上記利用者に提示する検索サポートキーワード提示方法であって、
    入力された検索クエリや閲覧されたWebページのURLや当該Webページのコンテンツ等の、全ての利用者の利用履歴情報を逐次蓄積するログ収集ステップと、
    上記利用者により入力された検索クエリや上記検索結果や上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき、上記利用者の検索動向が絞り込み的であるか発散的であるかを判定する行動分析ステップと、
    上記検索動向が絞り込み的であるか発散的であるかに応じ、上記利用者により入力された検索クエリや上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき第2検索語を生成する第2検索語生成ステップと、
    を実行し、上記第2検索語を検索結果の提示に先立ち、又は検索結果とともに上記利用者に提示する検索サポートキーワード提示方法。
  13. 請求項12に記載の検索サポートキーワード提示方法であって、
    上記行動分析ステップは、上記利用者が上記検索ページに移行する直前に閲覧していたWebページのURLが、上記利用者の過去の利用履歴情報に含まれていない場合に、上記利用者の検索動向が発散的であると判定することを特徴とする検索サポートキーワード提示方法。
  14. 請求項12に記載の検索サポートキーワード提示方法であって、
    上記行動分析ステップは、上記検索結果中に上記利用者が上記検索ページに移行する直前に閲覧していたWebページのURLが含まれていない場合に、上記利用者の検索動向が発散的であると判定することを特徴とする検索サポートキーワード提示方法。
  15. 請求項12に記載の検索サポートキーワード提示方法であって、
    上記行動分析ステップは、上記利用者が上記検索ページに移行する直前に閲覧していたWebページのコンテンツが、上記利用者が過去に閲覧したWebページのコンテンツの傾向と異なる場合に、上記利用者の検索動向が発散的であると判定することを特徴とする検索サポートキーワード提示方法。
  16. 請求項12に記載の検索サポートキーワード提示方法であって、
    上記行動分析ステップは、上記利用者により入力された検索クエリと上記利用者が直前の検索時に入力した検索クエリとのレーベンシュタイン距離を求め、それに基づき上記利用者の検索動向が絞り込み的であるか発散的であるかを判定することを特徴とする検索サポートキーワード提示方法。
  17. 請求項12に記載の検索サポートキーワード提示方法であって、
    上記行動分析ステップは、上記利用者により入力された検索クエリに係る検索語について、上記利用者が過去に閲覧したWebページ及びWebページに含まれる単語に対する所定の特徴量を求め、その特徴量から上記利用者の検索動向が絞り込み的であるか発散的であるかを判定することを特徴とする検索サポートキーワード提示方法。
  18. 請求項12乃至17のいずれかに記載の検索サポートキーワード提示方法であって、
    上記第2検索語生成ステップは、上記検索動向が絞り込み的である場合には上記利用者により入力された検索クエリの下位概念語を、発散的である場合には上記利用者により入力された検索クエリの上位概念語や兄弟概念語を、日本語語彙体系に従い抽出して第2検索語とすることを特徴とする検索サポートキーワード提示方法。
  19. 請求項12乃至17のいずれかに記載の検索サポートキーワード提示方法であって、
    上記第2検索語生成ステップは、上記検索動向が絞り込み的である場合には、上記利用者が過去に閲覧したWebページに含まれる単語のうち、上記利用者により入力された検索クエリに係る検索語が出現するWebページには必ず含まれるが、出現しないWebページには出現頻度が低い単語を第2検索語として抽出し、上記検索動向が発散的である場合には、上記利用者が過去に閲覧したWebページに含まれる単語のうち、上記利用者により入力された検索クエリに係る検索語が出現するWebページには必ず含まれ、かつ、出現しないWebページにおいても出現頻度が高い単語を第2検索語として抽出することを特徴とする検索サポートキーワード提示方法。
  20. 請求項12乃至17のいずれかに記載の検索サポートキーワード提示方法であって、
    上記第2検索語生成ステップは、上記利用者により入力された検索クエリに係る検索語と上記利用者が過去に閲覧したWebページに含まれる各単語との間で算出した所定の共起頻度を示す値に基づき第2検索語を抽出することを特徴とする検索サポートキーワード提示方法。
  21. 請求項12乃至17のいずれかに記載の検索サポートキーワード提示方法であって、
    上記第2検索語生成ステップは、上記検索動向が絞り込み的である場合に、上記利用者により入力された検索クエリに係る検索語が含まれる検索クエリを過去の利用履歴情報から抽出し、当該抽出した検索クエリに含まれる当該検索語以外の検索語を第2検索語として抽出することを特徴とする検索サポートキーワード提示方法。
  22. 請求項12乃至17のいずれかに記載の検索サポートキーワード提示方法であって、
    上記第2検索語生成ステップは、上記検索動向が発散的である場合に、上記利用者により入力された検索クエリと同じ検索クエリによる検索結果に基づき過去に閲覧されたWebページのURLを利用者履歴情報から抽出し、更に、当該検索クエリに含まれない別の検索語による検索結果に基づき当該Webページが閲覧されたとの利用者履歴情報を抽出して、当該別の検索語を第2検索語として抽出することを特徴とする検索サポートキーワード提示方法。
  23. 請求項1乃至11のいずれかに記載した検索サポートキーワード提示装置としてコンピュータを機能させるためのプログラム。
JP2009103369A 2009-04-21 2009-04-21 検索サポートキーワード提示装置、方法及びプログラム Active JP5366632B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009103369A JP5366632B2 (ja) 2009-04-21 2009-04-21 検索サポートキーワード提示装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009103369A JP5366632B2 (ja) 2009-04-21 2009-04-21 検索サポートキーワード提示装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2010257001A true JP2010257001A (ja) 2010-11-11
JP5366632B2 JP5366632B2 (ja) 2013-12-11

Family

ID=43317879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009103369A Active JP5366632B2 (ja) 2009-04-21 2009-04-21 検索サポートキーワード提示装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5366632B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012174122A (ja) * 2011-02-23 2012-09-10 Ntt Docomo Inc キーワード選定装置、キーワード提示システム、キーワード提示方法及びプログラム
JP2012243033A (ja) * 2011-05-18 2012-12-10 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP2014002601A (ja) * 2012-06-19 2014-01-09 Ntt Data Corp 情報検索装置、情報検索方法およびプログラム
JP2014099062A (ja) * 2012-11-14 2014-05-29 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置、情報検索方法、及びプログラム
KR101620779B1 (ko) * 2015-01-08 2016-05-17 네이버 주식회사 리타겟팅 검색 서비스를 제공하는 방법 및 시스템
JP2020042771A (ja) * 2018-09-07 2020-03-19 台達電子工業股▲ふん▼有限公司Delta Electronics,Inc. データ分析方法及びデータ分析システム
US11409804B2 (en) 2018-09-07 2022-08-09 Delta Electronics, Inc. Data analysis method and data analysis system thereof for searching learning sections

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189721A (ja) * 2000-10-11 2002-07-05 Mieko Tsuyusaki Webページ検索システム及び翻訳システム
WO2005122016A1 (ja) * 2004-06-10 2005-12-22 Matsushita Electric Industrial Co., Ltd. 入力補助装置、情報検索装置、入力補助方法、及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189721A (ja) * 2000-10-11 2002-07-05 Mieko Tsuyusaki Webページ検索システム及び翻訳システム
WO2005122016A1 (ja) * 2004-06-10 2005-12-22 Matsushita Electric Industrial Co., Ltd. 入力補助装置、情報検索装置、入力補助方法、及びプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012174122A (ja) * 2011-02-23 2012-09-10 Ntt Docomo Inc キーワード選定装置、キーワード提示システム、キーワード提示方法及びプログラム
JP2012243033A (ja) * 2011-05-18 2012-12-10 Sony Corp 情報処理装置、情報処理方法、およびプログラム
US8983997B2 (en) 2011-05-18 2015-03-17 Sony Corporation Information processing apparatus, information processing method, and program
US9529847B2 (en) 2011-05-18 2016-12-27 Sony Corporation Information processing apparatus, information processing method, and program for extracting co-occurrence character strings
JP2014002601A (ja) * 2012-06-19 2014-01-09 Ntt Data Corp 情報検索装置、情報検索方法およびプログラム
JP2014099062A (ja) * 2012-11-14 2014-05-29 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置、情報検索方法、及びプログラム
KR101620779B1 (ko) * 2015-01-08 2016-05-17 네이버 주식회사 리타겟팅 검색 서비스를 제공하는 방법 및 시스템
JP2020042771A (ja) * 2018-09-07 2020-03-19 台達電子工業股▲ふん▼有限公司Delta Electronics,Inc. データ分析方法及びデータ分析システム
US11409804B2 (en) 2018-09-07 2022-08-09 Delta Electronics, Inc. Data analysis method and data analysis system thereof for searching learning sections

Also Published As

Publication number Publication date
JP5366632B2 (ja) 2013-12-11

Similar Documents

Publication Publication Date Title
JP5366632B2 (ja) 検索サポートキーワード提示装置、方法及びプログラム
WO2021218322A1 (zh) 段落搜索方法、装置、电子设备及存储介质
US20110173174A1 (en) Linguistically enhanced search engine and meta-search engine
JP2011134334A (ja) ショートテキスト通信のトピックを識別するためのシステムおよび方法
WO2014040521A1 (zh) 搜索方法、系统及存储介质
CN102200975A (zh) 一种利用语义分析的垂直搜索引擎系统与方法
WO2016121048A1 (ja) 文章生成装置及び方法
KR101651780B1 (ko) 빅 데이터 처리 기술을 이용한 연관 단어 추출 방법 및 그 시스템
JP4631795B2 (ja) 情報検索支援システム、情報検索支援方法および情報検索支援プログラム
CN110968789A (zh) 电子书推送方法、电子设备及计算机存储介质
JP4969209B2 (ja) 検索システム
JP2006178599A (ja) 文書検索装置および方法
JP2011209999A (ja) 情報処理装置、データ抽出方法及びプログラム
JP2009086903A (ja) 検索サービス装置
JP6163143B2 (ja) 情報提供装置、情報提供方法、および情報提供プログラム
US9336317B2 (en) System and method for searching aliases associated with an entity
JP4796527B2 (ja) ドキュメント絞り込み検索装置、方法及びプログラム
JP4728125B2 (ja) 索引ファイルを用いた文書検索の方法、索引ファイルを用いた文書検索サーバ、及び索引ファイルを用いた文書検索プログラム
Moumtzidou et al. Discovery of environmental nodes in the web
JP6106489B2 (ja) 語義解析装置、及びプログラム
JP5491446B2 (ja) 話題語獲得装置、方法、及びプログラム
Li et al. Complex query recognition based on dynamic learning mechanism
JP6172750B2 (ja) 絞り込み検索のためのクエリ語の選択候補を明示するコンテンツ検索プログラム、装置及び方法
JP2012104051A (ja) 文書インデックス作成装置
JP2010086210A (ja) 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130808

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130827

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130910

R150 Certificate of patent or registration of utility model

Ref document number: 5366632

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250