JP2010257001A - 検索サポートキーワード提示装置、方法及びプログラム - Google Patents
検索サポートキーワード提示装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2010257001A JP2010257001A JP2009103369A JP2009103369A JP2010257001A JP 2010257001 A JP2010257001 A JP 2010257001A JP 2009103369 A JP2009103369 A JP 2009103369A JP 2009103369 A JP2009103369 A JP 2009103369A JP 2010257001 A JP2010257001 A JP 2010257001A
- Authority
- JP
- Japan
- Prior art keywords
- search
- user
- word
- support keyword
- trend
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 59
- 239000000284 extract Substances 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 3
- 238000009825 accumulation Methods 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本発明の検索サポートキーワード提示装置は、入力された検索クエリや閲覧されたWebページのURLや当該Webページのコンテンツ等の、全ての利用者の利用履歴情報を逐次蓄積するログ収集サーバと、上記利用者により入力された検索クエリや上記検索結果や上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき、上記利用者の検索動向が絞り込み的であるか発散的であるかを判定する行動分析部と、上記検索動向の判定結果に応じ、上記利用者により入力された検索クエリや上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき第2検索語を生成する第2検索語生成部とを備える。
【選択図】図1
Description
(2) 当該利用者が入力した直前の検索時に入力した検索クエリをログ収集サーバ110から取得し単語に分解する。例えば、「徳川」「家光」であったとする。
(3) 利用者が入力した検索クエリの各単語と、直前の検索時に入力した検索クエリの各単語についてレーベンシュタイン距離を求める。上記例では、「徳川」と「徳川」は同じなので距離は0、「家康」と「家光」は1文字を置換した関係にあるので距離は1となる。
(4)距離0の単語があれば主クエリと定義し、他のクエリは検索補助語とみなす。上記例では、「徳川」が主クエリ、「家康」が検索補助語にあたる。
(5)a=(レーベンシュタイン距離/検索補助語の文字数)と定義し、a≧1の場合は発散的と判定し、a<1の場合は絞り込み的と判定する。
(2)利用者が入力した検索語wについて、tf値とidf値をそれぞれ次式により求め、v=tf×idfで求めたvの値が所定の閾値t以上の場合には絞り込み的と判定し、閾値t未満の場合は発散的と判定する。
idf=log(全Webページ数/検索語wの出現するWebページ数)
なお、利用者が入力した検索クエリに係る検索語wが複数ある場合には、例えば、それぞれの検索語wにつきvの値を求め、vの値が閾値以上の検索語の数が閾値未満の検索語の数より多ければ絞り込み的と判定し、そうでなければ発散的と判定するなどの方法が考えられる。
Claims (23)
- 利用者が1以上の検索語からなる検索クエリを検索エンジンやポータルサイトの検索ページに入力することにより第2検索語を生成し、上記利用者に提示する検索サポートキーワード提示装置であって、
入力された検索クエリや閲覧されたWebページのURLや当該Webページのコンテンツ等の、全ての利用者の利用履歴情報を逐次蓄積するログ収集サーバと、
上記利用者により入力された検索クエリや上記検索結果や上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき、上記利用者の検索動向が絞り込み的であるか発散的であるかを判定する行動分析部と、
上記検索動向が絞り込み的であるか発散的であるかに応じ、上記利用者により入力された検索クエリや上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき第2検索語を生成する第2検索語生成部と、
を備え、
上記第2検索語を、検索結果の提示に先立ち、又は検索結果とともに、上記利用者に提示する検索サポートキーワード提示装置。 - 請求項1に記載の検索サポートキーワード提示装置であって、
上記行動分析部は、上記利用者が上記検索ページに移行する直前に閲覧していたWebページのURLが、上記利用者の過去の利用履歴情報に含まれていない場合に、上記利用者の検索動向が発散的であると判定することを特徴とする検索サポートキーワード提示装置。 - 請求項1に記載の検索サポートキーワード提示装置であって、
上記行動分析部は、上記検索結果中に上記利用者が上記検索ページに移行する直前に閲覧していたWebページのURLが含まれていない場合に、上記利用者の検索動向が発散的であると判定することを特徴とする検索サポートキーワード提示装置。 - 請求項1に記載の検索サポートキーワード提示装置であって、
上記行動分析部は、上記利用者が上記検索ページに移行する直前に閲覧していたWebページのコンテンツが、上記利用者が過去に閲覧したWebページのコンテンツの傾向と異なる場合に、上記利用者の検索動向が発散的であると判定することを特徴とする検索サポートキーワード提示装置。 - 請求項1に記載の検索サポートキーワード提示装置であって、
上記行動分析部は、上記利用者により入力された検索クエリと上記利用者が直前の検索時に入力した検索クエリとのレーベンシュタイン距離を求め、それに基づき上記利用者の検索動向が絞り込み的であるか発散的であるかを判定することを特徴とする検索サポートキーワード提示装置。 - 請求項1に記載の検索サポートキーワード提示装置であって、
上記行動分析部は、上記利用者により入力された検索クエリに係る検索語について、上記利用者が過去に閲覧したWebページ及びWebページに含まれる単語に対する所定の特徴量を求め、その特徴量から上記利用者の検索動向が絞り込み的であるか発散的であるかを判定することを特徴とする検索サポートキーワード提示装置。 - 請求項1乃至6のいずれかに記載の検索サポートキーワード提示装置であって、
上記第2検索語生成部は、上記検索動向が絞り込み的である場合には上記利用者により入力された検索クエリの下位概念語を、発散的である場合には上記利用者により入力された検索クエリの上位概念語や兄弟概念語を、日本語語彙体系に従い抽出して第2検索語とすることを特徴とする検索サポートキーワード提示装置。 - 請求項1乃至6のいずれかに記載の検索サポートキーワード提示装置であって、
上記第2検索語生成部は、上記検索動向が絞り込み的である場合には、上記利用者が過去に閲覧したWebページに含まれる単語のうち、上記利用者により入力された検索クエリに係る検索語が出現するWebページには必ず含まれるが、出現しないWebページには出現頻度が低い単語を第2検索語として抽出し、上記検索動向が発散的である場合には、上記利用者が過去に閲覧したWebページに含まれる単語のうち、上記利用者により入力された検索クエリに係る検索語が出現するWebページには必ず含まれ、かつ、出現しないWebページにおいても出現頻度が高い単語を第2検索語として抽出することを特徴とする検索サポートキーワード提示装置。 - 請求項1乃至6のいずれかに記載の検索サポートキーワード提示装置であって、
上記第2検索語生成部は、上記利用者により入力された検索クエリに係る検索語と上記利用者が過去に閲覧したWebページに含まれる各単語との間で算出した所定の共起頻度を示す値に基づき第2検索語を抽出することを特徴とする検索サポートキーワード提示装置。 - 請求項1乃至6のいずれかに記載の検索サポートキーワード提示装置であって、
上記第2検索語生成部は、上記検索動向が絞り込み的である場合に、上記利用者により入力された検索クエリに係る検索語が含まれる検索クエリを過去の利用履歴情報から抽出し、当該抽出した検索クエリに含まれる当該検索語以外の検索語を第2検索語として抽出することを特徴とする検索サポートキーワード提示装置。 - 請求項1乃至6のいずれかに記載の検索サポートキーワード提示装置であって、
上記第2検索語生成部は、上記検索動向が発散的である場合に、上記利用者により入力された検索クエリと同じ検索クエリによる検索結果に基づき過去に閲覧されたWebページのURLを利用者履歴情報から抽出し、更に、当該検索クエリに含まれない別の検索語による検索結果に基づき当該Webページが閲覧されたとの利用者履歴情報を抽出して、当該別の検索語を第2検索語として抽出することを特徴とする検索サポートキーワード提示装置。 - 利用者が1以上の検索語からなる検索クエリを検索エンジンやポータルサイトの検索ページに入力することにより第2検索語を生成し、上記利用者に提示する検索サポートキーワード提示方法であって、
入力された検索クエリや閲覧されたWebページのURLや当該Webページのコンテンツ等の、全ての利用者の利用履歴情報を逐次蓄積するログ収集ステップと、
上記利用者により入力された検索クエリや上記検索結果や上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき、上記利用者の検索動向が絞り込み的であるか発散的であるかを判定する行動分析ステップと、
上記検索動向が絞り込み的であるか発散的であるかに応じ、上記利用者により入力された検索クエリや上記ログ収集サーバに蓄積された過去の利用履歴情報に基づき第2検索語を生成する第2検索語生成ステップと、
を実行し、上記第2検索語を検索結果の提示に先立ち、又は検索結果とともに上記利用者に提示する検索サポートキーワード提示方法。 - 請求項12に記載の検索サポートキーワード提示方法であって、
上記行動分析ステップは、上記利用者が上記検索ページに移行する直前に閲覧していたWebページのURLが、上記利用者の過去の利用履歴情報に含まれていない場合に、上記利用者の検索動向が発散的であると判定することを特徴とする検索サポートキーワード提示方法。 - 請求項12に記載の検索サポートキーワード提示方法であって、
上記行動分析ステップは、上記検索結果中に上記利用者が上記検索ページに移行する直前に閲覧していたWebページのURLが含まれていない場合に、上記利用者の検索動向が発散的であると判定することを特徴とする検索サポートキーワード提示方法。 - 請求項12に記載の検索サポートキーワード提示方法であって、
上記行動分析ステップは、上記利用者が上記検索ページに移行する直前に閲覧していたWebページのコンテンツが、上記利用者が過去に閲覧したWebページのコンテンツの傾向と異なる場合に、上記利用者の検索動向が発散的であると判定することを特徴とする検索サポートキーワード提示方法。 - 請求項12に記載の検索サポートキーワード提示方法であって、
上記行動分析ステップは、上記利用者により入力された検索クエリと上記利用者が直前の検索時に入力した検索クエリとのレーベンシュタイン距離を求め、それに基づき上記利用者の検索動向が絞り込み的であるか発散的であるかを判定することを特徴とする検索サポートキーワード提示方法。 - 請求項12に記載の検索サポートキーワード提示方法であって、
上記行動分析ステップは、上記利用者により入力された検索クエリに係る検索語について、上記利用者が過去に閲覧したWebページ及びWebページに含まれる単語に対する所定の特徴量を求め、その特徴量から上記利用者の検索動向が絞り込み的であるか発散的であるかを判定することを特徴とする検索サポートキーワード提示方法。 - 請求項12乃至17のいずれかに記載の検索サポートキーワード提示方法であって、
上記第2検索語生成ステップは、上記検索動向が絞り込み的である場合には上記利用者により入力された検索クエリの下位概念語を、発散的である場合には上記利用者により入力された検索クエリの上位概念語や兄弟概念語を、日本語語彙体系に従い抽出して第2検索語とすることを特徴とする検索サポートキーワード提示方法。 - 請求項12乃至17のいずれかに記載の検索サポートキーワード提示方法であって、
上記第2検索語生成ステップは、上記検索動向が絞り込み的である場合には、上記利用者が過去に閲覧したWebページに含まれる単語のうち、上記利用者により入力された検索クエリに係る検索語が出現するWebページには必ず含まれるが、出現しないWebページには出現頻度が低い単語を第2検索語として抽出し、上記検索動向が発散的である場合には、上記利用者が過去に閲覧したWebページに含まれる単語のうち、上記利用者により入力された検索クエリに係る検索語が出現するWebページには必ず含まれ、かつ、出現しないWebページにおいても出現頻度が高い単語を第2検索語として抽出することを特徴とする検索サポートキーワード提示方法。 - 請求項12乃至17のいずれかに記載の検索サポートキーワード提示方法であって、
上記第2検索語生成ステップは、上記利用者により入力された検索クエリに係る検索語と上記利用者が過去に閲覧したWebページに含まれる各単語との間で算出した所定の共起頻度を示す値に基づき第2検索語を抽出することを特徴とする検索サポートキーワード提示方法。 - 請求項12乃至17のいずれかに記載の検索サポートキーワード提示方法であって、
上記第2検索語生成ステップは、上記検索動向が絞り込み的である場合に、上記利用者により入力された検索クエリに係る検索語が含まれる検索クエリを過去の利用履歴情報から抽出し、当該抽出した検索クエリに含まれる当該検索語以外の検索語を第2検索語として抽出することを特徴とする検索サポートキーワード提示方法。 - 請求項12乃至17のいずれかに記載の検索サポートキーワード提示方法であって、
上記第2検索語生成ステップは、上記検索動向が発散的である場合に、上記利用者により入力された検索クエリと同じ検索クエリによる検索結果に基づき過去に閲覧されたWebページのURLを利用者履歴情報から抽出し、更に、当該検索クエリに含まれない別の検索語による検索結果に基づき当該Webページが閲覧されたとの利用者履歴情報を抽出して、当該別の検索語を第2検索語として抽出することを特徴とする検索サポートキーワード提示方法。 - 請求項1乃至11のいずれかに記載した検索サポートキーワード提示装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009103369A JP5366632B2 (ja) | 2009-04-21 | 2009-04-21 | 検索サポートキーワード提示装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009103369A JP5366632B2 (ja) | 2009-04-21 | 2009-04-21 | 検索サポートキーワード提示装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010257001A true JP2010257001A (ja) | 2010-11-11 |
JP5366632B2 JP5366632B2 (ja) | 2013-12-11 |
Family
ID=43317879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009103369A Active JP5366632B2 (ja) | 2009-04-21 | 2009-04-21 | 検索サポートキーワード提示装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5366632B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012174122A (ja) * | 2011-02-23 | 2012-09-10 | Ntt Docomo Inc | キーワード選定装置、キーワード提示システム、キーワード提示方法及びプログラム |
JP2012243033A (ja) * | 2011-05-18 | 2012-12-10 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
JP2014002601A (ja) * | 2012-06-19 | 2014-01-09 | Ntt Data Corp | 情報検索装置、情報検索方法およびプログラム |
JP2014099062A (ja) * | 2012-11-14 | 2014-05-29 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置、情報検索方法、及びプログラム |
KR101620779B1 (ko) * | 2015-01-08 | 2016-05-17 | 네이버 주식회사 | 리타겟팅 검색 서비스를 제공하는 방법 및 시스템 |
JP2020042771A (ja) * | 2018-09-07 | 2020-03-19 | 台達電子工業股▲ふん▼有限公司Delta Electronics,Inc. | データ分析方法及びデータ分析システム |
US11409804B2 (en) | 2018-09-07 | 2022-08-09 | Delta Electronics, Inc. | Data analysis method and data analysis system thereof for searching learning sections |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002189721A (ja) * | 2000-10-11 | 2002-07-05 | Mieko Tsuyusaki | Webページ検索システム及び翻訳システム |
WO2005122016A1 (ja) * | 2004-06-10 | 2005-12-22 | Matsushita Electric Industrial Co., Ltd. | 入力補助装置、情報検索装置、入力補助方法、及びプログラム |
-
2009
- 2009-04-21 JP JP2009103369A patent/JP5366632B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002189721A (ja) * | 2000-10-11 | 2002-07-05 | Mieko Tsuyusaki | Webページ検索システム及び翻訳システム |
WO2005122016A1 (ja) * | 2004-06-10 | 2005-12-22 | Matsushita Electric Industrial Co., Ltd. | 入力補助装置、情報検索装置、入力補助方法、及びプログラム |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012174122A (ja) * | 2011-02-23 | 2012-09-10 | Ntt Docomo Inc | キーワード選定装置、キーワード提示システム、キーワード提示方法及びプログラム |
JP2012243033A (ja) * | 2011-05-18 | 2012-12-10 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
US8983997B2 (en) | 2011-05-18 | 2015-03-17 | Sony Corporation | Information processing apparatus, information processing method, and program |
US9529847B2 (en) | 2011-05-18 | 2016-12-27 | Sony Corporation | Information processing apparatus, information processing method, and program for extracting co-occurrence character strings |
JP2014002601A (ja) * | 2012-06-19 | 2014-01-09 | Ntt Data Corp | 情報検索装置、情報検索方法およびプログラム |
JP2014099062A (ja) * | 2012-11-14 | 2014-05-29 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置、情報検索方法、及びプログラム |
KR101620779B1 (ko) * | 2015-01-08 | 2016-05-17 | 네이버 주식회사 | 리타겟팅 검색 서비스를 제공하는 방법 및 시스템 |
JP2020042771A (ja) * | 2018-09-07 | 2020-03-19 | 台達電子工業股▲ふん▼有限公司Delta Electronics,Inc. | データ分析方法及びデータ分析システム |
US11409804B2 (en) | 2018-09-07 | 2022-08-09 | Delta Electronics, Inc. | Data analysis method and data analysis system thereof for searching learning sections |
Also Published As
Publication number | Publication date |
---|---|
JP5366632B2 (ja) | 2013-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5366632B2 (ja) | 検索サポートキーワード提示装置、方法及びプログラム | |
WO2021218322A1 (zh) | 段落搜索方法、装置、电子设备及存储介质 | |
US20110173174A1 (en) | Linguistically enhanced search engine and meta-search engine | |
JP2009003888A (ja) | キーワード提示のための装置、方法、及びプログラム | |
WO2014040521A1 (zh) | 搜索方法、系统及存储介质 | |
CN102200975A (zh) | 一种利用语义分析的垂直搜索引擎系统与方法 | |
WO2016121048A1 (ja) | 文章生成装置及び方法 | |
KR101651780B1 (ko) | 빅 데이터 처리 기술을 이용한 연관 단어 추출 방법 및 그 시스템 | |
JP4631795B2 (ja) | 情報検索支援システム、情報検索支援方法および情報検索支援プログラム | |
CN110968789A (zh) | 电子书推送方法、电子设备及计算机存储介质 | |
JP4969209B2 (ja) | 検索システム | |
JP2006178599A (ja) | 文書検索装置および方法 | |
JP2011209999A (ja) | 情報処理装置、データ抽出方法及びプログラム | |
JP2009086903A (ja) | 検索サービス装置 | |
JP6163143B2 (ja) | 情報提供装置、情報提供方法、および情報提供プログラム | |
US9336317B2 (en) | System and method for searching aliases associated with an entity | |
JP2012104051A (ja) | 文書インデックス作成装置 | |
JP4728125B2 (ja) | 索引ファイルを用いた文書検索の方法、索引ファイルを用いた文書検索サーバ、及び索引ファイルを用いた文書検索プログラム | |
Moumtzidou et al. | Discovery of environmental nodes in the web | |
JP6106489B2 (ja) | 語義解析装置、及びプログラム | |
JP5491446B2 (ja) | 話題語獲得装置、方法、及びプログラム | |
Li et al. | Complex query recognition based on dynamic learning mechanism | |
JP2009282593A (ja) | コンテンツを検索する索引データを管理する方法、サーバ、およびプログラム | |
JP2008234559A (ja) | ドキュメント絞り込み検索装置、方法及びプログラム | |
JP6172750B2 (ja) | 絞り込み検索のためのクエリ語の選択候補を明示するコンテンツ検索プログラム、装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130611 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130827 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130910 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5366632 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |