JP2010026640A - 次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム - Google Patents
次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム Download PDFInfo
- Publication number
- JP2010026640A JP2010026640A JP2008184896A JP2008184896A JP2010026640A JP 2010026640 A JP2010026640 A JP 2010026640A JP 2008184896 A JP2008184896 A JP 2008184896A JP 2008184896 A JP2008184896 A JP 2008184896A JP 2010026640 A JP2010026640 A JP 2010026640A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- search
- search keyword
- cluster
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】
検索キーワードを入力して(13)、検索キーワードを検索システムに送信し、検索システムが求めた前記検索キーワードを含む複数の文書を受信し(14)、表示部に表示する。複数の文書それぞれから単語毎に意味属性を解析し(17)、検索キーワードとユーザの操作を履歴情報として格納し(12)、意味属性と履歴情報に基づいて複数の文書それぞれから文書特徴情報を生成する(18)。文書特徴情報のクラスタリング処理を行ない、クラスタに含まれる複数の文書からクラスタ代表キーワードを抽出し(19)、表示部にクラスタ代表キーワードを検索キーワードの次に検索すべき次検索キーワードの候補として表示する(20)。
【選択図】 図1
Description
Yahoo!(R)検索ヘルプ−「関連検索ワード」とは−〈URL:http://help.yahoo.co.jp/help/jp/search/web/web−17.html〉
図6は文書特徴ベクトルの生成を説明する図である。文書に含まれる文書特徴キーワードを抽出し、キーワードの意味属性に対してユーザ嗜好ベクトルの確信度を付与して、リストを作る。作ったリストはユーザ嗜好ベクトルと比較することで、文書特徴ベクトルを生成する。
12 履歴情報格納部
13 キーワード入力部
14 検索制御部
15 検索システム
16 本文抽出部
17 意味属性解析部
18 特徴ベクトル生成部
19 クラスタ代表キーワード抽出部
20 表示部
Claims (15)
- 検索キーワードを入力する入力部と、
前記検索キーワードを検索システムに送信し、この検索システムが求めた前記検索キーワードを含む複数の文書を受信する検索制御部と、
前記複数の文書を表示する表示部と、
前記複数の文書それぞれから本文を抽出する本文抽出部と、
前記本文の単語毎に意味属性を解析する解析部と、
前記検索キーワードを履歴情報として格納する格納部と、
前記意味属性と前記履歴情報に基づいて前記複数の文書それぞれから文書特徴情報を生成する生成部と、
前記複数の文書それぞれの文書特徴情報をクラスタにし、各クラスタに含まれる複数の文書からクラスタ代表キーワードを抽出するクラスタ代表キーワード抽出部とを具備し、
前記表示部は、前記クラスタ代表キーワードを前記検索キーワードの次に検索すべき次検索キーワードの候補として表示することを特徴とする次検索キーワード提示装置。 - 前記格納部は、前記次検索キーワードの候補に対する操作を履歴情報としてさらに格納することを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記検索システムは、外部に設けられ、前記検索制御部から入力した前記検索キーワードを受信し、前記検索キーワードを含む複数の文書を前記検索制御部に送信することを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記解析部は、単語とその意味属性を列挙した辞書、あるいは語頭又は語尾の表現とその属性のルールを用いて前記本文の単語毎の意味属性を解析することを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記生成部は、前記履歴情報に含まれる前記検索キーワードの意味属性解析を行ない、文書特徴キーワードを抽出し、前記文書特徴キーワードの意味属性毎に前記辞書または前記ルールから確信度を集計することで文書特徴情報を生成することを特徴とする請求項4記載の次検索キーワード提示装置。
- 前記クラスタ代表キーワード抽出部は、前記クラスタからクラスタを代表するキーワードと、クラスタ内で文書を代表するキーワードの抽出を行なうことを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記表示部は、表示した前記複数の文書の周辺に次検索キーワードの候補を表示することを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記表示部は、カーソルが前記複数の文書に移動すると、前記複数の文書に対して次検索キーワードの候補を別のポップアップウインドウに表示することを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記生成部は、前記確信度と前記文書特徴キーワードが前記文書に出現する頻度とを掛けて、前記文書特徴情報を生成することを特徴とする請求項5記載の次検索キーワード提示装置。
- 前記クラスタ代表キーワード抽出部は、前記検索キーワードに対して前記クラスタが複数ある場合、前記クラスタ代表キーワードの集合に対して前記クラスタ代表キーワード同士の距離を計算し、前記クラスタ代表キーワードと前記クラスタ代表キーワードの距離がクラスタ間で最大となる組合せを採用することで抽出されることを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記検索キーワードに対して前記クラスタが複数ある場合、複数の前記クラスタ代表キーワードが前記表示部に表示されることを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記クラスタ代表キーワード抽出部は、前記クラスタに含まれる複数の文書から複数の文書代表キーワードを抽出し、複数の前記文書代表キーワードから前記クラスタ代表キーワードを抽出することを特徴とする請求項1記載の次検索キーワード提示装置。
- 前記検索キーワードに対して前記クラスタが一つの場合、複数の前記文書代表キーワードが前記表示部にさらに表示されることを特徴とする請求項11記載の次検索キーワード提示装置。
- 入力部が、入力した検索キーワードを受け取り、
検索制御部が、前記検索キーワードを検索システムに送信し、この検索システムが求めた前記検索キーワードを含む複数の文書を受信し、
表示部が、前記複数の文書を表示し、
本文抽出部が、前記複数の文書それぞれから本文を抽出し、
解析部が、前記本文の単語毎に意味属性を解析し、
格納部が、前記検索キーワードを履歴情報として格納し、
生成部が、前記意味属性と前記履歴情報に基づいて前記複数の文書それぞれから文書特徴情報を生成し、
クラスタ代表キーワード抽出部が、前記複数の文書それぞれの文書特徴情報をクラスタにし、各クラスタに含まれる複数の文書からクラスタ代表キーワードを抽出し、
前記表示部は、前記クラスタ代表キーワードを前記検索キーワードの次に検索すべき次検索キーワードの候補として表示することを特徴とする次検索キーワード提示方法。 - 入力部が、入力した検索キーワードを受け取るステップと、
検索制御部が、前記検索キーワードを検索システムに送信し、この検索システムが求めた前記検索キーワードを含む複数の文書を受信するステップと、
表示部が、前記複数の文書を表示するステップと、
本文抽出部が、前記複数の文書それぞれから本文を抽出するステップと、
解析部が、前記本文の単語毎に意味属性を解析するステップと、
格納部が、前記検索キーワードを履歴情報として格納するステップと、
生成部が、前記意味属性と前記履歴情報に基づいて前記複数の文書それぞれから文書特徴情報を生成するステップと、
クラスタ代表キーワード抽出部が、前記複数の文書それぞれの文書特徴情報をクラスタにし、各クラスタに含まれる複数の文書からクラスタ代表キーワードを抽出するステップと、
前記表示部は、前記クラスタ代表キーワードを前記検索キーワードの次に検索すべき次検索キーワードの候補として表示するステップとを具備することを特徴とする次検索キーワード提示プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008184896A JP5355949B2 (ja) | 2008-07-16 | 2008-07-16 | 次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム |
US12/437,584 US8229949B2 (en) | 2008-07-16 | 2009-05-08 | Apparatus, method and program product for presenting next search keyword |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008184896A JP5355949B2 (ja) | 2008-07-16 | 2008-07-16 | 次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010026640A true JP2010026640A (ja) | 2010-02-04 |
JP5355949B2 JP5355949B2 (ja) | 2013-11-27 |
Family
ID=41531181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008184896A Expired - Fee Related JP5355949B2 (ja) | 2008-07-16 | 2008-07-16 | 次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8229949B2 (ja) |
JP (1) | JP5355949B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012118964A (ja) * | 2010-11-29 | 2012-06-21 | Nhn Corp | 検索結果内に添付された情報データベースに基づいた検索リスト及び検索語順位の提供方法及びシステム |
JP2012138027A (ja) * | 2010-12-27 | 2012-07-19 | Toshiba Corp | 情報検索システム、検索キーワード提示方法、およびプログラム |
WO2013157592A1 (ja) * | 2012-04-19 | 2013-10-24 | 株式会社Karoya | インターネット広告検索支援プログラム |
JP2015026345A (ja) * | 2013-07-29 | 2015-02-05 | Necパーソナルコンピュータ株式会社 | 検索装置、検索システムおよびプログラム |
JP2017161976A (ja) * | 2016-03-07 | 2017-09-14 | 日本放送協会 | 興味情報処理装置およびプログラム |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8290958B2 (en) * | 2003-05-30 | 2012-10-16 | Dictaphone Corporation | Method, system, and apparatus for data reuse |
US8229942B1 (en) * | 2007-04-17 | 2012-07-24 | Google Inc. | Identifying negative keywords associated with advertisements |
US8086624B1 (en) | 2007-04-17 | 2011-12-27 | Google Inc. | Determining proximity to topics of advertisements |
JP4735726B2 (ja) * | 2009-02-18 | 2011-07-27 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
WO2010131333A1 (ja) * | 2009-05-12 | 2010-11-18 | パイオニア株式会社 | コンテンツ検索装置、コンテンツ検索方法、コンテンツ検索プログラムおよび記録媒体 |
CN101887436B (zh) * | 2009-05-12 | 2013-08-21 | 阿里巴巴集团控股有限公司 | 一种检索方法和装置 |
WO2011013191A1 (ja) | 2009-07-27 | 2011-02-03 | 株式会社 東芝 | 関連性提示装置、方法およびプログラム |
US20130124531A1 (en) * | 2010-09-08 | 2013-05-16 | Walter Bachtiger | Systems for extracting relevant and frequent key words from texts and their presentation in an auto-complete function of a search service |
KR101196935B1 (ko) * | 2010-07-05 | 2012-11-05 | 엔에이치엔(주) | 실시간 인기 키워드에 대한 대표 문구를 제공하는 방법 및 시스템 |
JP5639417B2 (ja) * | 2010-08-31 | 2014-12-10 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP2012212191A (ja) * | 2011-02-28 | 2012-11-01 | Toshiba Corp | 情報処理装置及び情報処理方法 |
CN102654868B (zh) * | 2011-03-02 | 2015-11-25 | 联想(北京)有限公司 | 一种基于关键字的搜索方法、搜索装置及服务器 |
JP5417471B2 (ja) * | 2012-03-14 | 2014-02-12 | 株式会社東芝 | 構造化文書管理装置、構造化文書検索方法 |
US20140208217A1 (en) | 2013-01-22 | 2014-07-24 | Splunk Inc. | Interface for managing splittable timestamps across event records |
US8682906B1 (en) | 2013-01-23 | 2014-03-25 | Splunk Inc. | Real time display of data field values based on manual editing of regular expressions |
US10394946B2 (en) | 2012-09-07 | 2019-08-27 | Splunk Inc. | Refining extraction rules based on selected text within events |
US9594814B2 (en) | 2012-09-07 | 2017-03-14 | Splunk Inc. | Advanced field extractor with modification of an extracted field |
US8751963B1 (en) | 2013-01-23 | 2014-06-10 | Splunk Inc. | Real time indication of previously extracted data fields for regular expressions |
US9753909B2 (en) | 2012-09-07 | 2017-09-05 | Splunk, Inc. | Advanced field extractor with multiple positive examples |
US8751499B1 (en) | 2013-01-22 | 2014-06-10 | Splunk Inc. | Variable representative sampling under resource constraints |
CN103838756A (zh) * | 2012-11-23 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 一种确定推送信息的方法及装置 |
US9152929B2 (en) | 2013-01-23 | 2015-10-06 | Splunk Inc. | Real time display of statistics and values for selected regular expressions |
CN104077011B (zh) * | 2013-03-26 | 2017-08-11 | 北京三星通信技术研究有限公司 | 一种同类型文档间的关联方法和终端设备 |
JP6135331B2 (ja) * | 2013-06-27 | 2017-05-31 | カシオ計算機株式会社 | 電子機器、プログラム、および、検索システム、検索方法 |
US9875218B2 (en) | 2014-01-28 | 2018-01-23 | International Business Machines Corporation | Document summarization |
CN104598630A (zh) * | 2015-02-05 | 2015-05-06 | 北京航空航天大学 | 一种事件索引与检索的方法及装置 |
CN106202057B (zh) * | 2016-08-30 | 2019-07-12 | 东软集团股份有限公司 | 相似新闻信息的识别方法和装置 |
US10459981B2 (en) | 2017-01-10 | 2019-10-29 | Oath Inc. | Computerized system and method for automatically generating and providing interactive query suggestions within an electronic mail system |
CN107291697A (zh) * | 2017-06-29 | 2017-10-24 | 浙江图讯科技股份有限公司 | 一种语义分析方法、电子设备、存储介质及其诊断系统 |
US10467343B2 (en) * | 2017-08-03 | 2019-11-05 | International Business Machines Corporation | Detecting problematic language in inclusion and exclusion criteria |
CN110825475A (zh) * | 2019-10-31 | 2020-02-21 | 维沃移动通信有限公司 | 一种输入方法及电子设备 |
KR102425770B1 (ko) * | 2020-04-13 | 2022-07-28 | 네이버 주식회사 | 급상승 검색어 제공 방법 및 시스템 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004220226A (ja) * | 2003-01-14 | 2004-08-05 | Oki Electric Ind Co Ltd | 検索文書のための文書分類方法及び装置 |
JP2006127325A (ja) * | 2004-10-29 | 2006-05-18 | Ntt Docomo Inc | コンテンツ発見装置、及び、コンテンツ発見方法 |
JP2006228255A (ja) * | 2006-05-12 | 2006-08-31 | Denso Corp | 適応的情報検索システム |
JP2008077137A (ja) * | 2006-09-19 | 2008-04-03 | Yafoo Japan Corp | ドキュメントデータを検索する方法、サーバ、およびプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6182068B1 (en) * | 1997-08-01 | 2001-01-30 | Ask Jeeves, Inc. | Personalized search methods |
US7693912B2 (en) * | 2005-10-31 | 2010-04-06 | Yahoo! Inc. | Methods for navigating collections of information in varying levels of detail |
JP4234740B2 (ja) | 2006-08-03 | 2009-03-04 | 株式会社東芝 | キーワード提示装置、プログラムおよびキーワード提示方法 |
US8280886B2 (en) * | 2008-02-13 | 2012-10-02 | Fujitsu Limited | Determining candidate terms related to terms of a query |
-
2008
- 2008-07-16 JP JP2008184896A patent/JP5355949B2/ja not_active Expired - Fee Related
-
2009
- 2009-05-08 US US12/437,584 patent/US8229949B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004220226A (ja) * | 2003-01-14 | 2004-08-05 | Oki Electric Ind Co Ltd | 検索文書のための文書分類方法及び装置 |
JP2006127325A (ja) * | 2004-10-29 | 2006-05-18 | Ntt Docomo Inc | コンテンツ発見装置、及び、コンテンツ発見方法 |
JP2006228255A (ja) * | 2006-05-12 | 2006-08-31 | Denso Corp | 適応的情報検索システム |
JP2008077137A (ja) * | 2006-09-19 | 2008-04-03 | Yafoo Japan Corp | ドキュメントデータを検索する方法、サーバ、およびプログラム |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012118964A (ja) * | 2010-11-29 | 2012-06-21 | Nhn Corp | 検索結果内に添付された情報データベースに基づいた検索リスト及び検索語順位の提供方法及びシステム |
JP2016157478A (ja) * | 2010-11-29 | 2016-09-01 | ネイバー コーポレーションNAVER Corporation | 検索結果内に添付された情報データベースに基づいた検索リスト及び検索語順位の提供方法及びシステム |
JP2017134870A (ja) * | 2010-11-29 | 2017-08-03 | ネイバー コーポレーションNAVER Corporation | 検索結果内に添付された情報データベースに基づいた検索リスト及び検索語順位の提供方法及びシステム |
JP2012138027A (ja) * | 2010-12-27 | 2012-07-19 | Toshiba Corp | 情報検索システム、検索キーワード提示方法、およびプログラム |
WO2013157592A1 (ja) * | 2012-04-19 | 2013-10-24 | 株式会社Karoya | インターネット広告検索支援プログラム |
JP2015026345A (ja) * | 2013-07-29 | 2015-02-05 | Necパーソナルコンピュータ株式会社 | 検索装置、検索システムおよびプログラム |
JP2017161976A (ja) * | 2016-03-07 | 2017-09-14 | 日本放送協会 | 興味情報処理装置およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5355949B2 (ja) | 2013-11-27 |
US20100017390A1 (en) | 2010-01-21 |
US8229949B2 (en) | 2012-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5355949B2 (ja) | 次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム | |
JP5257071B2 (ja) | 類似度計算装置及び情報検索装置 | |
US9122680B2 (en) | Information processing apparatus, information processing method, and program | |
US20130173610A1 (en) | Extracting Search-Focused Key N-Grams and/or Phrases for Relevance Rankings in Searches | |
KR101252397B1 (ko) | 웹을 이용한 정보 검색 방법 및 이를 사용하는 음성 대화 방법 | |
JP6361351B2 (ja) | 発話ワードをランク付けする方法、プログラム及び計算処理システム | |
US8874590B2 (en) | Apparatus and method for supporting keyword input | |
US10949452B2 (en) | Constructing content based on multi-sentence compression of source content | |
CN111046225B (zh) | 音频资源处理方法、装置、设备及存储介质 | |
JP2005310094A (ja) | キーワード拡張装置と方法およびコンテンツ検索システムならびにコンテンツ情報提供システムと方法およびグループ化条件決定装置と方法ならびにプログラム | |
US20110113046A1 (en) | Information processing apparatus, information extracting method, program, and information processing system | |
EP3996373A2 (en) | Method and apparatus of generating bullet comment, device, and storage medium | |
JP2009043156A (ja) | 番組検索装置および番組検索方法 | |
JP2015525929A (ja) | 検索品質を改善するための重みベースのステミング | |
JP2005250980A (ja) | 文書検索システム、検索条件入力装置、検索実行装置、文書検索方法、および文書検索プログラム | |
US20090327877A1 (en) | System and method for disambiguating text labeling content objects | |
JP2009223749A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
KR101651963B1 (ko) | 시공간 연관 정보 생성 방법, 이를 수행하는 시공간 연관 정보 생성 서버 및 이를 저장하는 기록매체 | |
JP2007193697A (ja) | 情報収集装置,情報収集方法およびプログラム | |
CN109977294B (zh) | 信息/查询处理装置、查询处理/文本查询方法、存储介质 | |
JP2012043115A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP2008077252A (ja) | 文書ランキング方法、文書検索方法、文書ランキング装置、文書検索装置、及び記録媒体 | |
CN110555202A (zh) | 文摘播报的生成方法和设备 | |
KR100832859B1 (ko) | 모바일 웹 콘텐츠 서비스 시스템 및 그 방법 | |
JP2004362121A (ja) | 情報検索装置、携帯情報端末装置、情報検索方法、情報検索プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110318 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111125 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20111205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130828 |
|
LAPS | Cancellation because of no payment of annual fees |