JP2015014993A - 検索意図辞書作成装置、検索意図辞書作成方法及び検索意図辞書作成プログラム - Google Patents
検索意図辞書作成装置、検索意図辞書作成方法及び検索意図辞書作成プログラム Download PDFInfo
- Publication number
- JP2015014993A JP2015014993A JP2013142578A JP2013142578A JP2015014993A JP 2015014993 A JP2015014993 A JP 2015014993A JP 2013142578 A JP2013142578 A JP 2013142578A JP 2013142578 A JP2013142578 A JP 2013142578A JP 2015014993 A JP2015014993 A JP 2015014993A
- Authority
- JP
- Japan
- Prior art keywords
- search
- intention
- search intention
- keyword
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】検索意図辞書作成装置1は、検索に供されたキーワードとこのキーワード以外の一つ以上のキーワードを含む検索クエリをキーワードに関連する検索クエリとして検索ログDB21から抽出する。次に、前記検索クエリから前記キーワードを削除した語を当該キーワードの検索意図の候補とし、候補毎に検索ログDB21から取得した検索クエリから検索意図の候補部分を削除した語の集合から選択した語を同位語とする。次に、検索ログDB21から取得した前記同位語を含む検索クエリから同位語を削除した語を同位語の検索意図の候補とし、この全ての候補から選択された検索意図の集合を同位語の集合に関連する検索意図候補とする。そして、この検索意図候補と前記キーワードの検索意図候補とに基づき一般的な検索意図と前記キーワードに特化した検索候補とに分類する。
【選択図】図1
Description
図1に示された検索意図辞書作成装置1は、検索エンジンの検索履歴を分析し、検索意図を特定するだけでなく、その検索意図がそのキーワードのみに特化したキーワードであるのか、それとも同様のクラスのキーワードに強く関連するものであるのかを特定する。これによると、例えば、その検索意図が非常に特化されたものを推薦に活用することや、特別なコンテンツと結び付けることができる。また、一般的なものであることが把握できれば、そのような意図の検索を受け付ける専門データベース等を準備できる。
検索意図辞書作成装置1は、図1に示されたように、ログフィルタ部11、キーワード検索意図候補特定部12、同位語獲得部13、クラス検索意図候補特定部14、検索意図分類部15を備える。
図2〜4の事例を参照しながら図5に示された本実施形態の処理手順S1〜S9について説明する。
以上の本実施形態の検索意図辞書作成装置1によれば、検索に供されたキーワードに関連する検索意図をより一般的な検索意図と特徴的な検索意図に分類した検索意図辞書が作成される。これにより、一般的な検索意図に対しては例えば専門データベースを用意した検索を行える。また、特徴的な検索意図に対してはこれに特化したコンテンツを用意できる。よって、検索意図を満たすための戦略の検討が可能となり、ユーザに対してはより満足度の高い情報提供を行える。
本発明は検索意図辞書作成装置1を構成する上記の機能部11〜15の一部若しくは全てとしてコンピュータを機能させるプログラムで構成しこれを当該コンピュータに実行させることで実現できる。または、同装置1が実行する上記の過程S1〜S9の一部若しくは全てをコンピュータに実行させるプログラムで構成しこれを当該コンピュータに実行させることで実現できる。そして、このプログラムをそのコンピュータが読み取り可能な周知の記録媒体、例えば、FD(Floppy(登録商標) Disk)や、MO(Magneto‐Optical disk)、ROM(Read Only Memory)、メモリカード、CD(Compact Disk)‐ROM、DVD(Digital Versatile Disk)‐ROM、CD‐R、CD‐RW、HDD、SSD、リムーバブルディスク等に格納して提供できる。または、前記プログラムをインターネットや電子メール等でネットワークを介して提供できる。
11…ログフィルタ部(検索クエリ抽出手段)
12…キーワード検索意図候補特定部(キーワード検索意図候補特定手段)
13…同位語獲得部(同位語獲得手段)
14…クラス検索意図候補特定部(クラス検索意図候補特定手段)
15…検索意図分類部(検索意図分類手段)
21…検索ログDB
22…検索意図DB(検索意図辞書)
Claims (8)
- 検索に供されたキーワードの検索意図の辞書を作成する検索意図辞書作成装置であって、
検索に供されたキーワード及びこのキーワード以外の一つ以上のキーワードを含む検索クエリをキーワードに関連する検索クエリとして検索エンジンの検索ログから抽出する検索クエリ抽出手段と、
前記抽出した検索クエリから前記キーワードを削除した語をキーワードの検索意図の候補として特定するキーワード検索意図候補特定手段と、
前記特定した検索意図の候補毎に検索ログから当該候補に関連する検索クエリを取得し、この検索クエリから検索意図の候補部分を削除した語を集計し、この語の集合から選択した語を同位語として取得する同位語獲得手段と、
前記取得した同位語を前記検索クエリ抽出手段に供して同位語を含む検索クエリを取得し、この検索クエリから同位語を削除した語を同位語の検索意図の候補として取得し、取得した全ての同位語の検索意図の候補から選択された検索意図の集合を同位語の集合に関連する検索意図候補として特定するクラス検索意図候補特定手段と、
前記キーワードの検索意図候補と前記同位語の集合に関連する検索意図候補とに基づき、一般的な検索意図と前記キーワードに特化した検索候補とに分類する検索意図分類手段と
を備えたこと
を特徴とする検索意図辞書作成装置。 - 前記検索意図分類手段は、前記キーワードの検索意図候補のうち前記同位語の集合に関連する検索意図候補に含まれる検索意図を一般的な検索意図に分類し、前記キーワードの検索意図候補のうち前記同位語の集合に関連する検索意図候補に含まれない検索意図を特徴的な検索意図に分類すること
を特徴とする請求項1に記載の検索意図辞書作成装置。 - 前記同位語獲得手段は、前記語の集合から所定の数若しくは所定の割合以上のパターンに出現する語を同位語と選択すること
を特徴とする請求項1または2に記載の検索意図辞書作成装置。 - 前記クラス検索意図候補特定手段は、取得した全ての同位語の検索意図の候補から所定の数若しくは所定の割合の同位語と結び付く検索意図候補を前記同位語の集合に関連する検索意図候補として特定すること
を特徴とする請求項1から3のいずれか1項に記載の検索意図辞書作成装置。 - 検索意図辞書作成装置が実行する検索意図辞書作成方法であって、
前記装置の検索クエリ抽出手段が検索に供されたキーワード及びこのキーワード以外の一つ以上のキーワードを含む検索クエリをキーワードに関連する検索クエリとして検索エンジンの検索ログから抽出するステップと、
前記装置のキーワード検索意図候補特定手段が前記抽出した検索クエリから前記キーワードを削除した語をキーワードの検索意図の候補として特定するステップと、
前記装置の同位語獲得手段が、前記特定した検索意図の候補毎に検索ログから当該候補に関連する検索クエリを取得し、この検索クエリから検索意図の候補部分を削除した語を集計し、この語の集合から選択した語を同位語として取得するステップと、
前記装置のクラス検索意図候補特定手段が、前記取得した同位語を前記検索クエリ抽出手段に供して同位語を含む検索クエリを取得し、この検索クエリから同位語を削除した語を同位語の検索意図の候補として取得し、取得した全ての同位語の検索意図の候補から選択された検索意図の集合を同位語の集合に関連する検索意図候補として特定するステップと、
前記装置の検索意図分類手段が、前記キーワードの検索意図候補と前記同位語の集合に関連する検索意図候補とに基づき、一般的な検索意図と前記キーワードに特化した検索候補とに分類するステップと
を有すること
を特徴とする検索意図辞書作成方法。 - 前記分類するステップでは、前記キーワードの検索意図候補のうち前記同位語の集合に関連する検索意図候補に含まれる検索意図を一般的な検索意図に分類し、前記キーワードの検索意図候補のうち前記同位語の集合に関連する検索意図候補に含まれない検索意図を特徴的な検索意図に分類すること
を特徴とする請求項5に記載の検索意図辞書作成方法。 - 前記同位語の集合に関連する検索意図候補として特定するステップでは、取得した全ての同位語の検索意図の候補から所定の数若しくは所定の割合の同位語と結び付く検索意図候補を前記同位語の集合に関連する検索意図候補として特定すること
を特徴とする請求項5または6に記載の検索意図辞書作成方法。 - コンピュータを請求項1から4のいずれか1項に記載の検索意図辞書作成装置を構成する各手段として機能させることを特徴とする検索意図辞書作成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013142578A JP5944867B2 (ja) | 2013-07-08 | 2013-07-08 | 検索意図辞書作成装置、検索意図辞書作成方法及び検索意図辞書作成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013142578A JP5944867B2 (ja) | 2013-07-08 | 2013-07-08 | 検索意図辞書作成装置、検索意図辞書作成方法及び検索意図辞書作成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015014993A true JP2015014993A (ja) | 2015-01-22 |
JP5944867B2 JP5944867B2 (ja) | 2016-07-05 |
Family
ID=52436667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013142578A Active JP5944867B2 (ja) | 2013-07-08 | 2013-07-08 | 検索意図辞書作成装置、検索意図辞書作成方法及び検索意図辞書作成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5944867B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6026036B1 (ja) * | 2016-04-08 | 2016-11-16 | 株式会社Ubic | データ分析システム、その制御方法、プログラム、及び、記録媒体 |
CN110390004A (zh) * | 2019-06-28 | 2019-10-29 | 联想(北京)有限公司 | 一种信息处理方法、电子设备和存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010257406A (ja) * | 2009-04-28 | 2010-11-11 | Yahoo Japan Corp | 適正単語取得装置、機械学習装置及び方法 |
-
2013
- 2013-07-08 JP JP2013142578A patent/JP5944867B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010257406A (ja) * | 2009-04-28 | 2010-11-11 | Yahoo Japan Corp | 適正単語取得装置、機械学習装置及び方法 |
Non-Patent Citations (4)
Title |
---|
JPN6016018395; 伊藤 淳、外5名: 'クエリログをコーパスとした意味知識獲得法の改善' 第2回データ工学と情報マネジメントに関するフォーラム-DEIM 2010-論文集 , 20100609, p.1-6, 電子情報通信学会データ工学研究専門委員会 * |
JPN6016018397; 上田 理恵子、外2名: 'クエリログの時系列的関係性を用いた非共起的関連語句の抽出とその応用' 電子情報通信学会 第19回データ工学ワークショップ論文集 , 20090625, p.1-8, 電子情報通信学会データ工学研究専門委員会 * |
JPN6016018399; 松本 章代、外5名: 'ページ内の意味的係り関係に基づくWWWページ検索結果の絞り込みについて' 情報処理学会研究報告 第2003巻,第108号, 20031107, p.87-93, 社団法人情報処理学会 * |
JPN6016018401; 小町 守、外1名: '検索ログを用いた意味知識獲得のためのブートストラップ手法' 電子情報通信学会技術研究報告 第107巻,第246号, 20070928, p.13-18, 社団法人電子情報通信学会 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6026036B1 (ja) * | 2016-04-08 | 2016-11-16 | 株式会社Ubic | データ分析システム、その制御方法、プログラム、及び、記録媒体 |
JP2017188025A (ja) * | 2016-04-08 | 2017-10-12 | 株式会社Ubic | データ分析システム、その制御方法、プログラム、及び、記録媒体 |
CN110390004A (zh) * | 2019-06-28 | 2019-10-29 | 联想(北京)有限公司 | 一种信息处理方法、电子设备和存储介质 |
CN110390004B (zh) * | 2019-06-28 | 2022-04-19 | 联想(北京)有限公司 | 一种信息处理方法、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5944867B2 (ja) | 2016-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11126647B2 (en) | System and method for hierarchically organizing documents based on document portions | |
US11853334B2 (en) | Systems and methods for generating and using aggregated search indices and non-aggregated value storage | |
CN108280114B (zh) | 一种基于深度学习的用户文献阅读兴趣分析方法 | |
CN107862022B (zh) | 文化资源推荐系统 | |
KR101577376B1 (ko) | 텍스트 기준점 기반의 저작권 침해 판단 시스템 및 그 방법 | |
WO2017113592A1 (zh) | 模型生成方法、词语赋权方法、装置、设备及计算机存储介质 | |
US20150302036A1 (en) | Method, system and computer program for information retrieval using content algebra | |
US20120239657A1 (en) | Category classification processing device and method | |
JP7395377B2 (ja) | コンテンツ検索方法、装置、機器、および記憶媒体 | |
Maciołek et al. | Cluo: Web-scale text mining system for open source intelligence purposes | |
JP5944867B2 (ja) | 検索意図辞書作成装置、検索意図辞書作成方法及び検索意図辞書作成プログラム | |
US8484221B2 (en) | Adaptive routing of documents to searchable indexes | |
Yuan et al. | A mathematical information retrieval system based on RankBoost | |
KR101880474B1 (ko) | 고부가 가치화 콘텐츠 정보서비스를 위한 키워드 기반 서비스 제공 방법, 이를 구현하기 위한 프로그램이 저장된 기록매체 및 이를 구현하기 위해 매체에 저장된 컴퓨터프로그램 | |
US9824140B2 (en) | Method of creating classification pattern, apparatus, and recording medium | |
JP2014102625A (ja) | 情報検索システム、プログラム、および方法 | |
CN112131215B (zh) | 自底向上的数据库信息获取方法及装置 | |
JP5308918B2 (ja) | キーワード抽出方法、キーワード抽出装置およびキーワード抽出プログラム | |
Peng et al. | A threat actions extraction method based on the conditional co-occurrence degree | |
KR101331946B1 (ko) | 와일드카드 매칭을 이용한 검색 방법 | |
KR101414999B1 (ko) | 태그 기반 불리언 질의 매칭을 이용한 검색 결과 제공 방법 및 시스템 | |
JP5399988B2 (ja) | 重要日時表現判定方法、重要日時表現判定装置、重要日時表現判定プログラム | |
CN108268552B (zh) | 网站信息的处理方法及装置 | |
JP5596623B2 (ja) | 文書情報分析装置、文書情報分析方法、文書情報分析プログラム | |
CN111324726A (zh) | 一种专利数据库自动去燥的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150727 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160518 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160526 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5944867 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |