JP5547669B2 - 関連語抽出装置、関連語抽出方法、関連語抽出プログラム - Google Patents
関連語抽出装置、関連語抽出方法、関連語抽出プログラム Download PDFInfo
- Publication number
- JP5547669B2 JP5547669B2 JP2011025579A JP2011025579A JP5547669B2 JP 5547669 B2 JP5547669 B2 JP 5547669B2 JP 2011025579 A JP2011025579 A JP 2011025579A JP 2011025579 A JP2011025579 A JP 2011025579A JP 5547669 B2 JP5547669 B2 JP 5547669B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- word
- group
- related word
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1に基づき本発明の第1実施形態に係る関連語抽出装置を説明する。この抽出装置1は、検索エンジン2の検索ログDB3から検索語に関連する関連語を抽出し、抽出された関連語を検索エンジン2の要求に応じて出力する。具体的には、前記抽出装置1は、コンピュータにより構成され、通常のコンピュータのハードウェアリソース、例えばCPU.メモリ(RAM).ハードディスクドライブ装置などを備える。
図9は、本発明の第2実施形態に係る関連語抽出装置を示している。この抽出装置11には、前記DB7の保存データをクラスタリングするクラスタリング手段9が設けられている。ここではバーストした検索語に対する関連語グループを再グループ化する。
クラスタリング手段9は、前記DB7に格納された関連語グループ単位ではなく、関連語単位でクラスタリングすることもできる。このクラスタリングには前記DB3に保存されたクリックログを用いる。
クラスタリング手段9は、前記DB7の関連語グループ群を関連語の類似性ではなく、各関連語グループのクリック先の情報でクラスタリングすることもできる。
本発明は、前記抽出装置1.11の各手段4〜9の一部もしくは全部として、コンピュータを機能させる関連語抽出プログラムとして構成することもできる。この関連語抽出プログラムによれば、前記各ステップの一部あるいは全部をコンピュータに実行させることが可能となる。
2…検索エンジン
3…検索ログDB(データベース)
4…バースト検出手段(検出手段)
5…バースト情報DB(データベース)
6…関連語抽出手段
7…バースト関連語情報DB(データベース)
8…関連語出力手段
9…クラスタリング手段
Claims (9)
- あらかじめ検索エンジンの検索ログに基づき検索語に関連する関連語を抽出し、検索エンジンの要求に応じてユーザ入力の検索語の関連語を返答する関連語抽出装置であって、
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出手段と、
検出手段の検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出手段と、
検索エンジンの要求に応じてデータベースの各グループからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力手段と、を備え、
関連語抽出手段は、検出手段による検索語の検索日前の任意期間における関連語の検索語との共起回数を該検索語の検索回数で除算したスコアの平均を、前記検出日における前記共起回数を該検索語の検索回数で除算したスコア情報からそれぞれ減算し、減算された前記スコア情報の順に関連語群を抽出する
ことを特徴とする関連語抽出装置。 - あらかじめ検索エンジンの検索ログに基づき検索語に関連する関連語を抽出し、検索エンジンの要求に応じてユーザ入力の検索語の関連語を返答する関連語抽出装置であって、
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出手段と、
検出手段の検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出手段と、
データベースに保存されたグループ群をそれぞれのグループ内の各関連語の類似性でクラスタリングして各グループを統合して再構築し、データベースを更新するクラスタリング手段と、
検索エンジンの要求に応じてクラスタリング手段により更新されたデータベースの各グループからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力手段と、
を備えることを特徴とする関連語抽出装置。 - あらかじめ検索エンジンの検索ログに基づき検索語に関連する関連語を抽出し、検索エンジンの要求に応じてユーザ入力の検索語の関連語を返答する関連語抽出装置であって、
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出手段と、
検出手段の検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出手段と、
検索ログ中のクリックログからデータベース中の検索語および関連語からクリックされたクリック先の情報を抽出し、抽出されたクリック先の情報に応じてデータベース中の関連語群をクラスタリングしてグループを再構築し、データベースを更新するクラスタリング手段と、
検索エンジンの要求に応じてクラスタリング手段により更新されたデータベースの各グループからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力手段と、
を備えることを特徴とする関連語抽出装置。 - あらかじめ検索エンジンの検索ログに基づき検索語に関連する関連語を抽出し、検索エンジンの要求に応じてユーザ入力の検索語の関連語を返答する関連語抽出装置であって、
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出手段と、
検出手段の検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出手段と、
データベースに保存されたグループ内の各関連語からクリックされたクリック先の情報を検索ログ中のクリックログから抽出し、抽出されたクリック先の情報でグループ群をクラスタリングして統合して再構築し、データベースのレコードを更新するクラスタリング手段と、
検索エンジンの要求に応じてクラスタリング手段により更新されたデータベースの各グループからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力手段と、
を備えることを特徴とする関連語抽出装置。 - あらかじめ検索エンジンの検索ログに基づき検索語に関連する関連語を抽出し、検索エンジンの要求に応じてユーザ入力の検索語の関連語を返答する装置の実行する関連語抽出方法であって、
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出ステップと、
検出ステップで検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出ステップと、
検索エンジンの要求に応じてデータベースの各グループからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力ステップと、を備え、
関連語抽出ステップにおいて、検出ステップによる検索語の検索日前の任意期間における関連語の検索語との共起回数を該検索語の検索回数で除算したスコアの平均を、前記検出日における前記共起回数を該検索語の検索回数で除算したスコア情報からそれぞれ減算し、減算された前記スコア情報の順に関連語群を抽出する
ことを特徴とする関連語抽出方法。 - あらかじめ検索エンジンの検索ログに基づき検索語に関連する関連語を抽出し、検索エンジンの要求に応じてユーザ入力の検索語の関連語を返答する装置の実行する関連語抽出方法であって、
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出ステップと、
検出ステップで検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出ステップと、
データベースに保存されたグループ群をそれぞれのグループ内の各関連語の類似性でクラスタリングして各グループを統合して再構築し、データベースを更新するクラスタリングステップと、
検索エンジンの要求に応じてクラスタリングステップで更新されたデータベースの各グループからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力ステップと、
を有することを特徴とする関連語抽出方法。 - あらかじめ検索エンジンの検索ログに基づき検索語に関連する関連語を抽出し、検索エンジンの要求に応じてユーザ入力の検索語の関連語を返答する装置の実行する関連語抽出方法であって、
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出ステップと、
検出ステップで検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出ステップと、
検索ログ中のクリックログからデータベース中の検索語および関連語からクリックされたクリック先の情報を抽出し、抽出されたクリック先の情報に応じてデータベース中の関連語群をクラスタリングしてグループを再構築し、データベースを更新するクラスタリングステップと、
検索エンジンの要求に応じてクラスタリングステップで更新されたデータベースの各グループからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力ステップと、
を有することを特徴とする関連語抽出方法。 - あらかじめ検索エンジンの検索ログに基づき検索語に関連する関連語を抽出し、検索エンジンの要求に応じてユーザ入力の検索語の関連語を返答する装置の実行する関連語抽出方法であって、
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出ステップと、
検出ステップで検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出ステップと、
データベースに保存されたグループ内の各関連語からクリックされたクリック先の情報を検索ログ中のクリックログから抽出し、抽出されたクリック先の情報でグループ群をクラスタリングして統合して再構築し、データベースのレコードを更新するクラスタリングステップと、
検索エンジンの要求に応じてクラスタリングステップで更新されたデータベースの各グループからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力ステップと、
を有することを特徴とする関連語抽出方法。 - 請求項1〜4記載の関連語抽出装置の各手段としてコンピュータを機能させる関連語抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011025579A JP5547669B2 (ja) | 2011-02-09 | 2011-02-09 | 関連語抽出装置、関連語抽出方法、関連語抽出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011025579A JP5547669B2 (ja) | 2011-02-09 | 2011-02-09 | 関連語抽出装置、関連語抽出方法、関連語抽出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012164242A JP2012164242A (ja) | 2012-08-30 |
JP5547669B2 true JP5547669B2 (ja) | 2014-07-16 |
Family
ID=46843554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011025579A Expired - Fee Related JP5547669B2 (ja) | 2011-02-09 | 2011-02-09 | 関連語抽出装置、関連語抽出方法、関連語抽出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5547669B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100813831B1 (ko) * | 2002-04-12 | 2008-03-17 | 삼성에스디아이 주식회사 | 전극롤 권취용 맨드릴 |
JP5901499B2 (ja) * | 2012-11-08 | 2016-04-13 | 日本電信電話株式会社 | バースト検出装置、バースト検出方法、及びプログラム |
US10740819B2 (en) * | 2014-04-23 | 2020-08-11 | Rakuten, Inc. | Information providing device, method, and non-transitory medium for interactive search refinement |
CN108256070B (zh) * | 2018-01-17 | 2022-07-15 | 北京百度网讯科技有限公司 | 用于生成信息的方法和装置 |
JP2019160239A (ja) * | 2018-03-16 | 2019-09-19 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | 解析装置、解析方法及びコンピュータープログラム |
JP6679682B2 (ja) * | 2018-09-20 | 2020-04-15 | ヤフー株式会社 | 特定装置、特定方法及び特定プログラム |
KR102425770B1 (ko) * | 2020-04-13 | 2022-07-28 | 네이버 주식회사 | 급상승 검색어 제공 방법 및 시스템 |
JP7262863B2 (ja) * | 2020-11-04 | 2023-04-24 | データ・サイエンティスト株式会社 | 検索ニーズ評価プログラム、検索ニーズ評価装置および検索ニーズ評価方法、ならびに、評価プログラム、評価装置および評価方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4781741B2 (ja) * | 2005-07-25 | 2011-09-28 | ヤフー株式会社 | 情報検索システム、情報検索プログラム |
-
2011
- 2011-02-09 JP JP2011025579A patent/JP5547669B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012164242A (ja) | 2012-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5547669B2 (ja) | 関連語抽出装置、関連語抽出方法、関連語抽出プログラム | |
US9830386B2 (en) | Determining trending topics in social media | |
US8589399B1 (en) | Assigning terms of interest to an entity | |
JP6538277B2 (ja) | 検索クエリ間におけるクエリパターンおよび関連する総統計の特定 | |
US9088808B1 (en) | User interaction based related videos | |
Yu et al. | Identifying restaurant features via sentiment analysis on yelp reviews | |
US10592841B2 (en) | Automatic clustering by topic and prioritizing online feed items | |
US20100125531A1 (en) | System and method for the automated filtering of reviews for marketability | |
WO2012174637A1 (en) | System and method for matching comment data to text data | |
US9344507B2 (en) | Method of processing web access information and server implementing same | |
US8838580B2 (en) | Method and system for providing keyword ranking using common affix | |
JP6529133B2 (ja) | 複数地域でのトピックの評価を分析する装置、プログラム及び方法 | |
US20180189291A1 (en) | Method and apparatus for sorting related searches | |
US9996529B2 (en) | Method and system for generating dynamic themes for social data | |
US9792377B2 (en) | Sentiment trent visualization relating to an event occuring in a particular geographic region | |
US9552415B2 (en) | Category classification processing device and method | |
JP5341847B2 (ja) | 検索クエリ推薦方法、検索クエリ推薦装置、検索クエリ推薦プログラム | |
US8214350B1 (en) | Pre-computed impression lists | |
WO2016027364A1 (ja) | 話題クラスタ選択装置、及び検索方法 | |
US20180005300A1 (en) | Information presentation device, information presentation method, and computer program product | |
JP6142617B2 (ja) | 情報処理装置、情報処理方法及び情報処理用プログラム | |
Daoud et al. | Mining query-driven contexts for geographic and temporal search | |
JP5844887B2 (ja) | 通信ネットワークを通じたビデオ・コンテンツ検索のための支援 | |
JP5551665B2 (ja) | 情報抽出装置、情報抽出方法、情報抽出プログラム | |
US8752184B1 (en) | Spam detection for user-generated multimedia items based on keyword stuffing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131210 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140225 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140513 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140515 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5547669 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |