JP2009169924A - 特徴的キーワード検出装置、特徴的キーワード検出方法、プログラムおよび記録媒体 - Google Patents
特徴的キーワード検出装置、特徴的キーワード検出方法、プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP2009169924A JP2009169924A JP2008039674A JP2008039674A JP2009169924A JP 2009169924 A JP2009169924 A JP 2009169924A JP 2008039674 A JP2008039674 A JP 2008039674A JP 2008039674 A JP2008039674 A JP 2008039674A JP 2009169924 A JP2009169924 A JP 2009169924A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- characteristic
- importance
- keywords
- characteristic keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】所定のユーザが、所定のデバイスを操作した操作内容を検出する操作内容検出手段と、上記所定のユーザがPCを操作した操作時間を検出する操作時間検出手段と、上記検出された操作内容と操作時間とに基づいて、上記ユーザにとって特徴的なキーワードを検出する特徴的キーワード検出手段とを有する特徴的キーワード検出装置である。
【選択図】図1
Description
戸田浩之、中渡瀬秀一、片岡良治著「特徴的な固有表現を用いたラベル指向ナビゲーション手法の提案」情報処理学会論文誌:データベース、Vol.46、No.SIG13(TOD27)、pp.40-52、2005年 森田哲之、倉恒子、日高哲雄、大浦啓一郎、田中明通、加藤泰久、奥雅博著「Memory-Retriever:体験獲得情報を想起させる行動検索手法」情報処理学会論文誌、Vol48 No.3、pp.1197−1208、2007年
IW(url,st,et):期間[st,et]におけるWebページURLの重要度、
apj:期間[st,et]において、Webページurl(URL)を表示していたアクティブ期間、
url:Webページ、
j:Webページurlの表示回数。
1.操作履歴のテキスト中に含まれている特徴的なキーワードを抽出する作業と、
2.ユーザの操作履歴に基づいて、キーワードの重要度を決定する作業と、
を行う。
である。
である。
である。
関連キーワードrkの重みRK(rkIW(url,st,et))=α・IW(url,st,et)×freq(rkIW(url,st,et))×HTML(rkIW(url,st,et))
である。
検索エンジンに、キーワードを入力し、出力されたWebページのHIT数のidf値を、キーワード固有の重要度であるとする。WebページのHIT数が、高ければ高いほど、特徴的でないキーワードである可能性が高いので、この指標を導入する。
である。
Wikipediaは、見出し語(キーワード)毎に、ページを持つ特性がある。そして、各見出し語間は、互いに密なリンク構造を持っている。そこで、実施例1では、キーワードが、Wikipediaの見出し語に存在していれば、Wikipediaのハイパーリンク構造を考慮した重要度を、そのキーワードに付与する。
Wikipedia内において、出現頻度が特徴的なキーワードは、重要であると、予想される。そこで、Wikipedia内におけるキーワードのdf、tf、idf、tf・idf値を用いて、キーワード重要度を算出する。
goo(登録商標)等のポータルサイト内における検索クエリのログを用いて、キーワードの重要度を決定する。検索クエリの傾向として、主に長期にわたって頻繁に検索されているキーワードや、一時的に話題になり、急激に検索回数が上昇するキーワード等、検索クエリの傾向は、様々である。実施例1において、このような傾向を、キーワードの重要度として考慮する。キーワードkの重要度IRF(k)は、検索エンジンのクエリログを用いたキーワードkの重要度であり、次の通りである。
5.キーワードの長さ
一般的に、特徴的なキーワードは、長ければ長いほど、特徴的であると言える。たとえば、鈴木と鈴木太郎というキーワードがある場合、鈴木だけでは、同姓全体の鈴木を指すが、鈴木太郎は、鈴木太郎という個人を指す。このように、キーワードは長ければ長いほど、意味的に絞り込まれているキーワードであり、長ければ長いほど、文字単位での出現確率も低くなるので、長いキーワードほど特徴的である。
Wikipediaの見出し語のページには、複数のリンク構造があり、これらのリンク構造を用いて、キーワード固有重要度の高いものを、関連キーワードとして抽出する。関連キーワード抽出に使用するリンク構造は、以下のものである。
1−2:Wikipediaの見出し語内のページに含まれるリンク先のリンク、
1−3:Wikipediaの見出し語内のページに含まれる双方向から張られている相互リンク、
1−4:Wikipediaの見出し語の被リンク。
Webニュースやブログ等、同一文書内において、互いに同時に頻出するキーワードを、関連キーワードとして抽出する。同時出現頻度が高ければ高いほど、そのキーワードは、関連があるとし、重要な関連キーワードであるとして扱う。
1.検索エンジンのHIT数のIDF。
なお、WebIDF(k):検索エンジンのHIT数を用いたキーワードkの重要度、
N:キーワードkの検索エンジンのHIT数の閾値、
nk:キーワードkを入力したときの検索エンジンのHIT数
である。
h(p):ページpのhub値、
a(p):ページpのauthority値、
flink(p):ページpのリンク数、
blink(p):ページpの被リンク数、
text(p):ページpに含まれているテキスト量、
redirect(p):ページpに張られているリダイレクト数、
multi(p):ページpに含まれているWikipediaの多言語リンク数、
category(p):ページpに含まれているWikipediaのカテゴリ数、
count(p):ページp内の全てのリンク数合計。
である。
部分(式(6)中の部分)は、hubの持っているリンクの平均的な質を調べる指標である。多数のリンクを持っていても、リンク先のページの質が低ければ、そのhubの価値は低いと言えるので、上記指標(式(6))を導入した。
・数値が並び、最後に「年代」があるキーワード(例)1980年代、
・○月○日等のキーワード。(例)12月20日、
・○○の歴史等のキーワード。(例)アメリカの歴史、
・○○一覧等のキーワード。(例)日本の男優一覧、
・○○年の△△等のキーワード。(例)2007年のJリーグ。
link_score(k)=α・h(pk)+β・a(pk)
link_score(k)=h(pk)×a(pk)
ここで、係数αとβとは、α+β=1を満たす。
なお、
final_link_score(k):キーワードkの最終リンクスコア、
rank(k):リンクスコアから算出したキーワードkの順位、
total(K):キーワードの総数、
R:1位のキーワードの最終リンクスコア、
a:スコアの勾配係数。
である。
1.ユーザの押したアンカーリンクに含まれているキーワードの重要度決定。
なお、
Cu(k):ユーザが押したアンカーリンクに含まれているキーワードkの重要度、
click_unker_link(k):キーワードkを含むアンカーリンクを押した回数、
k:キーワード。
である。
なお、
p:閲覧したWebページ、
P:閲覧した全てのWebページ集合、
kp:閲覧したWebページpに含まれているキーワードk、
Kt:閲覧したWebページp中に含まれている全てのキーワードkの集合、
tf(kp):閲覧したWebページp中に含まれているキーワードkの頻度、
である。
なお、
IW(p):IW(p,st,et)と同義。st,etの記述は省略する、
Cu(kp):ユーザのクリックしたアンカーリンクにキーワードが含まれていれば、1を代入し、キーワードが含まれていなければ、0を代入する、
a:スコアの勾配係数。
である。
EX1、EX2、EX3…操作履歴抽出装置、
SV2…操作履歴加工サーバ、
21…操作履歴受信手段、
221…ユーザ認証手段、
23…キーワード抽出手段、
24…キーワード重要度算出手段、
25…外部コンテンツ取得・蓄積手段、
26…画面表示制御手段、
27…お勧めキーワード出力手段、
DB1…辞書データベース、
DB2…認証データベース、
DB3…コンテンツデータベース、
DB4……加工済み履歴データベース、
MT1、MT2、MT3…モバイル端末。
Claims (10)
- 所定のユーザが、所定のデバイスを操作した操作内容を検出する操作内容検出手段と;
上記所定のユーザがPCを操作した操作時間を検出する操作時間検出手段と;
上記検出された操作内容と操作時間とに基づいて、上記ユーザにとって特徴的なキーワードを検出する特徴的キーワード検出手段と;
を有することを特徴とする特徴的キーワード検出装置。 - 請求項1において、
上記デバイスは、PCであり、
上記特徴的キーワード検出手段は、PC上の操作履歴から、特徴的キーワードを検出する手段であり、上記特徴的キーワードとして、複合語を検出する手段であることを特徴とする特徴的キーワード検出装置。 - 請求項1において、
上記特徴的キーワード検出手段が検出した特徴的キーワードと、上記特徴的キーワードと関連する関連語とを、モバイル端末に送信し、上記モバイル端末の表示画面において、上記特徴的なキーワードを、ユーザの指定した期間毎に、一覧表示させるように制御する画面表示制御手段を有することを特徴とする特徴的キーワード検出装置。 - 請求項1において、
上記検出された操作内容と操作時間とに基づいて、特徴的キーワードの重要度を算出する特徴的キーワードの重要度算出手段と;
キーワード固有の重要度を算出するキーワード固有の重要度算出手段と;
上記算出された特徴的キーワードの重要度を、記憶装置に記憶する特徴的キーワードの重要度記憶手段と;
上記操作内容と操作時間と、上記キーワード固有の重要度算出手段が算出したキーワード固有の重要度とに基づいて、最終的なキーワード重要度を決定する最終的キーワードの重要度決定手段と;
キーワードに関連する関連キーワードを抽出する関連キーワード抽出手段と;
モバイル端末上で、特徴的キーワードのみを並べて表示させる表示制御手段と;
を有することを特徴とする特徴的キーワード検出装置。 - 所定のユーザが、所定のデバイスを操作した操作内容を、操作内容検出手段が、検出し、記憶装置に記憶する操作内容検出工程と;
上記所定のユーザがPCを操作した操作時間を、操作時間検出手段が、検出し、記憶装置に記憶する操作時間検出工程と;
上記検出された操作内容と操作時間とに基づいて、上記ユーザにとって特徴的なキーワードを、特徴的キーワード検出手段が、検出し、記憶装置に記憶する特徴的キーワード検出工程と;
を有することを特徴とする特徴的キーワード検出方法。 - 請求項5において、
上記デバイスは、PCであり、
上記特徴的キーワード検出工程は、PC上の操作履歴から、特徴的キーワードを検出する工程であり、上記特徴的キーワードとして、複合語を検出する工程であることを特徴とする特徴的キーワード検出方法。 - 請求項5において、
上記特徴的キーワード検出工程で検出された特徴的キーワードと、上記特徴的キーワードと関連する関連語とを、画面表示制御手段が、モバイル端末に送信し、上記モバイル端末の表示画面において、上記特徴的なキーワードを一覧表示させるように制御する画面表示制御工程を有することを特徴とする特徴的キーワード検出方法。 - 請求項5において、
上記検出された操作内容と操作時間とに基づいて、特徴的キーワードの重要度を、特徴的キーワードの重要度算出手段が算出する特徴的キーワードの重要度算出工程と;
上記算出された特徴的キーワードの重要度を、記憶装置に記憶する特徴的キーワードの重要度記憶工程と;
上記操作内容と操作時間と、上記キーワード固有の重要度算出工程が算出したキーワード固有の重要度とに基づいて、最終的キーワードの重要度決定手段が、最終的なキーワード重要度を決定し、記憶装置に記憶する最終的キーワードの重要度決定工程と;
関連キーワード抽出手段が、キーワードに関連する関連キーワードを抽出し、記憶装置に記憶する関連キーワード抽出工程と;
表示制御手段が、モバイル端末上で、特徴的キーワードのみを並べて表示させる表示制御工程と;
を有することを特徴とする特徴的キーワード検出方法。 - 請求項1〜請求項4のいずれか1項記載の特徴的キーワード検出装置を構成する各手段として、コンピュータを機能させるプログラム。
- 請求項9記載のプログラムを記録したコンピュータ読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008039674A JP4917061B2 (ja) | 2007-12-18 | 2008-02-21 | 特徴的キーワード検出装置、特徴的キーワード検出方法、プログラムおよび記録媒体 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007326325 | 2007-12-18 | ||
JP2007326325 | 2007-12-18 | ||
JP2008039674A JP4917061B2 (ja) | 2007-12-18 | 2008-02-21 | 特徴的キーワード検出装置、特徴的キーワード検出方法、プログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009169924A true JP2009169924A (ja) | 2009-07-30 |
JP4917061B2 JP4917061B2 (ja) | 2012-04-18 |
Family
ID=40970974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008039674A Active JP4917061B2 (ja) | 2007-12-18 | 2008-02-21 | 特徴的キーワード検出装置、特徴的キーワード検出方法、プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4917061B2 (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011164851A (ja) * | 2010-02-08 | 2011-08-25 | Nec Personal Products Co Ltd | 情報処理装置、プログラム及び記録媒体 |
JP2012243327A (ja) * | 2012-09-03 | 2012-12-10 | Toshiba Corp | プログラム、情報処理装置および情報処理装置の情報処理方法 |
WO2013081282A1 (en) * | 2011-11-30 | 2013-06-06 | Samsung Electronics Co., Ltd. | System and method for recommending application by using keyword |
JP2013527956A (ja) * | 2010-04-16 | 2013-07-04 | マイクロソフト コーポレーション | 交流用ホーム・ページ |
JP2013171450A (ja) * | 2012-02-21 | 2013-09-02 | Ntt Docomo Inc | 関連語取得装置及び関連語取得方法 |
JP2015503151A (ja) * | 2011-12-13 | 2015-01-29 | インテル・コーポレーション | メタデータをベースとしたインフラストラクチャによる複数のメディアタイプのリアルタイムマッピング及びナビゲーション |
US8972842B2 (en) | 2011-05-18 | 2015-03-03 | Kabushiki Kaisha Toshiba | Method of processing data for an information processing apparatus |
JP2016057767A (ja) * | 2014-09-08 | 2016-04-21 | Kddi株式会社 | 解析装置、解析方法およびコンピュータプログラム |
JP2016126802A (ja) * | 2015-01-08 | 2016-07-11 | ネイバー コーポレーションNAVER Corporation | リターゲティング検索サービスを提供する方法およびシステム |
JP2017076376A (ja) * | 2016-09-12 | 2017-04-20 | ヤフー株式会社 | 算出装置、算出方法および算出プログラム |
WO2023112170A1 (ja) * | 2021-12-14 | 2023-06-22 | 日本電信電話株式会社 | ログ出力装置、ログ出力方法およびログ出力プログラム |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62244259A (ja) * | 1986-04-16 | 1987-10-24 | Hitachi Ltd | 永久磁石形電動機 |
JPS63244259A (ja) * | 1987-03-31 | 1988-10-11 | Matsushita Electric Ind Co Ltd | キ−ワ−ド抽出装置 |
JP2000090109A (ja) * | 1998-09-10 | 2000-03-31 | Sharp Corp | 情報管理装置、および、そのプログラムが記録された記録媒体 |
JP2003281159A (ja) * | 2002-03-19 | 2003-10-03 | Fuji Xerox Co Ltd | 文書処理装置及び文書処理方法、文書処理プログラム |
JP2003308324A (ja) * | 2002-04-12 | 2003-10-31 | Yomiuri Shimbun | 検索語処理装置及び文書検索装置 |
JP2005018530A (ja) * | 2003-06-27 | 2005-01-20 | Toshiba Corp | 情報処理装置、情報処理プログラム及び情報処理方法 |
JP2006120126A (ja) * | 2004-10-20 | 2006-05-11 | Toshiba Corp | キーワード抽出装置、キーワード抽出プログラム |
JP2007172174A (ja) * | 2005-12-20 | 2007-07-05 | Nippon Telegr & Teleph Corp <Ntt> | 広告提示方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
-
2008
- 2008-02-21 JP JP2008039674A patent/JP4917061B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62244259A (ja) * | 1986-04-16 | 1987-10-24 | Hitachi Ltd | 永久磁石形電動機 |
JPS63244259A (ja) * | 1987-03-31 | 1988-10-11 | Matsushita Electric Ind Co Ltd | キ−ワ−ド抽出装置 |
JP2000090109A (ja) * | 1998-09-10 | 2000-03-31 | Sharp Corp | 情報管理装置、および、そのプログラムが記録された記録媒体 |
JP2003281159A (ja) * | 2002-03-19 | 2003-10-03 | Fuji Xerox Co Ltd | 文書処理装置及び文書処理方法、文書処理プログラム |
JP2003308324A (ja) * | 2002-04-12 | 2003-10-31 | Yomiuri Shimbun | 検索語処理装置及び文書検索装置 |
JP2005018530A (ja) * | 2003-06-27 | 2005-01-20 | Toshiba Corp | 情報処理装置、情報処理プログラム及び情報処理方法 |
JP2006120126A (ja) * | 2004-10-20 | 2006-05-11 | Toshiba Corp | キーワード抽出装置、キーワード抽出プログラム |
JP2007172174A (ja) * | 2005-12-20 | 2007-07-05 | Nippon Telegr & Teleph Corp <Ntt> | 広告提示方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011164851A (ja) * | 2010-02-08 | 2011-08-25 | Nec Personal Products Co Ltd | 情報処理装置、プログラム及び記録媒体 |
JP2013527956A (ja) * | 2010-04-16 | 2013-07-04 | マイクロソフト コーポレーション | 交流用ホーム・ページ |
US10692093B2 (en) | 2010-04-16 | 2020-06-23 | Microsoft Technology Licensing, Llc | Social home page |
US8972842B2 (en) | 2011-05-18 | 2015-03-03 | Kabushiki Kaisha Toshiba | Method of processing data for an information processing apparatus |
US10698584B2 (en) | 2011-09-12 | 2020-06-30 | Intel Corporation | Use of real-time metadata to capture and display discovery content |
WO2013081282A1 (en) * | 2011-11-30 | 2013-06-06 | Samsung Electronics Co., Ltd. | System and method for recommending application by using keyword |
JP2015503151A (ja) * | 2011-12-13 | 2015-01-29 | インテル・コーポレーション | メタデータをベースとしたインフラストラクチャによる複数のメディアタイプのリアルタイムマッピング及びナビゲーション |
JP2013171450A (ja) * | 2012-02-21 | 2013-09-02 | Ntt Docomo Inc | 関連語取得装置及び関連語取得方法 |
JP2012243327A (ja) * | 2012-09-03 | 2012-12-10 | Toshiba Corp | プログラム、情報処理装置および情報処理装置の情報処理方法 |
JP2016057767A (ja) * | 2014-09-08 | 2016-04-21 | Kddi株式会社 | 解析装置、解析方法およびコンピュータプログラム |
JP2016126802A (ja) * | 2015-01-08 | 2016-07-11 | ネイバー コーポレーションNAVER Corporation | リターゲティング検索サービスを提供する方法およびシステム |
JP2017076376A (ja) * | 2016-09-12 | 2017-04-20 | ヤフー株式会社 | 算出装置、算出方法および算出プログラム |
WO2023112170A1 (ja) * | 2021-12-14 | 2023-06-22 | 日本電信電話株式会社 | ログ出力装置、ログ出力方法およびログ出力プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4917061B2 (ja) | 2012-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4917061B2 (ja) | 特徴的キーワード検出装置、特徴的キーワード検出方法、プログラムおよび記録媒体 | |
US8631001B2 (en) | Systems and methods for weighting a search query result | |
US9355185B2 (en) | Infinite browse | |
US8131734B2 (en) | Image based annotation and metadata generation system with experience based learning | |
KR101284875B1 (ko) | 사용자의 웹 히스토리를 분석하기 위한 시스템 및 방법 | |
US7664734B2 (en) | Systems and methods for generating multiple implicit search queries | |
US20100005061A1 (en) | Information processing with integrated semantic contexts | |
JP4637969B1 (ja) | ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法 | |
US20100005087A1 (en) | Facilitating collaborative searching using semantic contexts associated with information | |
US8484179B2 (en) | On-demand search result details | |
US9116992B2 (en) | Providing time series information with search results | |
US20080005101A1 (en) | Method and apparatus for determining the significance and relevance of a web page, or a portion thereof | |
US20030105589A1 (en) | Media agent | |
US20070282797A1 (en) | Systems and methods for refreshing a content display | |
JP2008537810A (ja) | 検索方法及び検索システム | |
US8301629B2 (en) | Community-driven approach for solving the tag space littering problem | |
US20190236108A1 (en) | Providing continued searching and associated indicators | |
US20100125575A1 (en) | Searching document collections using semantic roles of keywords | |
US20130204864A1 (en) | Information provision device, information provision method, program, and information recording medium | |
US9064014B2 (en) | Information provisioning device, information provisioning method, program, and information recording medium | |
Aoki et al. | Automatic determination of hyperlink destination in web index | |
JP2002157270A (ja) | 興味記事配信システム及び興味記事配信方法 | |
JP2012043290A (ja) | 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体 | |
Lau | Structuring free-form tagging in online news |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090629 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110527 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110726 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110916 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111206 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20111214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120123 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120125 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150203 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4917061 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |