JP4797069B2 - キーワード管理プログラム、キーワード管理システムおよびキーワード管理方法 - Google Patents
キーワード管理プログラム、キーワード管理システムおよびキーワード管理方法 Download PDFInfo
- Publication number
- JP4797069B2 JP4797069B2 JP2008553929A JP2008553929A JP4797069B2 JP 4797069 B2 JP4797069 B2 JP 4797069B2 JP 2008553929 A JP2008553929 A JP 2008553929A JP 2008553929 A JP2008553929 A JP 2008553929A JP 4797069 B2 JP4797069 B2 JP 4797069B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- burst value
- value
- burst
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000007726 management method Methods 0.000 title claims description 48
- 238000004458 analytical method Methods 0.000 claims description 54
- 238000004364 calculation method Methods 0.000 claims description 50
- 230000000875 corresponding effect Effects 0.000 claims description 41
- 238000000034 method Methods 0.000 claims description 31
- 230000000877 morphologic effect Effects 0.000 claims description 25
- 230000007704 transition Effects 0.000 claims description 24
- 230000002596 correlated effect Effects 0.000 claims description 11
- 230000003252 repetitive effect Effects 0.000 claims description 4
- 230000007423 decrease Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 26
- 238000012545 processing Methods 0.000 description 24
- 238000001514 detection method Methods 0.000 description 17
- 238000009825 accumulation Methods 0.000 description 13
- 239000000284 extract Substances 0.000 description 13
- 238000013523 data management Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- AHVPOAOWHRMOBY-UHFFFAOYSA-N 2-(diethylamino)-1-[6,7-dimethoxy-1-[1-(6-methoxynaphthalen-2-yl)ethyl]-3,4-dihydro-1h-isoquinolin-2-yl]ethanone Chemical compound C1=C(OC)C=CC2=CC(C(C)C3C4=CC(OC)=C(OC)C=C4CCN3C(=O)CN(CC)CC)=CC=C21 AHVPOAOWHRMOBY-UHFFFAOYSA-N 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000000699 topical effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
TB(kwi)=SB(kwi)×CB(kwi)+α(kwi)
によって算出することができる。ここで、各項目の説明を行うと、SB(kwi)は、検索語テーブル150cのBurst値フィールドに記憶された(該当キーワードに対応する)Burst値を示す。また、CB(kwi)は、Burst算出パラメータテーブル150fのBurst値フィールドに記憶された(該当キーワードに対応する)Burst値を示す。
α(kwi)=β×(T(kwi)+L(kwi)+E(kwi))
によって算出される。上記式におけるβは、総合Burst値のバランスを取るための係数である。
20 ユーザ端末
30 各種コンテンツ記憶装置
40 サーバ
50 コンピュータ
51 入力装置
52 モニタ
53 RAM
53a 各種データ
54 ROM
55 媒体読取装置
56 ネットワークインターフェース
57 CPU
57a 話題キーワード提供プロセス
58 HDD
58a 各種データ
58b 話題キーワード提供プログラム
59 バス
100 ネット話題集積装置
110 入力部
120 出力部
130 通信制御IF部
140 入出力制御IF部
150 記憶部
150a Webコンテンツデータベース
150b ニュース・ブログテーブル
150c 検索語テーブル
150d ユーザ辞書テーブル
150e 形態素解析結果管理テーブル
150f Burst算出パラメータテーブル
150g 総合Burst格納テーブル
150h トピックタイプ管理テーブル
150i 相関キーワードテーブル
150j 共起キーワードテーブル
150k 最終結果格納テーブル
160 制御部
160a データ管理部
160b Burst算出部
160c ユーザ辞書登録部
160d 形態素解析部
160e 総合Burst算出部
160f トピックタイプ判定部
160g 相関キーワード検出部
160h 共起キーワード検出部
160i 出力キーワード判定処理部
Claims (6)
- ネットワークに接続された利用者の端末がコンテンツにアクセスする場合に利用するキ
ーワードを管理するキーワード管理システムのキーワード管理プログラムであって、
前記キーワードの単位時間当たりの増加値を示す第一バースト値を算出する第一バースト値算出手順と、
前記第一バースト値が閾値以上となるキーワードに基づいて前記コンテンツに含まれるテキストの形態素解析を実行する形態素解析実行手順と、
前記形態素解析を実行した結果から得られるキーワードに対して、当該キーワードの単位時間当たりの増加値を示す第二バースト値を算出し、前記第一バースト値と、前記第二バースト値とを用いて総合バースト値を算出する総合バースト値算出手順と、
前記総合バースト値の時系列推移を基にして当該総合バースト値に対応するキーワードに関連する関連キーワードを前記コンテンツから抽出し、前記キーワードと関連キーワードとを対応付けて前記利用者の端末に出力する出力制御手順と
をコンピュータに実行させることを特徴とするキーワード管理プログラム。 - 前記総合バースト値の過去の一定期間における時系列推移を算出し、前記総合バースト値の過去の一定期間における時系列推移の微分値を複数の時点において算出し、前記各時点での微分値に基づいて型を判定して、前記各時点での微分値がプラスマイナスをn回以上繰り返している場合には、キーワードの検索数が増加減少を繰り返していることを示す繰り返し型に分類し、前記各時点での微分値が所定期間以上の間にm回以上連続して繰り返してプラスとなっている場合には、キーワードの検索数が時間経過と共になだらかに増加していることを示すじわり型に分類し、前記各時点での微分値が所定期間未満の間にm回連続してプラスとなっている場合には、所定時間内にキーワードの検索数が急激に増加したことを示す突発型に分類する分類手順を更にコンピュータに実行させ、前記出力制御手順は、前記分類手順の分類結果を更に前記利用者の端末に出力することを特徴とする請求項1に記載のキーワード管理プログラム。
- 前記コンテンツに含まれるテキストの形態素解析を実行した結果は、前記コンテンツにおいて、タイトルに含まれている前記キーワードの数、リンクが張られている前記キーワードの数、修飾されている前記キーワードの数、文章中に含まれる前記キーワードの数、単位時間当たりの前記キーワードの平均検索数を含んでいることを特徴とする請求項1に記載のキーワード管理プログラム。
- 前記出力制御手順は、前記総合バースト値の時系列推移と相関するキーワードを前記関
連キーワードとして抽出することを特徴とする請求項1〜3のいずれか一つに記載のキーワード管理プログラム。 - ネットワークに接続された利用者の端末がコンテンツにアクセスする場合に利用するキ
ーワードを管理するキーワード管理システムであって、
前記キーワードの単位時間当たりの増加値を示す第一バースト値を算出する第一バースト値算出手段と、
前記第一バースト値が閾値以上となるキーワードに基づいて前記コンテンツに含まれるテキストの形態素解析を実行する形態素解析実行手段と、
前記形態素解析を実行した結果から得られるキーワードに対して、当該キーワードの単位時間当たりの増加値を示す第二バースト値を算出し、前記第一バースト値と、前記第二バースト値とを用いて総合バースト値を算出する総合バースト値算出手段と、
前記総合バースト値の時系列推移を基にして当該総合バースト値に対応するキーワードに関連する関連キーワードを前記コンテンツから抽出し、前記キーワードと関連キーワードとを対応付けて前記利用者の端末に出力する出力制御手段と
を備えたことを特徴とするキーワード管理システム。 - ネットワークに接続された利用者の端末がコンテンツにアクセスする場合に利用するキ
ーワードを管理するキーワード管理システムのキーワード管理方法であって、
前記キーワードの単位時間当たりの増加値を示す第一バースト値を算出する第一バースト値算出工程と、
前記第一バースト値が閾値以上となるキーワードに基づいて前記コンテンツに含まれるテキストの形態素解析を実行する形態素解析実行工程と、
前記形態素解析を実行した結果から得られるキーワードに対して、当該キーワードの単位時間当たりの増加値を示す第二バースト値を算出し、前記第一バースト値と、前記第二バースト値とを用いて総合バースト値を算出する総合バースト値算出工程と、
前記総合バースト値の時系列推移を基にして当該総合バースト値に対応するキーワードに関連する関連キーワードを前記コンテンツから抽出し、前記キーワードと関連キーワードとを対応付けて前記利用者の端末に出力する出力制御工程と
を含んだことを特徴とするキーワード管理方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2007/050702 WO2008087728A1 (ja) | 2007-01-18 | 2007-01-18 | キーワード管理プログラム、キーワード管理システムおよびキーワード管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008087728A1 JPWO2008087728A1 (ja) | 2010-05-06 |
JP4797069B2 true JP4797069B2 (ja) | 2011-10-19 |
Family
ID=39635737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008553929A Expired - Fee Related JP4797069B2 (ja) | 2007-01-18 | 2007-01-18 | キーワード管理プログラム、キーワード管理システムおよびキーワード管理方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8316026B2 (ja) |
JP (1) | JP4797069B2 (ja) |
CN (1) | CN101583951B (ja) |
WO (1) | WO2008087728A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8577930B2 (en) | 2008-08-20 | 2013-11-05 | Yahoo! Inc. | Measuring topical coherence of keyword sets |
JP5097186B2 (ja) * | 2009-09-30 | 2012-12-12 | 京セラコミュニケーションシステム株式会社 | 穴場情報提供装置またはその方法 |
JP5216042B2 (ja) * | 2010-04-20 | 2013-06-19 | ヤフー株式会社 | 検索スコア算出装置及び方法 |
JP5296011B2 (ja) * | 2010-06-04 | 2013-09-25 | ヤフー株式会社 | 関連バーストクエリ抽出装置及び方法 |
JP5341847B2 (ja) * | 2010-09-13 | 2013-11-13 | 日本電信電話株式会社 | 検索クエリ推薦方法、検索クエリ推薦装置、検索クエリ推薦プログラム |
JP5295295B2 (ja) * | 2011-03-14 | 2013-09-18 | ヤフー株式会社 | 解析装置及び方法 |
JP5323143B2 (ja) * | 2011-08-03 | 2013-10-23 | ヤフー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
TW201403528A (zh) * | 2012-07-10 | 2014-01-16 | Telexpress Corp | 用於諮詢服務系統之關鍵字管理系統及其方法 |
JP6365032B2 (ja) * | 2014-07-08 | 2018-08-01 | 富士通株式会社 | データ分類方法、データ分類プログラム、及び、データ分類装置 |
JP6599727B2 (ja) * | 2015-10-26 | 2019-10-30 | 株式会社Screenホールディングス | 時系列データ処理方法、時系列データ処理プログラム、および、時系列データ処理装置 |
US10078632B2 (en) * | 2016-03-12 | 2018-09-18 | International Business Machines Corporation | Collecting training data using anomaly detection |
JP2018092367A (ja) * | 2016-12-02 | 2018-06-14 | 日本放送協会 | 関連語抽出装置及びプログラム |
JP6541737B2 (ja) * | 2017-09-20 | 2019-07-10 | ヤフー株式会社 | 選択装置、選択方法、選択プログラム、モデルおよび学習データ |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001188375A (ja) * | 1999-12-28 | 2001-07-10 | Mitsubishi Chemicals Corp | 電子写真感光体の製造方法及び電子写真感光体 |
JP2004206517A (ja) * | 2002-12-26 | 2004-07-22 | Nifty Corp | ホットキーワード提示方法及びホットサイト提示方法 |
JP2004348554A (ja) * | 2003-05-23 | 2004-12-09 | Nippon Telegr & Teleph Corp <Ntt> | 検索キーワード情報提供装置、検索キーワード情報提供方法、及び検索キーワード情報提供プログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6457004B1 (en) * | 1997-07-03 | 2002-09-24 | Hitachi, Ltd. | Document retrieval assisting method, system and service using closely displayed areas for titles and topics |
JP4289513B2 (ja) * | 1997-04-09 | 2009-07-01 | 富士通株式会社 | 文書表示装置およびプログラム記憶媒体 |
JP2002236681A (ja) * | 2001-02-09 | 2002-08-23 | Inst Of Physical & Chemical Res | 日常言語コンピューティングシステムおよびその方法 |
JP4489994B2 (ja) | 2001-05-11 | 2010-06-23 | 富士通株式会社 | 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体 |
JP2003006195A (ja) * | 2001-06-21 | 2003-01-10 | Nec System Technologies Ltd | キーワード情報通知方式及びその方法 |
US7375731B2 (en) * | 2002-11-01 | 2008-05-20 | Mitsubishi Electric Research Laboratories, Inc. | Video mining using unsupervised clustering of video content |
JP4038501B2 (ja) * | 2003-09-02 | 2008-01-30 | 株式会社東芝 | 逆モデル計算装置及び逆モデル計算方法 |
JP2006031577A (ja) | 2004-07-21 | 2006-02-02 | Hideki Mima | 情報の検索俯瞰方法および装置 |
JP2006079454A (ja) | 2004-09-10 | 2006-03-23 | Fujitsu Ltd | 検索キーワード分析方法、検索キーワード分析プログラムおよび検索キーワード分析装置 |
JP2006092368A (ja) | 2004-09-24 | 2006-04-06 | Fuji Xerox Co Ltd | 活動記録装置、活動記録方法およびプログラム |
JP4923413B2 (ja) | 2005-02-28 | 2012-04-25 | 富士通株式会社 | 情報抽出プロブラム及び方法 |
US7788131B2 (en) * | 2005-12-15 | 2010-08-31 | Microsoft Corporation | Advertising keyword cross-selling |
-
2007
- 2007-01-18 CN CN2007800501075A patent/CN101583951B/zh not_active Expired - Fee Related
- 2007-01-18 JP JP2008553929A patent/JP4797069B2/ja not_active Expired - Fee Related
- 2007-01-18 WO PCT/JP2007/050702 patent/WO2008087728A1/ja active Application Filing
-
2009
- 2009-07-13 US US12/501,954 patent/US8316026B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001188375A (ja) * | 1999-12-28 | 2001-07-10 | Mitsubishi Chemicals Corp | 電子写真感光体の製造方法及び電子写真感光体 |
JP2004206517A (ja) * | 2002-12-26 | 2004-07-22 | Nifty Corp | ホットキーワード提示方法及びホットサイト提示方法 |
JP2004348554A (ja) * | 2003-05-23 | 2004-12-09 | Nippon Telegr & Teleph Corp <Ntt> | 検索キーワード情報提供装置、検索キーワード情報提供方法、及び検索キーワード情報提供プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2008087728A1 (ja) | 2008-07-24 |
CN101583951A (zh) | 2009-11-18 |
US8316026B2 (en) | 2012-11-20 |
US20090276424A1 (en) | 2009-11-05 |
CN101583951B (zh) | 2012-02-15 |
JPWO2008087728A1 (ja) | 2010-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4797069B2 (ja) | キーワード管理プログラム、キーワード管理システムおよびキーワード管理方法 | |
JP5160601B2 (ja) | 相対頻度に基づくフレーズマイニングのためのシステム、方法、及び装置 | |
US8630972B2 (en) | Providing context for web articles | |
US9208441B2 (en) | Information processing apparatus, information processing method, and program | |
US20110093464A1 (en) | System and method for grouping multiple streams of data | |
Shi et al. | Learning-to-rank for real-time high-precision hashtag recommendation for streaming news | |
WO2009096523A1 (ja) | 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム | |
KR20060043331A (ko) | 정보 신규성 및 다이내믹스의 분석을 통해 뉴스피드를 개인화하는 원리 및 방법 | |
JP2011222004A (ja) | 情報ストリーム中の興味深いコンテンツを推奨するためのシステムおよび方法 | |
WO2007140364A2 (en) | Method for scoring changes to a webpage | |
US9245035B2 (en) | Information processing system, information processing method, program, and non-transitory information storage medium | |
JP4569380B2 (ja) | ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体 | |
KR102126911B1 (ko) | KeyplayerRank를 이용한 소셜 미디어상의 주제별 키플레이어 탐지 방법 | |
JP2011154467A (ja) | 検索結果順位付け方法および検索結果順位付けシステム | |
JP5435249B2 (ja) | イベント分析装置、イベント分析方法、およびプログラム | |
Karkali et al. | Using temporal IDF for efficient novelty detection in text streams | |
KR20100080099A (ko) | 정보 검색 방법 및 이를 수행할 수 있는 프로그램이 수록된컴퓨터로 읽을 수 있는 기록 매체 | |
US8037403B2 (en) | Apparatus, method, and computer program product for extracting structured document | |
JP4970919B2 (ja) | 閲覧対象情報の評価システム、方法、およびプログラム | |
JP5952756B2 (ja) | 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法 | |
Eberhard et al. | Tell me what you want: Embedding narratives for movie recommendations | |
CN111597386A (zh) | 一种视频采集方法 | |
KR101057075B1 (ko) | 정보 검색 방법 및 이를 수행할 수 있는 프로그램이 수록된컴퓨터로 읽을 수 있는 기록 매체 | |
Arora et al. | Personalized news prediction and recommendation | |
CN104731867B (zh) | 一种对对象进行聚类的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110726 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110801 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140805 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |