JP2006072840A - 予測型話題性評価方法及び装置及びプログラム - Google Patents
予測型話題性評価方法及び装置及びプログラム Download PDFInfo
- Publication number
- JP2006072840A JP2006072840A JP2004257511A JP2004257511A JP2006072840A JP 2006072840 A JP2006072840 A JP 2006072840A JP 2004257511 A JP2004257511 A JP 2004257511A JP 2004257511 A JP2004257511 A JP 2004257511A JP 2006072840 A JP2006072840 A JP 2006072840A
- Authority
- JP
- Japan
- Prior art keywords
- topic
- phrase
- word
- time
- detection sensitivity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 本発明は、外部の情報源から取得した多数の語句について、現在時刻における話題性の強度を算出した評価値を、該語句の基準話題度として算出し、語句及び語句の基準話題度から、該語句の過去の出現状況から話題周期性を検出し、該話題周期より短い期間だけ現在時刻より遡った時刻における該語句の話題の強度に基づいて、話題検出感度を算出し、語句の基準話題度と話題検出感度から、該語句の予測話題度を算出して記録装置に出力する。
【選択図】 図1
Description
外部の情報源から取得した多数の語句について、現在時刻における話題性の強度を算出した評価値を、該語句の基準話題度として該語句と共に記憶手段に記録する基準話題度算出ステップと(ステップ1)、
記憶手段に記録された語句及び該語句の基準話題度を取得し、該語句の過去の出現状況から話題周期性を検出し、該話題周期より短い期間だけ現在時刻より遡った時刻における該語句の話題の強度に基づいて、話題検出感度を算出する話題検出感度算出ステップ(ステップ2,3)と、
語句の基準話題度と話題検出感度から、該語句の予測話題度を算出して記録装置に出力する予測話題度算出ステップ(ステップ4)と、を行なう。
現在時刻を起点とする過去一定期間の語句の出現頻度と、さらにそれより過去の一定期間の該語句の出現頻度との対比から現在時刻における該語句の話題性の強度を決定するステップを行う。
語句の周期より短い時間だけ現在時刻より過去に遡った時刻を起点とし、該起点時刻から過去一定期間の語句の出現頻度と、更にそれより過去一定期間の該語句の出現頻度との対比から該起点における該語句の話題性の強度を算出し、該強度に一定値を加え、なおも1を下回る場合に強制的に“1”に変換した値を話題検出感度とするステップを行なう。
各語句の基準話題度と話題検出感度の積を該語句の予測話題度として算出し、出力するステップを行なう。
外部の情報源から取得した多数の語句を語句データ蓄積手段211に格納する語句収集手段210と、
語句データ蓄積手段211に格納されている語句データについて、現在時刻における話題性の強度を算出した評価値を、該語句の基準話題度として語句と共に基準話題度記憶手段214に記録する基準話題度算出手段212と、
基準話題度記憶手段214に記録された語句及び語句の基準話題度を取得し、該語句の過去の出現状況から話題周期性を検出し、該話題周期より短い期間だけ現在時刻より遡った時刻における該語句の話題の強度に基づいて、話題検出感度を算出する話題検出感度算出手段216と、
語句の基準話題度と話題検出感度から、該語句の予測話題度を算出して予測話題度記録手段22に出力する予測話題度算出手段215と、を有する。
現在時刻を起点とする過去一定期間の語句の出現頻度と、さらにそれより過去の一定期間の該語句の出現頻度との対比から現在時刻における該語句の話題性の強度を決定する手段を含む。
語句の周期より短い時間だけ現在時刻より過去に遡った時刻を起点とし、該起点時刻から過去一定期間の語句の出現頻度と、更にそれより過去一定期間の該語句の出現頻度との対比から該起点における該語句の話題性の強度を算出し、該強度に一定値を加え、なおも1を下回る場合に強制的に“1”に変換した値を話題検出感度とする手段を含む。
各語句の基準話題度と話題検出感度の積を該語句の予測話題度として算出し、出力する手段を含む。
上記の請求項1乃至3記載の話題性評価方法を実現するための処理をコンピュータに実行させるプログラムである。
22 予測話題度記憶装置
201 時刻
202 語句
210 語句収集手段、語句収集部
211 語句データ蓄積手段、語句データ蓄積部
212 基準話題度算出手段、基準話題度算出部
213 語句データ取得部
214 基準話題度記憶手段、基準話題度記憶部
215 予測話題度算出手段、予測話題度算出部
216 話題検出感度算出手段、話題検出感度算出部
Claims (9)
- 時刻情報付の多数の語句データについて、時間の経過と共に変動する各語句の出現頻度を統計的に解析し、各語句が最近話題になっている事柄をどの程度表す語句であるかを表す評価値を各々の語句について算出して、記憶手段に出力する話題性評価装置における話題性評価方法において、
外部の情報源から取得した多数の語句について、現在時刻における話題性の強度を算出した評価値を、該語句の基準話題度として該語句と共に記憶手段に記録する基準話題度算出ステップと、
前記記憶手段に記録された前記語句及び前記語句の基準話題度を取得し、該語句の過去の出現状況から話題周期性を検出し、話題周期より短い期間だけ現在時刻より遡った時刻における該語句の話題の強度に基づいて、話題検出感度を算出する話題検出感度算出ステップと、
前記語句の基準話題度と前記話題検出感度から、該語句の予測話題度を算出して記録装置に出力する予測話題度算出ステップと、
を行なうことを特徴とする予測型話題性評価方法。 - 前記基準話題度算出ステップにおいて、
現在時刻を起点とする過去一定期間の語句の出現頻度と、さらにそれより過去の一定期間の該語句の出現頻度との対比から現在時刻における該語句の話題性の強度を決定するステップを行う請求項1記載の予測型話題性評価方法。 - 前記話題検出感度算出ステップにおいて、
語句の周期より短い時間だけ現在時刻より過去に遡った時刻を起点とし、該起点時刻から過去一定期間の語句の出現頻度と、更にそれより過去一定期間の該語句の出現頻度との対比から該起点における該語句の話題性の強度を算出し、該強度に一定値を加え、なおも1を下回る場合に強制的に“1”に変換した値を話題検出感度とするステップを行なう請求項1記載の予測型話題性評価方法。 - 前記予測話題度算出ステップにおいて、
各語句の前記基準話題度と前記話題検出感度の積を該語句の予測話題度として算出し、出力するステップを行なう請求項1記載の予測型話題性評価方法。 - 時刻情報付の多数の語句データについて、時間の経過と共に変動する各語句の出現頻度を統計的に解析し、各語句が最近話題になっている事柄をどの程度表す語句であるかを表す評価値を各々の語句について算出して、記憶手段に出力する話題性評価装置であって、
外部の情報源から取得した多数の語句を語句データ蓄積手段に格納する語句収集手段と、
前記語句データ蓄積手段に格納されている前記語句データについて、現在時刻における話題性の強度を算出した評価値を、該語句の基準話題度として語句と共に基準話題度記憶手段に記録する基準話題度算出手段と、
前記基準話題度記憶手段に記録された前記語句及び前記語句の基準話題度を取得し、該語句の過去の出現状況から話題周期性を検出し、該話題周期より短い期間だけ現在時刻より遡った時刻における該語句の話題の強度に基づいて、話題検出感度を算出する話題検出感度算出手段と、
前記語句の基準話題度と話題検出感度から、該語句の予測話題度を算出して予測話題度記録手段に出力する予測話題度算出手段と、
を有することを特徴とする予測型話題性評価装置。 - 前記基準話題度算出手段は、
現在時刻を起点とする過去一定期間の語句の出現頻度と、さらにそれより過去の一定期間の該語句の出現頻度との対比から現在時刻における該語句の話題性の強度を決定する手段を含む請求項5記載の予測型話題性評価装置。 - 前記話題検出感度算出手段は、
語句の周期より短い時間だけ現在時刻より過去に遡った時刻を起点とし、該起点時刻から過去一定期間の語句の出現頻度と、更にそれより過去一定期間の該語句の出現頻度との対比から該起点における該語句の話題性の強度を算出し、該強度に一定値を加え、なおも1を下回る場合に強制的に“1”に変換した値を話題検出感度とする手段を含む請求項5記載の予測型話題性評価装置。 - 前記予測話題度算出手段は、
各語句の前記基準話題度と前記話題検出感度の積を該語句の予測話題度として算出し、出力する手段を含む請求項5記載の予測型話題性評価装置。 - 時刻情報付の多数の語句データについて、時間の経過と共に変動する各語句の出現頻度を統計的に解析し、各語句が最近話題になっている事柄をどの程度表す語句であるかを表す評価値を各々の語句について算出して、記憶手段に出力する話題性評価装置における話題性評価プログラムであって、
前記請求項1乃至3記載の話題性評価方法を実現するための処理をコンピュータに実行させることを特徴とする話題性評価プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004257511A JP4424125B2 (ja) | 2004-09-03 | 2004-09-03 | 予測型話題性評価装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004257511A JP4424125B2 (ja) | 2004-09-03 | 2004-09-03 | 予測型話題性評価装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006072840A true JP2006072840A (ja) | 2006-03-16 |
JP4424125B2 JP4424125B2 (ja) | 2010-03-03 |
Family
ID=36153381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004257511A Expired - Fee Related JP4424125B2 (ja) | 2004-09-03 | 2004-09-03 | 予測型話題性評価装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4424125B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010244264A (ja) * | 2009-04-03 | 2010-10-28 | Nippon Telegr & Teleph Corp <Ntt> | データ解析装置、データ解析プログラムおよびその記録媒体 |
JP5223018B1 (ja) * | 2012-05-30 | 2013-06-26 | 楽天株式会社 | 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体 |
JP2013225244A (ja) * | 2012-04-23 | 2013-10-31 | Ntt Docomo Inc | 話題抽出装置及び話題抽出方法 |
-
2004
- 2004-09-03 JP JP2004257511A patent/JP4424125B2/ja not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010244264A (ja) * | 2009-04-03 | 2010-10-28 | Nippon Telegr & Teleph Corp <Ntt> | データ解析装置、データ解析プログラムおよびその記録媒体 |
JP2013225244A (ja) * | 2012-04-23 | 2013-10-31 | Ntt Docomo Inc | 話題抽出装置及び話題抽出方法 |
JP5223018B1 (ja) * | 2012-05-30 | 2013-06-26 | 楽天株式会社 | 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体 |
US9208503B2 (en) | 2012-05-30 | 2015-12-08 | Rakuten, Inc. | Information processing apparatus, information processing method, information processing program, and recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP4424125B2 (ja) | 2010-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8554542B2 (en) | Textual entailment method for linking text of an abstract to text in the main body of a document | |
JP5321583B2 (ja) | 共起辞書生成システム、スコアリングシステム、共起辞書生成方法、スコアリング方法及びプログラム | |
CN111026965B (zh) | 基于知识图谱的热点话题追溯方法及装置 | |
Martin Morato et al. | Diversity and bias in audio captioning datasets | |
CN107180087B (zh) | 一种搜索方法及装置 | |
Rios | FuzzE: Fuzzy fairness evaluation of offensive language classifiers on African-American English | |
Tang | A 61 million word corpus of Brazilian Portuguese film subtitles as a resource for linguistic research | |
JP2007219929A (ja) | 感性評価システム及び方法 | |
JP4466334B2 (ja) | 情報分類方法及び装置及びプログラム及びプログラムを格納した記憶媒体 | |
JP2006318398A (ja) | ベクトル生成方法及び装置及び情報分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記憶媒体 | |
JP2006331245A (ja) | 情報検索装置、情報検索方法およびプログラム | |
Kessler et al. | Extraction of terminology in the field of construction | |
Juan | An effective similarity measurement for FAQ question answering system | |
JP4424125B2 (ja) | 予測型話題性評価装置及びプログラム | |
CN112348279B (zh) | 资讯传播趋势的预测方法、装置、电子设备和存储介质 | |
KR102275095B1 (ko) | 개인 미디어 제작을 위한 유튜브 동영상 메타데이터 취득 및 정보화 방법 | |
KR20090126862A (ko) | 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체 | |
Wongchaisuwat | Automatic keyword extraction using textrank | |
Alhamed et al. | Using Large Language Models (LLMs) to Extract Evidence from Pre-Annotated Social Media Data | |
Salah et al. | Generating domain-specific sentiment lexicons for opinion mining | |
JP2009104296A (ja) | 関連キーワード抽出方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 | |
JP4206961B2 (ja) | 話題抽出方法及び装置及びプログラム | |
JP5128328B2 (ja) | 曖昧性評価装置およびプログラム | |
Xu et al. | Exploiting paper contents and citation links to identify and characterise specialisations | |
JP4192760B2 (ja) | カテゴリ別新出特徴語ランキング方法及び装置及びプログラム及びカテゴリ別新出特徴語ランキングプログラムを記録したコンピュータ読み取り可能な記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060802 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090609 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090724 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090825 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091016 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091117 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091130 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121218 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121218 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131218 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |