JP4238813B2 - 話題情報提示方法及び装置及びプログラム - Google Patents
話題情報提示方法及び装置及びプログラム Download PDFInfo
- Publication number
- JP4238813B2 JP4238813B2 JP2004309575A JP2004309575A JP4238813B2 JP 4238813 B2 JP4238813 B2 JP 4238813B2 JP 2004309575 A JP2004309575 A JP 2004309575A JP 2004309575 A JP2004309575 A JP 2004309575A JP 4238813 B2 JP4238813 B2 JP 4238813B2
- Authority
- JP
- Japan
- Prior art keywords
- topic
- category
- type
- information
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
文書収集蓄積手段が、情報収集サイトを、新聞社、出版社、企業を含む情報発信サイトと、掲示板、日記、ブログを含むサイトの2つのタイプ別に管理し、タイプ別に情報収集サイトから収集した文書情報をカテゴリ分類して第1の記憶手段に蓄積する文書収集蓄積ステップ(ステップ1)と、
カテゴリ話題度算出手段が、各タイプにおいて、カテゴリ毎に最新の一定期間の文書数と平均文書数とから、文書数が増加傾向にあるほど高い値をとるタイプ別カテゴリ話題度を求め、各カテゴリにおいて、2つのタイプの該タイプ別カテゴリ話題度からカテゴリ話題度を算出するカテゴリ話題度算出ステップ(ステップ2)と、
語句特徴度算出手段が、各カテゴリにおいて、タイプ毎に文書中の各語句について、該カテゴリ内でのみ頻繁に出現するほど高い値をとり、新しく出現した語句ほど高い値をとるタイプ別語句特徴度を求め、タイプ別カテゴリ話題度と該タイプ別語句特徴度とのタイプ毎の積を2つのタイプについて加算してそれぞれのカテゴリにおける語句の語句特徴度を算出し、該語句及び該語句特徴度を第2の記憶手段に格納する語句特徴度算出ステップ(ステップ3)と、
話題語選択手段が、カテゴリ話題度算出ステップで算出されたカテゴリ話題度に応じて決定された語数分だけ、第2の記憶手段に格納されている語句を語句特徴度の高い順に選択する話題語選択ステップと、
表示制御手段が、選択された語句を表示手段に表示する表示制御ステップ(ステップ4)と、を行う。
文書収集蓄積手段が、情報収集サイトを、新聞社、出版社、企業を含む情報発信サイトと、掲示板、日記、ブログを含むサイトの2つのタイプ別に管理し、タイプ別に情報収集サイトから収集した文書情報をカテゴリ分類して第1の記憶手段に蓄積する文書収集蓄積ステップと、
カテゴリ話題度算出手段が、各タイプにおいて、カテゴリ毎に最新の一定期間の文書数と平均文書数とから、文書数が増加傾向にあるほど高い値をとるタイプ別カテゴリ話題度を求め、各カテゴリにおいて、2つのタイプの該タイプ別カテゴリ話題度からカテゴリ話題度を算出するカテゴリ話題度算出ステップと、
語句特徴度算出手段が、各カテゴリにおいて、タイプ毎に文書中の各語句について、該カテゴリ内でのみ頻繁に出現するほど高い値をとり、新しく出現した語句ほど高い値をとるタイプ別語句特徴度を求め、タイプ別カテゴリ話題度と該タイプ別語句特徴度とのタイプ毎の積を2つのタイプについて加算してそれぞれのカテゴリにおける語句の語句特徴度を算出し、タイプ毎の積の2つのタイプ同士の比であるタイプ別割合を算出し、該語句、該語句特徴度及び該タイプ別割合を第2の記憶手段に格納する語句特徴度算出ステップと、
話題語選択手段が、カテゴリ話題度算出ステップで算出されたカテゴリ話題度に応じて決定された語数分だけ、第2の記憶手段に格納されている語句を語句特徴度の高い順に選択する話題語選択ステップと、
表示制御手段が、選択された語句を表示手段に表示する際に、該語句のタイプ別割合に応じて色やマークを付与する表示制御ステップと、を行う。
情報収集サイトを、新聞社、出版社、企業を含む情報発信サイトと、掲示板、日記、ブログを含むサイトの2つのタイプ別に管理し、タイプ別に情報収集サイトから収集した文書情報をカテゴリ分類して第1の記憶手段に蓄積する文書収集蓄積手段10と、
各タイプにおいて、カテゴリ毎に最新の一定期間の文書数と平均文書数とから、文書数が増加傾向にあるほど高い値をとるタイプ別カテゴリ話題度を求め、各カテゴリにおいて、2つのタイプの該タイプ別カテゴリ話題度からカテゴリ話題度を算出するカテゴリ話題度算出手段21と、
各カテゴリにおいて、タイプ毎に文書中の各語句について、該カテゴリ内でのみ頻繁に出現するほど高い値をとり、新しく出現した語句ほど高い値をとるタイプ別語句特徴度を求め、タイプ別カテゴリ話題度と該タイプ別語句特徴度とのタイプ毎の積を2つのタイプについて加算してそれぞれのカテゴリにおける語句の語句特徴度を算出し、該語句及び該語句特徴度を第2の記憶手段に格納する語句特徴度算出手段22と、
カテゴリ話題度算出手段21で算出されたカテゴリ話題度に応じて決定された語数分だけ、第2の記憶手段に格納されている語句を語句特徴度の高い順に選択する話題語選択手段30と、
選択された語句を表示手段50に表示する表示制御手段40と、を有する。
情報収集サイトを、新聞社、出版社、企業を含む情報発信サイトと、掲示板、日記、ブログを含むサイトの2つのタイプ別に管理し、タイプ別に情報収集サイトから収集した文書情報をカテゴリ分類して第1の記憶手段に蓄積する文書収集蓄積手段と、
各タイプにおいて、カテゴリ毎に最新の一定期間の文書数と平均文書数とから、文書数が増加傾向にあるほど高い値をとるタイプ別カテゴリ話題度を求め、各カテゴリにおいて、2つのタイプの該タイプ別カテゴリ話題度からカテゴリ話題度を算出するカテゴリ話題度算出手段と、
各カテゴリにおいて、タイプ毎に文書中の各語句について、該カテゴリ内でのみ頻繁に出現するほど高い値をとり、新しく出現した語句ほど高い値をとるタイプ別語句特徴度を求め、タイプ別カテゴリ話題度と該タイプ別語句特徴度とのタイプ毎の積を2つのタイプについて加算してそれぞれのカテゴリにおける語句の語句特徴度を算出し、タイプ毎の積の2つのタイプ同士の比であるタイプ別割合を算出し、該語句、該語句特徴度及び該タイプ別割合を第2の記憶手段に格納する語句特徴度算出手段と、
カテゴリ話題度算出手段で算出されたカテゴリ話題度に応じて決定された語数分だけ、第2の記憶手段に格納されている語句を語句特徴度の高い順に選択する話題語選択手段と、
選択された語句を表示手段に表示する際に、該語句のタイプ別割合に応じて色やマークを付与する表示制御手段と、を有する。
平均文書数は、24時間に1回算出すればよいので、図6の太い縦線に該当する時刻cにのみ算出を行う(平均文書数の算出は図5のフローチャートに示す処理とは別に24時間間隔で実行し、文書数蓄積部24に蓄積しておくものとする)。
ここで、D’(A,m)は、タイプAのカテゴリCm(m=1〜M)の平均文書数とする。
ここで、D’(B,m)は、タイプBのカテゴリCm(m=1〜M)における平均文書数とする。
各タイプのカテゴリ毎の話題度を算出した後、カテゴリの話題度を算出する(ステップ204)。
例えば、カテゴリCkにおいて、タイプAの文書数が平均文書数より少ない文書数(話題度が1より小さい値)であり、タイプBの文書数が平均文書数より多い文書数(話題度が1より大きい)である場合、話題度の大きいタイプBの話題度がカテゴリCkの話題度になり、カテゴリCk内で話題になっている情報があることがわかる。これは、カテゴリ全体(すべてのタイプ)の文書総数が、通常通りの文書総数であっても、タイプ毎に文書数を管理することにより、話題を敏感に検知できることを示している。
・評価値1:特定のカテゴリ内でのみ頻繁に出現するほど高い値をとり;
・評価値2:時間的に新しく出現した語句ほど高い値をとる;
ように求める。
式(4)
ここで、log(M/f(A,wi))は、語句wiが多くのカテゴリに出現するほど小さな値をとるため、カテゴリCmにおいて出現する文書数が多く、且つ他のカテゴリにあまり出現しない語に高い評価値が与えられることになる。
上記の式(8)は、カテゴリの話題度が大きいタイプに含まれる語句の話題度を上げる働きをし、両方のタイプの語句特徴度が加算されるため両タイプに含まれる語句の特徴度が高くなることを示している。
11 収集サイト蓄積部
12 文書情報収集部
13 カテゴリ分類部
14 タイプ別文書情報蓄積部
20 話題情報抽出部
21 カテゴリ話題度算出手段、カテゴリ話題度算出部
22 語句特徴度算出手段、語句特徴度算出部
23 話題語蓄積部
24 文書数蓄積部
25 語句頻度蓄積部
30 話題語選択手段、話題語選択部
40 表示制御手段、表示制御部
50 表示手段
Claims (7)
- ネットワーク上で公開されている最新の文書情報から話題を抽出して表示する話題情報提示装置における、話題情報提示方法であって、
文書収集蓄積手段が、情報収集サイトを、新聞社、出版社、企業を含む情報発信サイトと、掲示板、日記、ブログを含むサイトの2つのタイプ別に管理し、タイプ別に情報収集サイトから収集した文書情報をカテゴリ分類して第1の記憶手段に蓄積する文書収集蓄積ステップと、
カテゴリ話題度算出手段が、各タイプにおいて、カテゴリ毎に最新の一定期間の文書数と平均文書数とから、文書数が増加傾向にあるほど高い値をとるタイプ別カテゴリ話題度を求め、各カテゴリにおいて、2つのタイプの該タイプ別カテゴリ話題度からカテゴリ話題度を算出するカテゴリ話題度算出ステップと、
語句特徴度算出手段が、各カテゴリにおいて、タイプ毎に文書中の各語句について、該カテゴリ内でのみ頻繁に出現するほど高い値をとり、新しく出現した語句ほど高い値をとるタイプ別語句特徴度を求め、前記タイプ別カテゴリ話題度と該タイプ別語句特徴度とのタイプ毎の積を2つのタイプについて加算してそれぞれのカテゴリにおける語句の語句特徴度を算出し、該語句及び該語句特徴度を第2の記憶手段に格納する語句特徴度算出ステップと、
話題語選択手段が、前記カテゴリ話題度算出ステップで算出された前記カテゴリ話題度に応じて決定された語数分だけ、前記第2の記憶手段に格納されている語句を前記語句特徴度の高い順に選択する話題語選択ステップと、
表示制御手段が、前記選択された語句を表示手段に表示する表示制御ステップと、
を行うことを特徴とする話題情報提示方法。 - ネットワーク上で公開されている最新の文書情報から話題を抽出して表示する話題情報提示装置における、話題情報提示方法であって、
文書収集蓄積手段が、情報収集サイトを、新聞社、出版社、企業を含む情報発信サイトと、掲示板、日記、ブログを含むサイトの2つのタイプ別に管理し、タイプ別に情報収集サイトから収集した文書情報をカテゴリ分類して第1の記憶手段に蓄積する文書収集蓄積ステップと、
カテゴリ話題度算出手段が、各タイプにおいて、カテゴリ毎に最新の一定期間の文書数と平均文書数とから、文書数が増加傾向にあるほど高い値をとるタイプ別カテゴリ話題度を求め、各カテゴリにおいて、2つのタイプの該タイプ別カテゴリ話題度からカテゴリ話題度を算出するカテゴリ話題度算出ステップと、
語句特徴度算出手段が、各カテゴリにおいて、タイプ毎に文書中の各語句について、該カテゴリ内でのみ頻繁に出現するほど高い値をとり、新しく出現した語句ほど高い値をとるタイプ別語句特徴度を求め、前記タイプ別カテゴリ話題度と該タイプ別語句特徴度とのタイプ毎の積を2つのタイプについて加算してそれぞれのカテゴリにおける語句の語句特徴度を算出し、前記タイプ毎の積の2つのタイプ同士の比であるタイプ別割合を算出し、該語句、該語句特徴度及び該タイプ別割合を第2の記憶手段に格納する語句特徴度算出ステップと、
話題語選択手段が、前記カテゴリ話題度算出ステップで算出された前記カテゴリ話題度に応じて決定された語数分だけ、前記第2の記憶手段に格納されている語句を語句特徴度の高い順に選択する話題語選択ステップと、
表示制御手段が、前記選択された語句を表示手段に表示する際に、該語句のタイプ別割合に応じて色やマークを付与する表示制御ステップと、
を行うことを特徴とする話題情報提示方法。 - 前記タイプ別カテゴリ話題度は、カテゴリ分類された文書数がカテゴリの平均文書数より多い場合に大きな値をとり、平均文書数より少ない場合に小さな値をとる請求項1または、2記載の話題情報提示方法。
- ネットワーク上で公開されている最新の文書情報から話題を抽出して表示する話題情報提示装置であって、
情報収集サイトを、新聞社、出版社、企業を含む情報発信サイトと、掲示板、日記、ブログを含むサイトの2つのタイプ別に管理し、タイプ別に情報収集サイトから収集した文書情報をカテゴリ分類して第1の記憶手段に蓄積する文書収集蓄積手段と、
各タイプにおいて、カテゴリ毎に最新の一定期間の文書数と平均文書数とから、文書数が増加傾向にあるほど高い値をとるタイプ別カテゴリ話題度を求め、各カテゴリにおいて、2つのタイプの該タイプ別カテゴリ話題度からカテゴリ話題度を算出するカテゴリ話題度算出手段と、
各カテゴリにおいて、タイプ毎に文書中の各語句について、該カテゴリ内でのみ頻繁に出現するほど高い値をとり、新しく出現した語句ほど高い値をとるタイプ別語句特徴度を求め、前記タイプ別カテゴリ話題度と該タイプ別語句特徴度とのタイプ毎の積を2つのタイプについて加算してそれぞれのカテゴリにおける語句の語句特徴度を算出し、該語句及び該語句特徴度を第2の記憶手段に格納する語句特徴度算出手段と、
前記カテゴリ話題度算出手段で算出された前記カテゴリ話題度に応じて決定された語数分だけ、前記第2の記憶手段に格納されている語句を前記語句特徴度の高い順に選択する話題語選択手段と、
選択された語句を表示手段に表示する表示制御手段と、
を有することを特徴とする話題情報提示装置。 - ネットワーク上で公開されている最新の文書情報から話題を抽出して表示する話題情報提示装置であって、
情報収集サイトを、新聞社、出版社、企業を含む情報発信サイトと、掲示板、日記、ブログを含むサイトの2つのタイプ別に管理し、タイプ別に情報収集サイトから収集した文書情報をカテゴリ分類して第1の記憶手段に蓄積する文書収集蓄積手段と、
各タイプにおいて、カテゴリ毎に最新の一定期間の文書数と平均文書数とから、文書数が増加傾向にあるほど高い値をとるタイプ別カテゴリ話題度を求め、各カテゴリにおいて、2つのタイプの該タイプ別カテゴリ話題度からカテゴリ話題度を算出するカテゴリ話題度算出手段と、
各カテゴリにおいて、タイプ毎に文書中の各語句について、該カテゴリ内でのみ頻繁に出現するほど高い値をとり、新しく出現した語句ほど高い値をとるタイプ別語句特徴度を求め、前記タイプ別カテゴリ話題度と該タイプ別語句特徴度とのタイプ毎の積を2つのタイプについて加算してそれぞれのカテゴリにおける語句の語句特徴度を算出し、前記タイプ毎の積の2つのタイプ同士の比であるタイプ別割合を算出し、該語句、該語句特徴度及び該タイプ別割合を第2の記憶手段に格納する語句特徴度算出手段と、
前記カテゴリ話題度算出手段で算出された前記カテゴリ話題度に応じて決定された語数分だけ、前記第2の記憶手段に格納されている語句を前記語句特徴度の高い順に選択する話題語選択手段と、
前記選択された語句を表示手段に表示する際に、該語句のタイプ別割合に応じて色やマークを付与する表示制御手段と、
を有することを特徴とする話題情報提示装置。 - 前記タイプ別カテゴリ話題度は、カテゴリ分類された文書数がカテゴリの平均文書数より多い場合に大きな値をとり、平均文書数より少ない場合に小さな値をとる請求項4または、5記載の話題情報提示装置。
- 請求項4乃至6のいずれか1項に記載の話題情報提示装置を構成する各手段としてコンピュータを機能させるための話題情報提示プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004309575A JP4238813B2 (ja) | 2004-10-25 | 2004-10-25 | 話題情報提示方法及び装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004309575A JP4238813B2 (ja) | 2004-10-25 | 2004-10-25 | 話題情報提示方法及び装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006120068A JP2006120068A (ja) | 2006-05-11 |
JP4238813B2 true JP4238813B2 (ja) | 2009-03-18 |
Family
ID=36537871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004309575A Active JP4238813B2 (ja) | 2004-10-25 | 2004-10-25 | 話題情報提示方法及び装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4238813B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5347334B2 (ja) * | 2008-05-29 | 2013-11-20 | 富士通株式会社 | まとめ上げ作業支援処理方法、装置及びプログラム |
JP5801252B2 (ja) * | 2012-05-17 | 2015-10-28 | 日本電信電話株式会社 | イベント抽出装置及び方法及びプログラム |
-
2004
- 2004-10-25 JP JP2004309575A patent/JP4238813B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2006120068A (ja) | 2006-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10650059B2 (en) | Enhanced online user-interaction tracking | |
JP4489994B2 (ja) | 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体 | |
CA2635420C (en) | An automated media analysis and document management system | |
US10650316B2 (en) | Issue-manage-style internet public opinion information evaluation management system and method thereof | |
US9390144B2 (en) | Objective and subjective ranking of comments | |
US8495210B1 (en) | Predictive publishing of internet digital content | |
TW201514845A (zh) | 從網頁擷取標題及主體 | |
JP2006331089A (ja) | Webページから時系列データを生成する方法及び装置 | |
KR101566616B1 (ko) | 빅데이터 처리를 통한 광고의사결정시스템 및 방법 | |
US20110246462A1 (en) | Method and System for Prompting Changes of Electronic Document Content | |
US8572118B2 (en) | Computer method and apparatus of information management and navigation | |
JP2011022705A (ja) | 証跡管理方法、システム、及びプログラム | |
JP2006309515A (ja) | 情報配信方法および情報配信サーバ | |
JP2010044462A (ja) | コンテンツ評価サーバ、コンテンツ評価方法及びコンテンツ評価プログラム | |
JP2016105260A (ja) | サイトまとめ方法、サイトまとめシステム、情報処理装置、及びプログラム | |
KR101850853B1 (ko) | 빅데이터를 이용한 검색 방법 및 장치 | |
JP2005267095A (ja) | 情報表示方法及び装置及び情報表示プログラム | |
JP5466133B2 (ja) | 画像付文書検索装置及び画像付文書検索プログラム | |
US20120136815A1 (en) | Display Device and Display Method | |
JP4238813B2 (ja) | 話題情報提示方法及び装置及びプログラム | |
KR101132431B1 (ko) | 관심 정보 제공 시스템 및 방법 | |
JP2006209598A (ja) | サイト情報収集システム | |
JP5089091B2 (ja) | コンテンツ収集システム | |
KR102062832B1 (ko) | 웹 기반 논문 큐레이션 서비스 시스템 및 방법 | |
Tse et al. | News Values Revisited: A Comparison Between Citizen and Mainstream Media in Hong Kong |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080129 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080331 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080513 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080711 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080819 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081020 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081125 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081208 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120109 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4238813 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130109 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |