JP2002108937A - インターネット最新トレンド解析及び表示システム - Google Patents
インターネット最新トレンド解析及び表示システムInfo
- Publication number
- JP2002108937A JP2002108937A JP2000294896A JP2000294896A JP2002108937A JP 2002108937 A JP2002108937 A JP 2002108937A JP 2000294896 A JP2000294896 A JP 2000294896A JP 2000294896 A JP2000294896 A JP 2000294896A JP 2002108937 A JP2002108937 A JP 2002108937A
- Authority
- JP
- Japan
- Prior art keywords
- word
- words
- internet
- unit
- important
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
析及び表示に関するインターネット最新トレンド解析及
び表示システムの発明である。 【構成】 本発明は、インターネットのホームページ上
で、その時々で話題となっているニュースを、複数のニ
ュースサイトから自動的に収集し、収集したデータから
単語を取り出す単語抽出部と、この単語を独自の解析技
術によって、どのニュースが最も話題になっているかを
リアルタイムに解析する単語解析部と、単語解析部で解
析した結果を格納する重要語・関連語格納部と、重要語
・関連語格納部に格納された情報を基に、重要語の分布
状況や、重要語と関連語の相関図を表示する表示部を有
することを特徴とインターネット最新トレンド解析及び
表示システムの構成とした。
Description
おける文書の解析及び表示に関するインターネット最新
トレンド解析及び表示システムの発明である。
ームページ上で手軽に様々なニュースが見られるように
なってきた。これらの多種多様なホームページはニュー
スサイトと呼ばれ、新聞社や出版社等がホームページを
開設し、それぞれが独自に記事を作成し公開している。
治、経済から前日に起きた事件や事故、また芸能関係の
ゴシップ記事まで、様々なジャンルの記事がホームペー
ジ上で掲載されている。
ごとにニュースの内容が違い、一方のホームページで
は、ある記事が大きく取り扱われているが、別のホーム
ページを見ると全く取り扱われていない等の問題があ
る。
のニュースがどの程度の話題性をもっているか判断する
ことはできず、ニュースの話題性を調べるために、複数
のニュースサイトを比較する必要があり、これらすべて
のホームページを見ることは、利用者に負担となる。
ムページ上で、インターネット上のニュースサイトの中
で現在話題になっている記事の中から重要語を取り出
し、それに関連する関連語と合わせてホームページ上で
分かり易く表示することができるようにするインターネ
ット最新トレンド解析及び表示システムを提供すること
を目的とするものである。
解決するために、インターネットのホームページ上で、
その時々で話題となっているニュースを、複数のニュー
スサイトから自動的に収集し、収集したデータから単語
を取り出す単語抽出部と、この単語を独自の解析技術に
よって、どのニュースが最も話題になっているのかリア
ルタイムに解析する単語解析部と、単語解析部で解析し
た結果を格納する重要語・関連語格納部と、重要語・関
連語格納部に格納された情報を基に、重要語の分布状況
や、重要語と関連語の相関図を表示する表示部を有する
ことを特徴としたインターネット最新トレンド解析及び
表示システムの構成とした。
き説明する。図1は本発明のインターネット最新トレン
ド解析及び表示システム3の全体図を示す。
ト最新トレンド解析及び表示システム3の全体図は、イ
ンターネット1と、インターネット1上のニュースサイ
ト2、そして本発明のインターネット最新トレンド解析
及び表示システム3からなる。
ト最新トレンド解析及び表示システム3では、インター
ネット1上で掲載されている複数のニュースサイト2の
文書を単語抽出部4で取り込み、単語解析部5で重要語
9及び関連語10を決定する。
10の関連度11を測定し、前記の重要語9及び関連語
10そして関連度11を重要語・関連語格納部6に格納
し、表示部7で重要語9及び関連語10を画面で表示す
る。
ド解析及び表示システム3の解析手順について説明す
る。図2は、本発明のインターネット最新トレンド解析
及び表示システムの全体のフローチャートを示した図で
ある。
ト最新トレンド解析及び表示システム3は単語抽出部
4、単語解析部5、重要語・関連語格納部6及び表示部
7からなる。前記単語解析部5は、標準使用頻度辞書作
成部5aと重要語・関連語演算部5b及び単語使用頻度
測定部5cからなる。
最新トレンド解析及び表示システム3の単語解析部5の
標準使用頻度辞書作成部5aで使用する標準使用頻度辞
書の作成を行う。
ンド解析及び表示システムの標準使用頻度辞書作成のフ
ローチャートを示した図である。
成は、まずインターネット1上の複数のニュースサイト
2から文書を取り込み8、本発明のインターネット最新
トレンド解析及び表示システム3の単語抽出部4により
品詞に分けて分類し、分類した中から名詞や動詞を中心
に抜き出す(S101)。
れ、各地に大きな被害をもたらしました。」のような文
書の場合、まず「昨日」、「関東地方」、「は」、「大
雨」、「に」、「見舞われ」、「各地」、「に」、「大
きな」、「被害」、「を」、「もたらしました」に分類
する。
「関東地方」 、「大雨」 、「見舞われ」、「各地」
、「被害」 、「もたらしました」のように名詞や動詞
を選択する。
ット1上の複数のニュースサイト2の文書で何回使用さ
れているかの使用頻度の測定を、図2に示す本発明のイ
ンターネット最新トレンド解析及び表示システム3の単
語使用頻度測定部5cで行う(S102)。
使用頻度の比較的多い単語を選択する(S103)。上
記で選択された単語は標準使用頻度辞書作成部5aで独
自に演算を行い、演算結果を重要語・関連語格納部に格
納し、標準使用頻度辞書の作成が完了する(S10
4)。
示すフローチャートで説明する。図4は、本発明のイン
ターネット最新トレンド解析及び表示システムの重要語
の決定のフローチャートを示した図である。
ンターネット最新トレンド解析及び表示システム3の単
語抽出部4ではインターネット1上の複数のニュースサ
イト2を選択し、前記のニュースサイト2の中から、自
動的に文書を取り込む8(S201)。
て分類し、分類した中から名詞や動詞を中心に抜き出す
(S202)。
した。地震の規模を示すマグニチュードは5.4でし
た。」 のような文書の場合、まず「昨日」、「関東地
方」、「で」、「地震」、「が」、「ありました」、
「地震」、「の」、「規模」、「を」、「示す」、「マ
グニチュード」、「は」、「5.4」、「でした」に分
類する。
記で説明した標準使用頻度辞書に記憶されている単語と
の比較を行い(S203)、該当する単語のみを抽出す
る(S204)。この作業を、選択したニュースサイト
2全てについて行う。
ンド解析及び表示システムの重要語の決定のフローチャ
ートを示した図であり、次に、図4に示すように、図2
に示す本発明のインターネット最新トレンド解析及び表
示システム3の単語解析部5の単語使用頻度測定部5c
により、上記で選択された単語について、前記の単語が
ニュースサイト2の中で何回使用されているか調べる
(S205)。
単語を選択する(S206)。前記の単語を重要語9と
定義する(S207)。前記の重要語9は、図4に示す
ように、重要語・関連語格納部6に格納される(S20
8)。
のフローチャートで説明する。上記で説明したように、
重要語9についての決定と同様に関連語10の決定を行
う。まず、図2に示す本発明のインターネット最新トレ
ンド解析及び表示システム3の単語抽出部4において、
インターネット1上の複数のニュースサイト2を選択
し、前記のニュースサイト2の中から、文書を自動的に
収集する(S301)。
語9を含んだ文章や複合語を単語抽出部4により自動的
に収集する(S302)。「大雨」が重要語9の場合、
「大雨」を含む文章や複合語、例えば「昨日、大雨によ
り新幹線のダイヤが乱れました。」や「大雨警報」等が
抜き出される。
し、上記で説明した標準使用頻度辞書作成部5aに記憶
されている単語との比較を行い(S303)、該当する
単語の抽出を行う(S304)。
単語使用頻度測定部5cにより、上記で抽出した単語に
ついて、使用頻度の測定を行う(S305)。前記の使
用頻度の測定で、使用頻度の比較的高い単語を関連語1
0とし、(S306)以下で説明する重要語9と関連語
10の関連度11の計算結果(S307)とともに、関
連語10を重要語・関連語格納部6に格納する(S30
8)。
測定について説明する。関連度11の解析は、重要語9
と関連語10がニュースサイト2の中で同一文又は複合
語を形成している場合の数について計算する。
「大雨」に関連する関連語10として「低気圧」や「洪
水」、「土砂崩れ」が選ばれたと仮定する。そして、重
要語9である「大雨」と関連語10の「低気圧」が同一
文又は複合語を形成している場合が何カ所存在するのか
を計算する。
ついても同じ方法で計算し、数値が高いほど重要語9と
関連語10の関連度11が高いものとする。前記の関連
度11の数値の取り扱いについては以下の表示方法で説
明する。
ド解析及び表示システム3の表示方について説明する。
図6は、本発明のインターネット最新トレンド解析及び
表示システムの表示画面を示した図である。
ターネット最新トレンド解析及び表示システム3が掲載
されているホームページにアクセスすると、図6で示す
ように、二次元画像11で複数の重要語9を表示する。
したように、本発明のインターネット最新トレンド解析
及び表示システム3の単語解析部5により重要語9とし
て選ばれ、重要語・関連語格納部6に格納されている重
要語9を表示するものである。
ターネット最新トレンド解析及び表示システム3の単語
解析部5で解析された結果、使用頻度の高い重要語9ほ
ど、前記の重要語9を取り囲む略円形状の枠14が大き
く表示される。この二次元画像12で、今世間でどのよ
うなことが話題になっているかが、一目で分かるように
なっている。
語9の部分をマウスで選択すると、図7で示すように、
画面上に立体画像13が表示される。前記の立体画像1
3の上部の表示部分には、上記の図6で選択した重要語
9が表示される。
と前記の重要語9と関連性のある関連語10が立体画像
13上に表示される。さらに、上記の重要語9及び関連
語10は単語が掲載されているニュースサイト2とリン
クしており、重要語9及び関連語10の文字を選択する
と該当するニュースサイト2に移動する。
語9と関連語10の関係についても、表現することがで
きる。例えば、選挙の場合には、重要語9としては総選
挙が該当し、関連語としては政権交代、自保公連立、小
選挙区、公約、公約違反、自由党、汚職、投票率等が該
当する。
のインターネット最新トレンド解析及び表示システム3
の単語解析部5の重要語・関連語演算部5bにより、重
要語9と関連語10の関連度11が計算され、重要語9
と関連語10の関連度11が深いほど、線のサイズ15
が太く表示される。
関連語10ほど、立体画像12の上部に表示される。
析及び表示システムの利用により、インターネットで配
信されているニュースの中で、最も話題になっているも
のだけ短時間で迅速に見ることができ、複数のニュース
サイトの検索に費やす時間の節約になる。
及び表示システムはニュースサイトでの運用の他に、特
定のテーマサイトについての運用にも使用できる。
表示システムの全体図を示した図である。
表示システムの全体のフローチャートを示した図であ
る。
表示システムの標準使用頻度辞書作成のフローチャート
を示した図である。
表示システムの重要語の決定のフローチャートを示した
図である。
表示システムの関連語の決定のフローチャートを示した
図である。
表示システムの表示画面を示した図である。
表示システムの表示画面を示した図である。
Claims (2)
- 【請求項1】 インターネット上の複数のホームページ
から文書を自動的に収集し、収集したデータから単語を
切り出す単語抽出部と、単語を解析する単語解析部と、
単語の解析結果を格納する重要語・関連語格納部と、そ
して解析結果を表示する表示部を具備することを特徴と
するインターネット最新トレンド解析及び表示システム - 【請求項2】 インターネット上の複数のホームページ
から文書を自動的に収集し、単語抽出部において収集し
たデータから使用頻度の多い単語を抽出し、単語解析部
の標準使用頻度辞書作成部に記憶させ、再びインターネ
ット上の複数のホームページから文書を自動的に収集
し、単語抽出部において収集したデータから標準使用頻
度辞書に記憶した単語のみを抽出し、抽出した単語の使
用頻度を測定し、使用頻度の高い単語を重要語として重
要語・関連語格納部に格納し、さらに重要語に関連する
関連語を単語抽出部において抽出し、関連語についての
使用頻度の測定を行い重要語・関連語格納部に格納し、
重要語と関連語の関連度の計算をし、表示部において重
要語と関連語、そして関連度を表示することを特徴とす
るインターネット最新トレンド解析及び表示システム
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000294896A JP2002108937A (ja) | 2000-09-27 | 2000-09-27 | インターネット最新トレンド解析及び表示システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000294896A JP2002108937A (ja) | 2000-09-27 | 2000-09-27 | インターネット最新トレンド解析及び表示システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002108937A true JP2002108937A (ja) | 2002-04-12 |
Family
ID=18777411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000294896A Pending JP2002108937A (ja) | 2000-09-27 | 2000-09-27 | インターネット最新トレンド解析及び表示システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002108937A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006268684A (ja) * | 2005-03-25 | 2006-10-05 | Fujitsu Ltd | 需要予測装置、需要予測方法および需要予測プログラム |
JP2006344221A (ja) * | 2005-06-06 | 2006-12-21 | Thomson Licensing | データベース内の少なくとも1つのデータユニットに1つまたは複数の重みを割り当てる方法および装置 |
JP2007183903A (ja) * | 2005-12-06 | 2007-07-19 | Nippon Hoso Kyokai <Nhk> | トレンド情報分析装置 |
JP2007272549A (ja) * | 2006-03-31 | 2007-10-18 | Fujitsu Ltd | 人材育成装置 |
JP2008234317A (ja) * | 2007-03-20 | 2008-10-02 | Dainippon Printing Co Ltd | テーマキーワードの関連キーワードを表示する方法、および、ウェブサーバ |
JP2008276784A (ja) * | 2007-05-04 | 2008-11-13 | Nhn Corp | キーワード比較を用いた広告評価方法、広告評価システム、記録媒体 |
JP2009122337A (ja) * | 2007-11-14 | 2009-06-04 | Dainippon Printing Co Ltd | クイズ問題作成装置 |
WO2010091030A3 (en) * | 2009-02-04 | 2010-11-18 | Google Inc. | Advertising triggers based on internet trends |
WO2011013191A1 (ja) * | 2009-07-27 | 2011-02-03 | 株式会社 東芝 | 関連性提示装置、方法およびプログラム |
KR101560456B1 (ko) | 2013-11-01 | 2015-10-15 | 황성봉 | 어휘 분석을 이용한 트렌드정보 추출 및 예측 방법 |
-
2000
- 2000-09-27 JP JP2000294896A patent/JP2002108937A/ja active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7904544B2 (en) | 2005-03-25 | 2011-03-08 | Fujitsu Limited | Method and apparatus for estimating demand, and computer product |
JP2006268684A (ja) * | 2005-03-25 | 2006-10-05 | Fujitsu Ltd | 需要予測装置、需要予測方法および需要予測プログラム |
JP4705390B2 (ja) * | 2005-03-25 | 2011-06-22 | 富士通株式会社 | 需要予測装置 |
JP2006344221A (ja) * | 2005-06-06 | 2006-12-21 | Thomson Licensing | データベース内の少なくとも1つのデータユニットに1つまたは複数の重みを割り当てる方法および装置 |
JP2007183903A (ja) * | 2005-12-06 | 2007-07-19 | Nippon Hoso Kyokai <Nhk> | トレンド情報分析装置 |
JP2007272549A (ja) * | 2006-03-31 | 2007-10-18 | Fujitsu Ltd | 人材育成装置 |
JP4727483B2 (ja) * | 2006-03-31 | 2011-07-20 | 富士通株式会社 | 人材育成装置 |
JP2008234317A (ja) * | 2007-03-20 | 2008-10-02 | Dainippon Printing Co Ltd | テーマキーワードの関連キーワードを表示する方法、および、ウェブサーバ |
JP2008276784A (ja) * | 2007-05-04 | 2008-11-13 | Nhn Corp | キーワード比較を用いた広告評価方法、広告評価システム、記録媒体 |
JP2009122337A (ja) * | 2007-11-14 | 2009-06-04 | Dainippon Printing Co Ltd | クイズ問題作成装置 |
WO2010091030A3 (en) * | 2009-02-04 | 2010-11-18 | Google Inc. | Advertising triggers based on internet trends |
WO2011013191A1 (ja) * | 2009-07-27 | 2011-02-03 | 株式会社 東芝 | 関連性提示装置、方法およびプログラム |
US8452760B2 (en) | 2009-07-27 | 2013-05-28 | Kabushiki Kaisha Toshiba | Relevancy presentation apparatus, method, and program |
JP5289573B2 (ja) * | 2009-07-27 | 2013-09-11 | 株式会社東芝 | 関連性提示装置、方法およびプログラム |
KR101560456B1 (ko) | 2013-11-01 | 2015-10-15 | 황성봉 | 어휘 분석을 이용한 트렌드정보 추출 및 예측 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Smith | Detecting and browsing events in unstructured text | |
Endarnoto et al. | Traffic condition information extraction & visualization from social media twitter for android mobile application | |
Martins et al. | Extracting and exploring the geo-temporal semantics of textual resources | |
US20110302179A1 (en) | Using Context to Extract Entities from a Document Collection | |
US9015168B2 (en) | Device and method for generating opinion pairs having sentiment orientation based impact relations | |
JP2003167914A (ja) | マルチメディア情報検索方法、プログラム、記録媒体及びシステム | |
US20150331847A1 (en) | Apparatus and method for classifying and analyzing documents including text | |
CA2832909A1 (en) | System and method for matching comment data to text data | |
CN103942211B (zh) | 一种正文页的识别方法及装置 | |
WO2014000130A1 (en) | Method or system for automated extraction of hyper-local events from one or more web pages | |
US20150142780A1 (en) | Apparatus and method for analyzing event time-space correlation in social web media | |
Mazeika et al. | Entity timelines: visual analytics and named entity evolution | |
US9792377B2 (en) | Sentiment trent visualization relating to an event occuring in a particular geographic region | |
JP2002108937A (ja) | インターネット最新トレンド解析及び表示システム | |
Strzelecki et al. | Direct answers in Google search results | |
JP5890385B2 (ja) | データ処理装置、及びデータ処理方法 | |
KR101850853B1 (ko) | 빅데이터를 이용한 검색 방법 및 장치 | |
US10643355B1 (en) | Graphical representation of frame instances and co-occurrences | |
JP2007011973A (ja) | 情報検索装置及び情報検索プログラム | |
JP2009265770A (ja) | 重要文提示システム | |
Cao et al. | Extraction of informative blocks from web pages | |
JP2010049384A (ja) | 動画評価方法、装置及びプログラム | |
KR20070008994A (ko) | 비구조 웹문서에서 도메인별 정보를 추출하기 위한 시스템및 그 방법 | |
JP2006293616A (ja) | 文書集約方法及び装置及びプログラム | |
Lieberman et al. | Spatio-textual spreadsheets: Geotagging via spatial coherence |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080221 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080513 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080916 |