JP2002108937A - インターネット最新トレンド解析及び表示システム - Google Patents

インターネット最新トレンド解析及び表示システム

Info

Publication number
JP2002108937A
JP2002108937A JP2000294896A JP2000294896A JP2002108937A JP 2002108937 A JP2002108937 A JP 2002108937A JP 2000294896 A JP2000294896 A JP 2000294896A JP 2000294896 A JP2000294896 A JP 2000294896A JP 2002108937 A JP2002108937 A JP 2002108937A
Authority
JP
Japan
Prior art keywords
word
words
internet
unit
important
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000294896A
Other languages
English (en)
Inventor
Eisaku Terao
英作 寺尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TSUKUBA MULTIMEDIA KK
Tsukuba Multimedia Corp
Original Assignee
TSUKUBA MULTIMEDIA KK
Tsukuba Multimedia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TSUKUBA MULTIMEDIA KK, Tsukuba Multimedia Corp filed Critical TSUKUBA MULTIMEDIA KK
Priority to JP2000294896A priority Critical patent/JP2002108937A/ja
Publication of JP2002108937A publication Critical patent/JP2002108937A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 本発明は、インターネットにおける文書の解
析及び表示に関するインターネット最新トレンド解析及
び表示システムの発明である。 【構成】 本発明は、インターネットのホームページ上
で、その時々で話題となっているニュースを、複数のニ
ュースサイトから自動的に収集し、収集したデータから
単語を取り出す単語抽出部と、この単語を独自の解析技
術によって、どのニュースが最も話題になっているかを
リアルタイムに解析する単語解析部と、単語解析部で解
析した結果を格納する重要語・関連語格納部と、重要語
・関連語格納部に格納された情報を基に、重要語の分布
状況や、重要語と関連語の相関図を表示する表示部を有
することを特徴とインターネット最新トレンド解析及び
表示システムの構成とした。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は、インターネットに
おける文書の解析及び表示に関するインターネット最新
トレンド解析及び表示システムの発明である。
【0002】
【従来の技術】近年のインターネットの普及に伴い、ホ
ームページ上で手軽に様々なニュースが見られるように
なってきた。これらの多種多様なホームページはニュー
スサイトと呼ばれ、新聞社や出版社等がホームページを
開設し、それぞれが独自に記事を作成し公開している。
【0003】前記多種多様なホームページの内容は、政
治、経済から前日に起きた事件や事故、また芸能関係の
ゴシップ記事まで、様々なジャンルの記事がホームペー
ジ上で掲載されている。
【0004】
【発明が解決しようとする課題】しかし、ホームページ
ごとにニュースの内容が違い、一方のホームページで
は、ある記事が大きく取り扱われているが、別のホーム
ページを見ると全く取り扱われていない等の問題があ
る。
【0005】また、一つのニュースサイトだけでは、そ
のニュースがどの程度の話題性をもっているか判断する
ことはできず、ニュースの話題性を調べるために、複数
のニュースサイトを比較する必要があり、これらすべて
のホームページを見ることは、利用者に負担となる。
【0006】そこで、本発明は、インターネットのホー
ムページ上で、インターネット上のニュースサイトの中
で現在話題になっている記事の中から重要語を取り出
し、それに関連する関連語と合わせてホームページ上で
分かり易く表示することができるようにするインターネ
ット最新トレンド解析及び表示システムを提供すること
を目的とするものである。
【0007】
【課題を解決するための手段】本発明は、上記の課題を
解決するために、インターネットのホームページ上で、
その時々で話題となっているニュースを、複数のニュー
スサイトから自動的に収集し、収集したデータから単語
を取り出す単語抽出部と、この単語を独自の解析技術に
よって、どのニュースが最も話題になっているのかリア
ルタイムに解析する単語解析部と、単語解析部で解析し
た結果を格納する重要語・関連語格納部と、重要語・関
連語格納部に格納された情報を基に、重要語の分布状況
や、重要語と関連語の相関図を表示する表示部を有する
ことを特徴としたインターネット最新トレンド解析及び
表示システムの構成とした。
【0008】
【実施例】以下に、図面とともに本発明の一実施例につ
き説明する。図1は本発明のインターネット最新トレン
ド解析及び表示システム3の全体図を示す。
【0009】図1に示すように、本発明のインターネッ
ト最新トレンド解析及び表示システム3の全体図は、イ
ンターネット1と、インターネット1上のニュースサイ
ト2、そして本発明のインターネット最新トレンド解析
及び表示システム3からなる。
【0010】図1に示すように、本発明のインターネッ
ト最新トレンド解析及び表示システム3では、インター
ネット1上で掲載されている複数のニュースサイト2の
文書を単語抽出部4で取り込み、単語解析部5で重要語
9及び関連語10を決定する。
【0011】また、前記で決定した重要語9及び関連語
10の関連度11を測定し、前記の重要語9及び関連語
10そして関連度11を重要語・関連語格納部6に格納
し、表示部7で重要語9及び関連語10を画面で表示す
る。
【0012】次に、本発明のインターネット最新トレン
ド解析及び表示システム3の解析手順について説明す
る。図2は、本発明のインターネット最新トレンド解析
及び表示システムの全体のフローチャートを示した図で
ある。
【0013】図2に示すように、本発明のインターネッ
ト最新トレンド解析及び表示システム3は単語抽出部
4、単語解析部5、重要語・関連語格納部6及び表示部
7からなる。前記単語解析部5は、標準使用頻度辞書作
成部5aと重要語・関連語演算部5b及び単語使用頻度
測定部5cからなる。
【0014】まず、図2で示す本発明のインターネット
最新トレンド解析及び表示システム3の単語解析部5の
標準使用頻度辞書作成部5aで使用する標準使用頻度辞
書の作成を行う。
【0015】図3は、本発明のインターネット最新トレ
ンド解析及び表示システムの標準使用頻度辞書作成のフ
ローチャートを示した図である。
【0016】図3で示すように、標準使用頻度辞書の作
成は、まずインターネット1上の複数のニュースサイト
2から文書を取り込み8、本発明のインターネット最新
トレンド解析及び表示システム3の単語抽出部4により
品詞に分けて分類し、分類した中から名詞や動詞を中心
に抜き出す(S101)。
【0017】例えば「昨日、関東地方は大雨に見舞わ
れ、各地に大きな被害をもたらしました。」のような文
書の場合、まず「昨日」、「関東地方」、「は」、「大
雨」、「に」、「見舞われ」、「各地」、「に」、「大
きな」、「被害」、「を」、「もたらしました」に分類
する。
【0018】そして、上記の分類した中から「昨日」、
「関東地方」 、「大雨」 、「見舞われ」、「各地」
、「被害」 、「もたらしました」のように名詞や動詞
を選択する。
【0019】上記で選択した単語について、インターネ
ット1上の複数のニュースサイト2の文書で何回使用さ
れているかの使用頻度の測定を、図2に示す本発明のイ
ンターネット最新トレンド解析及び表示システム3の単
語使用頻度測定部5cで行う(S102)。
【0020】そして、上記の単語使用頻度測定部5cで
使用頻度の比較的多い単語を選択する(S103)。上
記で選択された単語は標準使用頻度辞書作成部5aで独
自に演算を行い、演算結果を重要語・関連語格納部に格
納し、標準使用頻度辞書の作成が完了する(S10
4)。
【0021】次に、重要語9の決定方法について図4で
示すフローチャートで説明する。図4は、本発明のイン
ターネット最新トレンド解析及び表示システムの重要語
の決定のフローチャートを示した図である。
【0022】図4で示すように、図2に示す本発明のイ
ンターネット最新トレンド解析及び表示システム3の単
語抽出部4ではインターネット1上の複数のニュースサ
イト2を選択し、前記のニュースサイト2の中から、自
動的に文書を取り込む8(S201)。
【0023】そして、前記で収集した文書を品詞に分け
て分類し、分類した中から名詞や動詞を中心に抜き出す
(S202)。
【0024】例えば、「昨日、関東地方で地震がありま
した。地震の規模を示すマグニチュードは5.4でし
た。」 のような文書の場合、まず「昨日」、「関東地
方」、「で」、「地震」、「が」、「ありました」、
「地震」、「の」、「規模」、「を」、「示す」、「マ
グニチュード」、「は」、「5.4」、「でした」に分
類する。
【0025】そして、上記の分類した品詞について、上
記で説明した標準使用頻度辞書に記憶されている単語と
の比較を行い(S203)、該当する単語のみを抽出す
る(S204)。この作業を、選択したニュースサイト
2全てについて行う。
【0026】図4は、本発明のインターネット最新トレ
ンド解析及び表示システムの重要語の決定のフローチャ
ートを示した図であり、次に、図4に示すように、図2
に示す本発明のインターネット最新トレンド解析及び表
示システム3の単語解析部5の単語使用頻度測定部5c
により、上記で選択された単語について、前記の単語が
ニュースサイト2の中で何回使用されているか調べる
(S205)。
【0027】そして、使用頻度が多い順に上位10個の
単語を選択する(S206)。前記の単語を重要語9と
定義する(S207)。前記の重要語9は、図4に示す
ように、重要語・関連語格納部6に格納される(S20
8)。
【0028】次に、関連語10の決定方法について図5
のフローチャートで説明する。上記で説明したように、
重要語9についての決定と同様に関連語10の決定を行
う。まず、図2に示す本発明のインターネット最新トレ
ンド解析及び表示システム3の単語抽出部4において、
インターネット1上の複数のニュースサイト2を選択
し、前記のニュースサイト2の中から、文書を自動的に
収集する(S301)。
【0029】そして、上記で収集した文書の中から重要
語9を含んだ文章や複合語を単語抽出部4により自動的
に収集する(S302)。「大雨」が重要語9の場合、
「大雨」を含む文章や複合語、例えば「昨日、大雨によ
り新幹線のダイヤが乱れました。」や「大雨警報」等が
抜き出される。
【0030】そして、上記の文章や複合語を品詞で分類
し、上記で説明した標準使用頻度辞書作成部5aに記憶
されている単語との比較を行い(S303)、該当する
単語の抽出を行う(S304)。
【0032】また、図5に示すように、単語解析部5の
単語使用頻度測定部5cにより、上記で抽出した単語に
ついて、使用頻度の測定を行う(S305)。前記の使
用頻度の測定で、使用頻度の比較的高い単語を関連語1
0とし、(S306)以下で説明する重要語9と関連語
10の関連度11の計算結果(S307)とともに、関
連語10を重要語・関連語格納部6に格納する(S30
8)。
【0033】次に重要語9と関連語10の関連度11の
測定について説明する。関連度11の解析は、重要語9
と関連語10がニュースサイト2の中で同一文又は複合
語を形成している場合の数について計算する。
【0034】 例えば、「大雨」が重要語9の場合、
「大雨」に関連する関連語10として「低気圧」や「洪
水」、「土砂崩れ」が選ばれたと仮定する。そして、重
要語9である「大雨」と関連語10の「低気圧」が同一
文又は複合語を形成している場合が何カ所存在するのか
を計算する。
【0035】同様に、上記の「洪水」、「土砂崩れ」に
ついても同じ方法で計算し、数値が高いほど重要語9と
関連語10の関連度11が高いものとする。前記の関連
度11の数値の取り扱いについては以下の表示方法で説
明する。
【0036】次に、本発明のインターネット最新トレン
ド解析及び表示システム3の表示方について説明する。
図6は、本発明のインターネット最新トレンド解析及び
表示システムの表示画面を示した図である。
【0037】図6で示すように、利用者が本発明のイン
ターネット最新トレンド解析及び表示システム3が掲載
されているホームページにアクセスすると、図6で示す
ように、二次元画像11で複数の重要語9を表示する。
【0038】前記の重要語9は、上記の解析手順で説明
したように、本発明のインターネット最新トレンド解析
及び表示システム3の単語解析部5により重要語9とし
て選ばれ、重要語・関連語格納部6に格納されている重
要語9を表示するものである。
【0039】上記の二次元画像12では、本発明のイン
ターネット最新トレンド解析及び表示システム3の単語
解析部5で解析された結果、使用頻度の高い重要語9ほ
ど、前記の重要語9を取り囲む略円形状の枠14が大き
く表示される。この二次元画像12で、今世間でどのよ
うなことが話題になっているかが、一目で分かるように
なっている。
【0040】そして、図6に示す二次元画像12の重要
語9の部分をマウスで選択すると、図7で示すように、
画面上に立体画像13が表示される。前記の立体画像1
3の上部の表示部分には、上記の図6で選択した重要語
9が表示される。
【0041】また、同時に図7に示すように、重要語9
と前記の重要語9と関連性のある関連語10が立体画像
13上に表示される。さらに、上記の重要語9及び関連
語10は単語が掲載されているニュースサイト2とリン
クしており、重要語9及び関連語10の文字を選択する
と該当するニュースサイト2に移動する。
【0042】また、図7で示す立体画像12では、重要
語9と関連語10の関係についても、表現することがで
きる。例えば、選挙の場合には、重要語9としては総選
挙が該当し、関連語としては政権交代、自保公連立、小
選挙区、公約、公約違反、自由党、汚職、投票率等が該
当する。
【0043】上記の解析手順で説明したように、本発明
のインターネット最新トレンド解析及び表示システム3
の単語解析部5の重要語・関連語演算部5bにより、重
要語9と関連語10の関連度11が計算され、重要語9
と関連語10の関連度11が深いほど、線のサイズ15
が太く表示される。
【0044】また、図7に示すように、使用頻度の高い
関連語10ほど、立体画像12の上部に表示される。
【0045】
【発明の効果】本発明のインターネット最新トレンド解
析及び表示システムの利用により、インターネットで配
信されているニュースの中で、最も話題になっているも
のだけ短時間で迅速に見ることができ、複数のニュース
サイトの検索に費やす時間の節約になる。
【0046】本発明のインターネット最新トレンド解析
及び表示システムはニュースサイトでの運用の他に、特
定のテーマサイトについての運用にも使用できる。
【図面の簡単な説明】
【図1】本発明のインターネット最新トレンド解析及び
表示システムの全体図を示した図である。
【図2】本発明のインターネット最新トレンド解析及び
表示システムの全体のフローチャートを示した図であ
る。
【図3】本発明のインターネット最新トレンド解析及び
表示システムの標準使用頻度辞書作成のフローチャート
を示した図である。
【図4】本発明のインターネット最新トレンド解析及び
表示システムの重要語の決定のフローチャートを示した
図である。
【図5】本発明のインターネット最新トレンド解析及び
表示システムの関連語の決定のフローチャートを示した
図である。
【図6】本発明のインターネット最新トレンド解析及び
表示システムの表示画面を示した図である。
【図7】本発明のインターネット最新トレンド解析及び
表示システムの表示画面を示した図である。
【符号の説明】
1 インターネット 2 ニュースサイト 3 最新トレンド解析及び表示システム 4 単語抽出部 5 単語解析部 5a 標準使用頻度辞書作成部 5b 重要語・関連語演算部 5c 単語使用頻度測定部 6 重要語・関連語格納部 7 表示部 8 文書取り込み 9 重要語 10 関連語 11 関連度 12 二次元画像 13 立体画像 14 枠 15 線のサイズ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 インターネット上の複数のホームページ
    から文書を自動的に収集し、収集したデータから単語を
    切り出す単語抽出部と、単語を解析する単語解析部と、
    単語の解析結果を格納する重要語・関連語格納部と、そ
    して解析結果を表示する表示部を具備することを特徴と
    するインターネット最新トレンド解析及び表示システム
  2. 【請求項2】 インターネット上の複数のホームページ
    から文書を自動的に収集し、単語抽出部において収集し
    たデータから使用頻度の多い単語を抽出し、単語解析部
    の標準使用頻度辞書作成部に記憶させ、再びインターネ
    ット上の複数のホームページから文書を自動的に収集
    し、単語抽出部において収集したデータから標準使用頻
    度辞書に記憶した単語のみを抽出し、抽出した単語の使
    用頻度を測定し、使用頻度の高い単語を重要語として重
    要語・関連語格納部に格納し、さらに重要語に関連する
    関連語を単語抽出部において抽出し、関連語についての
    使用頻度の測定を行い重要語・関連語格納部に格納し、
    重要語と関連語の関連度の計算をし、表示部において重
    要語と関連語、そして関連度を表示することを特徴とす
    るインターネット最新トレンド解析及び表示システム
JP2000294896A 2000-09-27 2000-09-27 インターネット最新トレンド解析及び表示システム Pending JP2002108937A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000294896A JP2002108937A (ja) 2000-09-27 2000-09-27 インターネット最新トレンド解析及び表示システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000294896A JP2002108937A (ja) 2000-09-27 2000-09-27 インターネット最新トレンド解析及び表示システム

Publications (1)

Publication Number Publication Date
JP2002108937A true JP2002108937A (ja) 2002-04-12

Family

ID=18777411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000294896A Pending JP2002108937A (ja) 2000-09-27 2000-09-27 インターネット最新トレンド解析及び表示システム

Country Status (1)

Country Link
JP (1) JP2002108937A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268684A (ja) * 2005-03-25 2006-10-05 Fujitsu Ltd 需要予測装置、需要予測方法および需要予測プログラム
JP2006344221A (ja) * 2005-06-06 2006-12-21 Thomson Licensing データベース内の少なくとも1つのデータユニットに1つまたは複数の重みを割り当てる方法および装置
JP2007183903A (ja) * 2005-12-06 2007-07-19 Nippon Hoso Kyokai <Nhk> トレンド情報分析装置
JP2007272549A (ja) * 2006-03-31 2007-10-18 Fujitsu Ltd 人材育成装置
JP2008234317A (ja) * 2007-03-20 2008-10-02 Dainippon Printing Co Ltd テーマキーワードの関連キーワードを表示する方法、および、ウェブサーバ
JP2008276784A (ja) * 2007-05-04 2008-11-13 Nhn Corp キーワード比較を用いた広告評価方法、広告評価システム、記録媒体
JP2009122337A (ja) * 2007-11-14 2009-06-04 Dainippon Printing Co Ltd クイズ問題作成装置
WO2010091030A3 (en) * 2009-02-04 2010-11-18 Google Inc. Advertising triggers based on internet trends
WO2011013191A1 (ja) * 2009-07-27 2011-02-03 株式会社 東芝 関連性提示装置、方法およびプログラム
KR101560456B1 (ko) 2013-11-01 2015-10-15 황성봉 어휘 분석을 이용한 트렌드정보 추출 및 예측 방법

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7904544B2 (en) 2005-03-25 2011-03-08 Fujitsu Limited Method and apparatus for estimating demand, and computer product
JP2006268684A (ja) * 2005-03-25 2006-10-05 Fujitsu Ltd 需要予測装置、需要予測方法および需要予測プログラム
JP4705390B2 (ja) * 2005-03-25 2011-06-22 富士通株式会社 需要予測装置
JP2006344221A (ja) * 2005-06-06 2006-12-21 Thomson Licensing データベース内の少なくとも1つのデータユニットに1つまたは複数の重みを割り当てる方法および装置
JP2007183903A (ja) * 2005-12-06 2007-07-19 Nippon Hoso Kyokai <Nhk> トレンド情報分析装置
JP2007272549A (ja) * 2006-03-31 2007-10-18 Fujitsu Ltd 人材育成装置
JP4727483B2 (ja) * 2006-03-31 2011-07-20 富士通株式会社 人材育成装置
JP2008234317A (ja) * 2007-03-20 2008-10-02 Dainippon Printing Co Ltd テーマキーワードの関連キーワードを表示する方法、および、ウェブサーバ
JP2008276784A (ja) * 2007-05-04 2008-11-13 Nhn Corp キーワード比較を用いた広告評価方法、広告評価システム、記録媒体
JP2009122337A (ja) * 2007-11-14 2009-06-04 Dainippon Printing Co Ltd クイズ問題作成装置
WO2010091030A3 (en) * 2009-02-04 2010-11-18 Google Inc. Advertising triggers based on internet trends
WO2011013191A1 (ja) * 2009-07-27 2011-02-03 株式会社 東芝 関連性提示装置、方法およびプログラム
US8452760B2 (en) 2009-07-27 2013-05-28 Kabushiki Kaisha Toshiba Relevancy presentation apparatus, method, and program
JP5289573B2 (ja) * 2009-07-27 2013-09-11 株式会社東芝 関連性提示装置、方法およびプログラム
KR101560456B1 (ko) 2013-11-01 2015-10-15 황성봉 어휘 분석을 이용한 트렌드정보 추출 및 예측 방법

Similar Documents

Publication Publication Date Title
Smith Detecting and browsing events in unstructured text
Endarnoto et al. Traffic condition information extraction & visualization from social media twitter for android mobile application
Martins et al. Extracting and exploring the geo-temporal semantics of textual resources
US20110302179A1 (en) Using Context to Extract Entities from a Document Collection
US9015168B2 (en) Device and method for generating opinion pairs having sentiment orientation based impact relations
JP2003167914A (ja) マルチメディア情報検索方法、プログラム、記録媒体及びシステム
US20150331847A1 (en) Apparatus and method for classifying and analyzing documents including text
CA2832909A1 (en) System and method for matching comment data to text data
CN103942211B (zh) 一种正文页的识别方法及装置
WO2014000130A1 (en) Method or system for automated extraction of hyper-local events from one or more web pages
US20150142780A1 (en) Apparatus and method for analyzing event time-space correlation in social web media
Mazeika et al. Entity timelines: visual analytics and named entity evolution
US9792377B2 (en) Sentiment trent visualization relating to an event occuring in a particular geographic region
JP2002108937A (ja) インターネット最新トレンド解析及び表示システム
Strzelecki et al. Direct answers in Google search results
JP5890385B2 (ja) データ処理装置、及びデータ処理方法
KR101850853B1 (ko) 빅데이터를 이용한 검색 방법 및 장치
US10643355B1 (en) Graphical representation of frame instances and co-occurrences
JP2007011973A (ja) 情報検索装置及び情報検索プログラム
JP2009265770A (ja) 重要文提示システム
Cao et al. Extraction of informative blocks from web pages
JP2010049384A (ja) 動画評価方法、装置及びプログラム
KR20070008994A (ko) 비구조 웹문서에서 도메인별 정보를 추출하기 위한 시스템및 그 방법
JP2006293616A (ja) 文書集約方法及び装置及びプログラム
Lieberman et al. Spatio-textual spreadsheets: Geotagging via spatial coherence

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080513

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080916