JP2015092398A - 情報表示制御装置およびプログラム - Google Patents
情報表示制御装置およびプログラム Download PDFInfo
- Publication number
- JP2015092398A JP2015092398A JP2015003982A JP2015003982A JP2015092398A JP 2015092398 A JP2015092398 A JP 2015092398A JP 2015003982 A JP2015003982 A JP 2015003982A JP 2015003982 A JP2015003982 A JP 2015003982A JP 2015092398 A JP2015092398 A JP 2015092398A
- Authority
- JP
- Japan
- Prior art keywords
- text
- information
- display
- url
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
ラムに関する。
トなど、通信ネットワークにおけるサーバ・クライアント・システムでは、クライアント
装置が備えるWebブラウザにより、ネットワーク上の各Webサイトのサーバ装置が生
成保存している種々の情報(Webページ)を取得表示して閲覧することが行われる。
かを問わず、ありとあらゆる情報が溢れているため、ユーザが本当に必要とする情報を得
るのはそれほど簡単ではない。
を含む情報を記述している多数のWebページの見出しがリンクテキストとして一覧表示
される。ユーザはこの一覧表示されたページ見出しを次々に指定して該当するWebペー
ジを開いて表示させ、本当に必要とする情報が含まれるか否か確認している。
この抽出されたリンク先コンテンツの紹介文を自動生成するリンク集作成装置が考えられ
ている(例えば、特許文献1参照。)。
く、その内容の概要を知ることができる。
高い情報であるか否かとは無関係な、Webページ上にある各リンクのリンク先に何があ
るかを紹介するだけのものであり、結局は様々なリンク先の紹介文を次々に見ていく必要
がある。
報サイトにおいて、ユーザにとって必要となる確率の高い情報を自動的に抽出して表示す
ることが可能になる情報表示装置およびプログラムを提供することを目的とする。
ス頻度に基づいて予め複数記憶するURL記憶手段と、このURL記憶手段により複数記
憶されたURLで指定される情報サイトのページを取得し、当該ページ内の見出し情報を
それぞれ抽出する見出し情報抽出手段と、この見出し情報抽出手段により抽出された見出
し情報に対応する本文をそれぞれ抽出する本文抽出手段と、この本文抽出手段により抽出
されたアクセス頻度の高い本文テキストとアクセス頻度の低い本文テキストの類似度を判
定し、当該類似度が予め設定された値よりも高いと判定された本文を表示対象に設定する
表示対象設定手段と、この表示対象設定手段により表示対象に設定された本文を表示部に
表示させる表示制御手段と、を備えたことを特徴としている。
て必要となる確率の高い情報を自動的に抽出して表示することが可能になる情報表示装置
およびプログラムを提供できる。
クライアント・システムの構成を示すブロック図である。
るネットワークN上に接続された複数のサーバ装置(情報サイトA)10A,(情報サイ
トB)10B,(情報サイトC)10C,…および複数の情報端末装置(クライアント装
置)20,…を備える。
C,…は、各情報サイトに応じたWebコンテンツ生成処理プログラム,登録ユーザ管理
処理プログラム,Webページ配信処理プログラムなど、当該サーバ装置10A,10B
,10C,…の本体操作により機能する複数のアプリケーションプログラムを有し、例え
ば情報端末装置20からの指定の情報サイトへのアクセス要求に応じて当該要求された情
報サイトにて生成したWebページを同情報端末装置20へ配信する。
なり、インターネット接続処理プログラム、Webブラウザプログラム,Web印刷プロ
グラムなど、当該情報端末装置20の本体操作により機能する複数のアプリケーションプ
ログラムを有する。そして、例えば所望の情報サイトA[http://www.sight_a.co.jp/]の
サーバ装置10AにアクセスしてそのWebページを取得し、当該WebページのHTM
L(Hyper Text Markup Language)のタグ要素から成るツリー構造を解析して画面展開し表
示したり印刷したりする。
21には、バス22を介してROMやRAMからなる記憶部23、メモリカードや光ディ
スクなどの外部記憶媒体24にデータを読み書きする記憶媒体読み書き部25が接続され
る。
Dからなる表示部27、前記サーバ装置10A,10B,10C,…との間でデータを送
受信する送受信部28が接続される。
リケーションプログラムに従って回路各部の動作を制御するもので、入力部26からの入
力信号に応じて前記種々のアプリケーションプログラムが起動され実行される。
、前記情報端末装置20,…を前記Webサイトにアクセス可能なユーザ端末とした場合
、ユーザ端末(20)からWebサイト(10A)へのアクセス要求に応じて、当該We
bサイト(10A)においてHTMLにより記述生成されたWebページがアクセス要求
元のユーザ端末(20)へ配信され、そのWebブラウザプログラムにより表示部27に
展開されて表示される。
23bが備えられる。
録リストを示す図である。
頃からアクセスする頻度の比較的高い各サーバ装置(情報サイトA,B,C,…)10A
,10b,10C,…のURLが、そのURL_IDに対応付けられて記憶される。
の抽出結果リストを示す図である。
た各URL_ID毎のURLに対応するWebページから抽出されたタイトル(リンクテ
キスト)、当該タイトル(リンクテキスト)のリンク先URL、このリンク先URLに対
応するWebページから抽出された本文テキストが、該当するURL_IDに関係付けた
本文IDに対応付けられて記憶される。
小さい方の本文テキストを基準に他のURL_IDに対応付けられた本文テキストとの類
似度を総当たりに順番に判定する。そして、類似度が規定値より高いと判定された本文テ
キストについては、その判定に伴い、URL_IDが小さい方の本文テキストに対応付け
て要表示マークを付加し、もう一方の本文テキストを削除する。
本文テキストは、ユーザが日頃からアクセスする頻度の比較的高い各サーバ装置(情報サ
イトA,B,C,…)10A,10b,10C,…のWebページから抽出された全ての
タイトル(テキストテキスト)に対応するリンク先の本文テキストの中で、少なくとも2
つの情報サイトのWebページに載っているタイトルに対応する類似と判定された本文テ
キストの一方である。このため、前記要表示マークが付加されたところの本文テキストは
、ユーザが日頃からアクセスする頻度の比較的高い各情報サイトA,B,C,…から得ら
れる情報の中でも重要度が高い情報になる。
p://www.sight.a.co.jp/]から取得されたWebページPの画面表示例を示す図である。
MLソースPhtmを示す図である。
パーテキストであり、メインタイトルT「今日の速報ニュース」に属する5項目の個別タ
イトルが何れもリンクテキストLtxt1〜Ltxt5に設定されている。そして、当該各リンク
テキストLtxt1〜Ltxt5は、図5にその一部を示すHTMLソースPhtmにおいて、何れ
も“A”で括られるタグ要素に記述され、リンク先WebページのURLが対応付けられ
ている。
番目の個別タイトルに対応するリンクテキスト「首相、内閣支持率に注文」Ltxt1にフォ
ーカスすると、当該リンクテキストLtxt1を記述したHTMLソースPhtmから、破線a
で囲んで示すように、リンク先WebページのURL[http://www.sight_b.co.jp/news00
2.html]が取得される。
ユーザ指定のWebサイトのサーバ装置10A,10B,10C,…へのアクセスに伴い
、そのWebページを取得し、当該WebページのHTMLのタグから成るツリー構造を
解析して、記憶部23内のフレームバッファFBに画面展開し表示する機能を有する。
のサーバ装置からWebページPを取得して表示する機能とは別に、一定時間T1毎に、
前記URL登録リストメモリ23a(図2参照)に登録されている各URLのサーバ装置
へ自動でアクセスし、各サーバ装置が提供する全てのWebページP…内の個別タイトル
であるリンクテキストLtxt1〜Ltxtmを抽出する機能、抽出された各リンクテキストLtx
t1〜Ltxtmに対応するリンク先URLを取得する機能、取得された各リンク先URLにア
クセスしてその本文テキストを抽出する機能、そして前記登録された各URLのID毎の
個別タイトル(リンクテキスト)、リンク先URL、本文テキストを、該当するURL_
IDに関係付けた本文IDと対応付けて前記抽出結果リストメモリ23b(図3参照)に
登録する機能を有する(図6のステップSA[表示対象テキスト取得処理])。
RL_IDの相互間で当該URL_IDが小さい方の本文テキストを基準に他のURL_I
Dに対応付けられた本文テキストとの類似度を総当たりに順番に判定する機能、この類似
度判定に際して、類似度が規定値より高いと判定された本文テキストについては、URL
_IDが小さい方の本文テキストに対応付けて要表示マークを付加すると共に、もう一方
の本文テキストを削除する機能を有する(図6のステップSB[類似度判定処理])。
付加された本文テキストが存在する場合に、当該要表示の本文テキストが対応付けられた
個別タイトル(リンクテキスト)を表示部27にウインドウ表示する機能を有する(図6
のステップSC[表示処理])。
Webブラウザプログラムにプラグインあるいはアドオンするプログラムにより実現され
る。
取得表示機能について説明する。
トである。
得処理(ステップSA)、類似度判定処理(ステップSB)、表示処理(ステップSC)
が、予め設定された一定時間T1毎に繰り返し実行される(ステップSD,SE→SA)
。
情報サイトA,B,C,…から得られる情報の中でも重要度が高い情報の個別タイトル(
リンクテキスト)を常時ウインドウ表示できるようになる。
ローチャートである。
a(図2参照)に登録されたURLの数“n”に初期化され、また同記憶部23において
管理する変数yの値が、前記登録されたn個のURLの先頭を指定する値“1”に初期化
される(ステップA1)。
ったサーバ装置(例えば情報サイトA)10Aへアクセスされ、当該情報サイトAのWe
bページPが取得される。そして、このWebページPに記述されている各個別タイトル
のリンクテキストLtxt1〜Ltxtmが抽出され、前記抽出結果リストメモリ23b(図3参
照)に前記URLのID(=1)に対応付けられて記憶される(ステップA2)。
のリンクテキストLtxt1〜Ltxtmを抽出する処理は、例えば次のように実行される。
ージP内の「カラム」が抽出される。また前記HTMLの構造解析から、例えば前記「カ
ラム」毎に、周囲の文字列と比較して大きい文字サイズや目立つ文字フォントである「強
い」文字列が抽出されてリストアップされる。すると、リストアップされた「強い」文字
列同士の位置関係,強弱,個数などから各個別タイトルのリンクテキストLtxt1〜Ltxtm
が認定抽出される。
トや太字で個別タイトルが表示されることが多い。従って、前記処理によりタイトル抽出
することで、トップニュース等の重要情報についての個別タイトルを抽出することが可能
となる。
=1)のURLに対応するWebページPから抽出された各個別タイトル(リンクテキス
トLtxt1〜Ltxtm)の数“m”にセットされる(ステップA3)。
)のURLに対応するWebページPから少なくとも1つ以上の個別タイトル(リンクテ
キスト)が抽出されたと判断されると、この抽出されたn(=m)個の個別タイトル(リ
ンクテキスト)の各リンク先URLに従い当該各リンク先のWebページLP…(図8参
照)が取得される。そして、この各リンク先のWebページLP…からその本文テキスト
Htxt…が抽出され、前記リンク先URLと共に、前記リンク元のURL_IDおよび当該
リンク元のURL_IDに関係付けた本文IDに対応付けられて、前記抽出結果リストメ
モリ23b(図3参照)に登録される(ステップA5,A6→A4)。
、例えば次のように実行される。
ebページLPの画面表示例を示す図である。
Pにて抽出した個別タイトルのリンクテキスト「首相、内閣支持率に注文」Ltxt1と同一
(あるいは類似)の見出しテキスト「首相、内閣支持率に注文」Mtxtを含んでいる“H
1”で括られるタグ要素が存在する。
トHtxtは、当該見出しテキスト「首相、内閣支持率に注文」Mtxtを含むタグ要素“H1
”以降のタグ要素“P”において、幾つもの読点を有する比較的長い文字列として記述さ
れている。
bページPから抽出した個別タイトルのリンクテキストLtxtに対応する本文テキストHt
xtを抽出するには、当該リンクテキストLtxtと同一(あるいは類似)の見出しテキスト
Mtxtを含んでいるタグ要素“H1”を検索し、これ以降のタグ要素“P”において、読
点を設定個数以上含み且つ設定数以上の文字数からなるテキストを抽出すればよい。
ebページPの各個別タイトル(リンクテキストLtxt1〜Ltxtm)に対応するリンク先W
ebページLP1〜LPmの本文テキストHtxt1〜Htxtmが抽出され、例えば図3で示した
ように、該当するURL_ID“1”の各本文ID“1−1”〜“1−m1”と対応付け
られて抽出結果リストメモリ23bに登録されると、変数yの値がインクリメントされて
“2”にセットされ(ステップA7)、前記ステップA2以降の処理が繰り返される(ス
テップA8(No)→A2)。
されたy(=2)番目のURLに対応するWebページPの各個別タイトル(リンクテキ
ストLtxt1〜Ltxtm)が抽出される。そして、次のステップA3〜A6の処理により、前
記抽出されたy番目(=2)のURLに対応するWebページPの各個別タイトル(リン
クテキストLtxt1〜Ltxtm)に対応するリンク先WebページLP1〜LPmの本文テキス
トHtxt1〜Htxtmが抽出され、前記図3で示したように、該当するURL_ID“2”の
各本文ID“2−1”〜“2−m2”と対応付けられて抽出結果リストメモリ23bに登
録される。
トメモリ23aに登録されたn(=x)個全てのURLに従い、前記ステップA2〜A6
の処理が繰り返されて抽出結果リスト(23b)が生成された後、ステップA7にてイン
クリメントされた変数yの値が変数x(=n)の値を上回ったと判断されると(ステップ
A8(Yes))、前記一連の表示対象テキスト取得処理が終了され、図9における類似
度判定処理(SB)へ移行される。
トである。
数yの値が何れも“1”に初期化される(ステップB1)。変数xは、前記抽出結果リス
トメモリ23bに登録されたURL_ID毎の各個別タイトル(リンクテキスト)に対応
する本文テキストを順番にカウントするための値であり、変数yは、前記URL登録リス
トメモリ23aに登録されたURL_IDを順番にカウントするための値である。
a(図2参照)に登録されたURLの総数が代入される(ステップB2)。
(図3参照)に登録されているy(=1)番目のURL_ID“1”に対応するところの
本文テキストの総数(m1)が代入される(ステップB3)。
る(ステップB4)。
maxの値に、前記抽出結果リストメモリ23b(図3参照)に登録されているm(=2)
番目のURL_ID“2”に対応するところの本文テキストの総数(m2)が代入される
(ステップB5)。
ID“1”に対応するところのx(=1)番目の本文テキストと、m(=2)番目のUR
L_ID“2”に対応するところのn(=1)番目の本文テキストとの類似度が求められ
(ステップB6)、当該類似度が予め設定された規定値(閾値)より高いか否か判断され
る(ステップB7)。
(ステップB7(No))、前記m(=2)番目のURL_ID“2”に対応した本文テ
キストを指定するための変数nの値がインクリメントされて“2”にセットされる(ステ
ップB8)。
本文テキストの総数nmax(=m2)を超えたか否か判断され(ステップB9)、未だ超
えないと判断されると(ステップB9(No))、前記抽出結果リストメモリ23bに登
録されているy(=1)番目のURL_ID“1”に対応するところのx(=1)番目の
本文テキストと、m(=2)番目のURL_ID“2”に対応するところのn(=2)番
目の本文テキストとの類似度が求められ(ステップB6)、当該類似度が予め設定された
規定値(閾値)より高いか否か判断される(ステップB7)。
リストメモリ23bに登録されているy(=1)番目のURL_ID“1”に対応すると
ころのx(=1)番目の本文テキストを基準とし、m(=2)番目のURL_ID“2”
に対応するところの各本文テキスト(n(=1)〜nmax(=m2))を比較対象にその
類似度が順次求められ、その都度、求められた類似度が規定値(閾値)より高いか否か判
断される。
RL_ID“1”に対応するところのx(=1)番目の本文テキストと、m(=2)番目
のURL_ID“2”に対応するところのn(=2)番目の本文テキストとの類似度が求
められた際に(ステップB6)、当該類似度が規定値(閾値)より高いと判定された場合
には(ステップB7(Yes))、前者y(=1)番目のURL_ID“1”に対応する
ところのx(=1)番目の個別タイトルおよび本文テキストに対応付けて要表示マークが
付加され、表示対象に設定される(ステップB10)。
2)番目の個別タイトルおよび本文テキストが前記抽出結果リストメモリ23bから削除
される(ステップB11)。
)、当該変数m(=3)は、前記URL登録リストメモリ23a(図2参照)に登録され
たURLの総数ymaxを超えたか否か判断される(ステップB13)。
)、変数nの値が“1”に初期化されると共に、変数nmaxの値に、前記抽出結果リスト
メモリ23b(図3参照)に登録されているm(=3)番目のURL_ID“3”に対応
するところの本文テキストの総数(m3)が代入される(ステップB5)。
ID“1”に対応するところのx(=1)番目の本文テキストと、m(=3)番目のUR
L_ID“3”に対応するところのn(=1)番目の本文テキストとの類似度が求められ
(ステップB6)、当該類似度が予め設定された規定値(閾値)より高いか否か判断され
る(ステップB7)。
のURL_ID“1”に対応するところのx(=1)番目の本文テキストを基準とし、m
(=3)番目のURL_ID“3”に対応するところの各本文テキスト(n(=1)〜nm
ax(=m3))を比較対象にその類似度が順次求められ、その都度、前記同様に求められ
た類似度が規定値(閾値)より高いか否か判断される(ステップB6〜B9)。
メモリ23bに登録されているy(=1)番目のURL_ID“1”に対応するところの
x(=1)番目の本文テキストを基準とし、URL_ID“2”〜URL_ID“n”まで
の全ての本文テキストを比較対象にした類似度判定処理が繰り返される。
)、基準側であるy番目のURL_IDに対応するところのx番目の個別タイトルおよび
本文テキストに対応付けて要表示マークが付加されると共に(ステップB10)、比較対
象側であるm番目のURL_IDに対応するところのn番目の個別タイトルおよび本文テ
キストが前記抽出結果リストメモリ23bから削除され(ステップB11)、その時点で
当該比較対象側のURL_IDを指定する変数mがインクリメントされる(ステップB1
2)。
ついて説明する。
(2つの文字列を、文字を追加・削除・入れ替えの操作を最小回数で同一にすることがで
きる数)を求める手法やTrigram(文字列を1文字ずつずらして3文字の並びにし
た時、どの程度の割合で一致する3文字があるか)を求める手法等、各種の手法が既に考
えられており、本実施形態ではこれらの手法を用いる。
が類似しているか否かを判定するための閾値は、チューニングパラメータであり、重要情
報の絞り込みを強めにしたいとかその逆である等、利用者の好みに応じて調整する。
RL_ID“1”に対応するところのx(=1)番目の本文テキストを基準としたURL_
ID“2”〜URL_ID“n”までの全ての本文テキストを比較対象にした類似度判定
処理が実行され、ステップB12においてインクリメントされた変数mの値が、ステップ
B13において前記URL登録リストメモリ23a(図2参照)に登録されたURLの総
数ymaxを超えたと判断されると(ステップB13(Yes))、前記変数xの値がイン
クリメントされて“2”にセットされる(ステップB14)。
リストメモリ23b(図3参照)に登録されているy(=1)番目のURL_ID“1”
に対応するところの本文テキストの総数(m1)を超えたか否か判断される(ステップB
15)。
と判断されると(ステップB15(No))、前記ステップB4からの処理に戻り、前記
変数mの値に、再び前記変数y+1(=2)が代入される。
のURL_ID“1”に対応するところのx(=2)番目の本文テキストを基準とし、U
RL_ID“2”〜URL_ID“n”までの全ての本文テキストを比較対象にした類似度
判定処理が繰り返される。
のURL_ID“1”に対応するところの各本文テキストを順番に指定する変数xの値が
インクリメントされながら、URL_ID“2”〜URL_ID“n”までの全ての本文テ
キストを比較対象にした類似度判定処理が繰り返される。
値、つまり前記抽出結果リストメモリ23b(図3参照)に登録されているy(=1)番
目のURL_ID“1”に対応するところの本文テキストの総数(m1)を超えたと判断
されると(ステップB15(Yes))、前記類似度判定の基準側のURL_IDを指定
するための変数yの値がインクリメントされて“2”にセットされる(ステップB16)
。
録リストメモリ23a(図2参照)に登録されたURLの総数を超えたか否か判断される
(ステップB17)。
と判断されると(ステップB17(No))、前記変数xの値が“1”に初期化される(
ステップB18)。
ストメモリ23b(図3参照)に登録されているy(=2)番目のURL_ID“2”に
対応するところの本文テキストの総数(m2)が代入される。
のURL_ID“2”に対応するところのx(=1)番目の本文テキストを基準とし、U
RL_ID“3”〜URL_ID“n”までの全ての本文テキストを比較対象にした類似度
判定処理が繰り返される。
のURL_ID“2”に対応するところの各本文テキストを順番に指定する変数xの値が
インクリメントされながら、URL_ID“3”〜URL_ID“n”までの全ての本文テ
キストを比較対象にした類似度判定処理が繰り返される。
準側のURL_IDを順番に指定する変数yの値がインクリメントされながら、当該イン
クリメントされたy番目のURL_IDに対応するところの各本文テキストの1つずつを
基準に、m(=y+1)番目からymaxまでのURL_IDに対応するところの各本文テキ
ストを比較対象にした類似度判定処理が繰り返される。
maxの値、つまり前記URL登録リストメモリ23a(図2参照)に登録されたURLの
総数を超えたと判断されると(ステップB17(Yes))、前記一連の類似度判定処理
が終了され、図10における表示処理(SC)へ移行される。
当該URL_IDが小さい方の本文テキストを基準に他のURL_IDに対応付けられた本
文テキストとの類似度が総当たりに順番に判定される。そして、この類似度判定に際して
、類似度が規定値(閾値)より高いと判定された本文テキストについては、URL_ID
が小さい方の本文テキストに対応付けて要表示マークが付加されると共に、もう一方の本
文テキストが削除される。
いかなるテキストと比較しても(NULLテキスト同士の比較も含め)類似度は0%になる。
該URL_IDが小さい方の本文テキストを基準に他のURL_IDに対応付けられた本文
テキストとの類似度を総当たりに順番に判定するとしても、この処理が進むほど、類似度
が規定値より高いと判定されてその一方が削除される本文テキストが増えるので、当該処
理に伴う負荷は次第に軽くなる。
ある。
を示す図である。
る抽出結果リストにおいて、要表示マークが付加されている表示対象の項目があるか否か
判断される(ステップC1)。
項目があると判断されると(ステップC1(Yes))、フレームバッファFBに現在描
画されている表示画面データがクリアされる(ステップC2)。
されている個別タイトル(リンクテキスト)が読み出され(ステップC3)、前記フレー
ムバッファFBに表示画面データとして描画される(ステップC4)。
部27には、前記抽出結果リスト(23b)において要表示マークが付加された項目の個
別タイトル(リンクテキスト)を一覧にした重要情報一覧ウインドウWが表示される。
ユーザ操作に応じてユーザ所望の個別タイトル「首相、内閣支持率に注文」にフォーカス
fを合わせると、当該フォーカスfを合わせた個別タイトルに対応付けられて前記抽出結
果リスト(23b)に記憶されている本文テキスト「◇◇政権発足を受け、○○新聞社が
行った…」が読み出され、ポップアップウインドウWpとして表示されるようになる。
る類似度判定処理(ステップSB)、前記図10における表示処理(ステップSC)は、
予め設定された一定時間T1毎に繰り返し実行され(ステップSD,SE→SA)、常に
最新の情報に更新される。
要情報取得表示機能によれば、URL登録リストメモリ23aに予め登録したユーザ所望
の各情報サイトのURLにアクセスされ、当該各URLに対応するWebページに記述さ
れている個別タイトル(リンクテキスト)が抽出される。またこれに伴い各個別タイトル
(リンクテキスト)のリンク先URLにアクセスされ、当該各リンク先URLに対応する
Webページに記述された本文テキストが抽出される。そして、前記各登録URLのID
に対応付けて前記抽出された個別タイトル(リンクテキスト)、リンク先URL、本文テ
キストが抽出結果リストメモリ23bに記憶される。すると、前記抽出結果リスト(23
b)に記憶された各URL_IDの相互間で本文テキストの類似度が求められ、当該類似
度の高い本文テキストに対応する個別タイトルだけ、重要情報一覧ウインドウWにして表
示部27に表示される。そしてウインドウ表示された所望の個別タイトルにフォーカスf
を合わせると、当該所望の個別タイトルに対応する本文テキストが読み出されてポップア
ップウインドウWpにして表示される。
、ユーザにとって重要である確率の高い情報のみを抽出して表示させることができる。
取得表示機能によれば、前記抽出結果リストメモリ23bにおいて、類似度が高いと判定
された一方の本文テキストが要表示マークを付加した表示対象に設定され、もう一方の本
文テキストは削除される。このため、類似度の高い本文テキストが重複して表示対象に設
定されることがない。
報取得表示機能によれば、前記登録URLに対応するWebページからの個別タイトル(
リンクテキスト)の抽出処理、抽出された個別タイトルのリンク先URLに対応するWe
bページからの本文テキストの抽出処理、各登録URL相互間での個別タイトルに対応す
るリンク先本文テキストの類似度判定処理、類似度が高いと判定された本文テキストとそ
の個別タイトルを表示対象に設定する処理は、一定時間T1毎に繰り返し実行される。こ
のため、ユーザにとって重要である確率の高い情報のみを、常に最新の状態で抽出して表
示させることができる。
の手法、すなわち、図6のフローチャートに示す重要情報取得表示処理、図7のフローチ
ャートに示す同重要情報取得表示処理に伴う表示対象テキスト取得処理(SA)、図9の
フローチャートに示す同重要情報取得表示処理に伴う類似度判定処理(SB)、図10の
フローチャートに示す同重要情報取得表示処理に伴う表示処理(SC)などの各手法は、
何れもコンピュータに実行させることができるプログラムとして、メモリカード(ROM
カード、RAMカード等)、磁気ディスク(フロッピディスク、ハードディスク等)、光
ディスク(CD−ROM、DVD等)、半導体メモリ等の外部記憶媒体(記録媒体)24
に格納して配布することができる。そして、情報端末装置20のコンピュータ(CPU2
1)は、この外部記憶媒体(記録媒体)24に記憶されたプログラムを記憶装置(23)
に読み込み、この読み込んだプログラムによって動作が制御されることにより、前記実施
形態において説明した重要情報取得表示機能を実現し、前述した手法による同様の処理を
実行することができる。
して通信ネットワーク(N)上を伝送させることができ、この通信ネットワーク(N)に
接続されたコンピュータ装置(プログラムサーバ)から前記のプログラムデータを取り込
んで記憶装置(23)に記憶させ、前述した重要情報取得表示機能を実現することもでき
る。
逸脱しない範囲で種々に変形することが可能である。さらに、前記実施形態には種々の段
階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種
々の発明が抽出され得る。例えば、実施形態に示される全構成要件から幾つかの構成要件
が削除されたり、幾つかの構成要件が異なる形態にして組み合わされても、発明が解決し
ようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得
られる場合には、この構成要件が削除されたり組み合わされた構成が発明として抽出され
得るものである。
20 …情報端末装置
21 …CPU
22 …バス
23 …記憶部
23a…URL登録リストメモリ
23b…抽出結果リストメモリ
FB …フレームバッファ
24 …外部記憶媒体
25 …記憶媒体読み書き部
26 …入力部
27 …表示部
28 …送受信部
N …通信ネットワーク
P …Webページ
Phtm…WebページのHTMLソース
LP …リンク先Webページ
Ltxt…リンクテキスト
Mtxt…見出しテキスト
Htxt…本文テキスト
W …重要情報一覧ウインドウ
f …フォーカス
Wp …ポップアップウインドウ
Claims (4)
- 情報元として利用する情報サイトのURLをアクセス頻度に基づいて予め複数記憶する
URL記憶手段と、
このURL記憶手段により複数記憶されたURLで指定される情報サイトのページを取
得し、当該ページ内の見出し情報をそれぞれ抽出する見出し情報抽出手段と、
この見出し情報抽出手段により抽出された見出し情報に対応する本文をそれぞれ抽出す
る本文抽出手段と、
この本文抽出手段により抽出されたアクセス頻度の高い本文テキストとアクセス頻度の
低い本文テキストの類似度を判定し、当該類似度が予め設定された値よりも高いと判定さ
れた本文を表示対象に設定する表示対象設定手段と、
この表示対象設定手段により表示対象に設定された本文を表示部に表示させる表示制御
手段と、
を備えたことを特徴とする情報表示装置。 - 前記見出し情報抽出手段により前記記憶されたURLで指定される情報サイトのページ
から抽出された見出し情報に対応して前記本文抽出手段により抽出された本文を、該当す
る前記情報サイトの識別情報に対応付けて記憶する抽出情報記憶手段を備え、
前記表示対象設定手段は、
前記抽出情報記憶手段により記憶された各本文の類似度を異なる情報サイト相互の本文
同士で総当たりに判定する類似度判定手段を有し、
前記抽出情報記憶手段により記憶された各本文について、前記類似度判定手段により類
似度が予め設定された値よりも高いと判定された一方の本文を表示対象に設定し、もう一
方の本文を削除する、
ことを特徴とする請求項1に記載の情報表示装置。 - 前記見出し情報抽出手段による見出し情報の抽出処理と、前記本文抽出手段による本文
の抽出処理と、前記表示対象設定手段による表示対象の設定処理と、前記表示制御手段に
よる本文の表示処理とを、予め設定された一定時間毎に繰り返し実行する繰り返し制御手
段を備えたことを特徴とする請求項1または請求項2に記載の情報表示装置。 - 電子機器のコンピュータを制御するためのプログラムであって、
前記コンピュータを、
情報元として利用する情報サイトのURLをアクセス頻度に基づいて予めメモリに複数
記憶させるURL記憶手段、
このURL記憶手段により複数記憶されたURLで指定される情報サイトのページを取
得し、当該ページ内の見出し情報をそれぞれ抽出する見出し情報抽出手段、
この見出し情報抽出手段により抽出された見出し情報に対応する本文をそれぞれ抽出す
る本文抽出手段、
この本文抽出手段により抽出されたアクセス頻度の高い本文のテキストとアクセス頻度
の低い本文テキスト類似度を判定し、当該類似度が予め設定された値よりも高いと判定さ
れた本文を表示対象に設定する表示対象設定手段、
この表示対象設定手段により表示対象に設定された本文を表示部に表示させる表示制御
手段、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015003982A JP2015092398A (ja) | 2015-01-13 | 2015-01-13 | 情報表示制御装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015003982A JP2015092398A (ja) | 2015-01-13 | 2015-01-13 | 情報表示制御装置およびプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010012220A Division JP5682113B2 (ja) | 2010-01-22 | 2010-01-22 | 情報表示装置およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015092398A true JP2015092398A (ja) | 2015-05-14 |
Family
ID=53195492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015003982A Pending JP2015092398A (ja) | 2015-01-13 | 2015-01-13 | 情報表示制御装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015092398A (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003044510A (ja) * | 2001-07-26 | 2003-02-14 | Matsushita Electric Ind Co Ltd | ゲートウェイ装置 |
JP2009500764A (ja) * | 2005-07-15 | 2009-01-08 | チョンヌン インコーポレイテッド | 情報価値を反映した情報検索方法及びその装置 |
JP2009042908A (ja) * | 2007-08-07 | 2009-02-26 | Nec Corp | ニュース記事抽出装置、ニュース記事リンク特定方法およびニュース記事抽出用プログラム |
-
2015
- 2015-01-13 JP JP2015003982A patent/JP2015092398A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003044510A (ja) * | 2001-07-26 | 2003-02-14 | Matsushita Electric Ind Co Ltd | ゲートウェイ装置 |
JP2009500764A (ja) * | 2005-07-15 | 2009-01-08 | チョンヌン インコーポレイテッド | 情報価値を反映した情報検索方法及びその装置 |
JP2009042908A (ja) * | 2007-08-07 | 2009-02-26 | Nec Corp | ニュース記事抽出装置、ニュース記事リンク特定方法およびニュース記事抽出用プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10796076B2 (en) | Method and system for providing suggested tags associated with a target web page for manipulation by a useroptimal rendering engine | |
US10515142B2 (en) | Method and apparatus for extracting webpage information | |
US9524353B2 (en) | Method and system for providing portions of information content to a client device | |
US7890852B2 (en) | Rich text handling for a web application | |
US8347225B2 (en) | System and method for selectively displaying web page elements | |
US8204950B2 (en) | Webpage search | |
US20150067476A1 (en) | Title and body extraction from web page | |
US20020016801A1 (en) | Adaptive profile-based mobile document integration | |
US20070094243A1 (en) | System and method of searching for previously visited website information | |
JP2014029701A (ja) | モバイル装置のための文書処理 | |
JP2006065395A (ja) | ハイパーリンク生成装置、ハイパーリンク生成方法及びハイパーリンク生成プログラム | |
TW200821867A (en) | Program, character input editing method, and apparatus | |
WO2013078829A1 (zh) | 一种基于内容块标识处理网页内容的方法与设备 | |
JP5109759B2 (ja) | 情報処理装置およびその制御プログラム | |
KR20040034861A (ko) | 무선 단말기에서의 웹 컨텐츠 변환을 위한 인덱스 추출시스템 및 그 방법 | |
JP5682113B2 (ja) | 情報表示装置およびプログラム | |
JP5338298B2 (ja) | ページ閲覧装置およびプログラム | |
JP2015092398A (ja) | 情報表示制御装置およびプログラム | |
JP2010134780A (ja) | 情報処理装置およびその制御プログラム | |
JP2019086931A (ja) | 情報処理装置およびコンピュータプログラム | |
JP2008197787A (ja) | Webコンテンツ提供装置、Webコンテンツ提供方法およびプログラム | |
JP5939711B2 (ja) | 情報処理装置およびその制御プログラム | |
US20030212959A1 (en) | System and method for processing Web documents | |
JP5729428B2 (ja) | ページ表示装置およびプログラム | |
US20090327233A1 (en) | Method of selecting objects in web pages |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150209 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160119 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160317 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160802 |