JP2002189917A - 情報処理装置、ネットワークデータ評価方法、並びにその評価方法を実行させるためのプログラムを記録した記録媒体 - Google Patents

情報処理装置、ネットワークデータ評価方法、並びにその評価方法を実行させるためのプログラムを記録した記録媒体

Info

Publication number
JP2002189917A
JP2002189917A JP2000387154A JP2000387154A JP2002189917A JP 2002189917 A JP2002189917 A JP 2002189917A JP 2000387154 A JP2000387154 A JP 2000387154A JP 2000387154 A JP2000387154 A JP 2000387154A JP 2002189917 A JP2002189917 A JP 2002189917A
Authority
JP
Japan
Prior art keywords
information
network
evaluation
data
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000387154A
Other languages
English (en)
Inventor
Takayuki Tamura
孝之 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2000387154A priority Critical patent/JP2002189917A/ja
Publication of JP2002189917A publication Critical patent/JP2002189917A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】 ウェブサイト等の情報配信手段の
質の評価を行うこと。 【解決手段】 ネットワーク4を介してこのネッ
トワーク4に接続された複数の情報配信手段から表示情
報を取得する自動アクセス手段5と、この情報取得手段
5が取得した表示情報のフォーマット記述に基づいて複
数の情報配信手段のそれぞれの表示情報の品質を評価
し、評価結果をネットワーク4へ出力するランク計算手
段及びランク表示手段9と、を備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ネットワーク上
のデータを評価する情報処理装置、その評価方法、並び
にその評価方法をプログラムとして記録した記録媒体に
関する。
【0002】
【従来の技術】WWW(ワールド・ワイド・ウェブ)は
HTTP(Hyper Text Transfer
Protocol)、FTP(File Transf
erProtocol)に代表されるコンピュータ・ネ
ットワーク上のデータ転送プロトコルやHTML(Hy
per Text Markup Languag
e)、XML(eXtensible Markup
Language)に代表されるデータ記述言語などの
種々の標準規格に基づき、サービス提供者側のWWWサ
ーバがサービス利用者側のWWWブラウザとは全く独立
に構築されるオープンなシステムである。そのため、W
WWサーバやWWWブラウザの独自拡張機能や規格自体
の変化が原因で、使用するWWWブラウザによっては意
図した内容が表示されない、動作が異なる、あるいは動
作異常を起こす、などの現象がしばしば発生する。ま
た、WWWの特徴として他の情報メディアと比べて情報
の新鮮度が高いことが挙げられ、WWWサイト内での情
報の配置は頻繁に変更され得る。そのため、過去に訪問
した際のURL(Uniform Resource
Locator)が無効になっていたり、ウェブページ
間のリンクが(一時的あるいは恒久的に)切れていたり
する現象が発生し、必要とする情報がどこで得られるか
を把握するのは非常に困難である。
【0003】従来はWWWのエンターテインメント的な
側面が重視されてきたため、上記の問題点は軽視される
傾向にあり、利用者側が使用するWWWブラウザやオペ
レーティングシステムの変更を余儀なくされるなどの不
便を強いられてきた。しかし、電子商取引のプラットフ
ォームとしてWWWが利用されるようになると、利用者
は単なる匿名の個人ではなく企業/個人顧客となるた
め、前記のような不具合は重大な機会損失につながると
考えられる。
【0004】顧客としての立場からは、取引先WWWサ
イトの自システムとの相互運用性、応答性、整合性(リ
ンク切れがないなど)、安全性(セキュリティ)等が重
要になり、これらの要素が取引先の選定に大きく影響を
及ぼすようになることが予想される。しかし、これらの
内でセキュリティ評価・認証がIPA(情報処理振興事
業協会)等で行われているものの、電子商取引の観点か
ら上記の基準でWWWサイトを総合的かつ客観的に評価
し格付けする第三者機関は存在していない。そのため、
顧客側に取っては事前に優良なWWWサイトを運営する
取引先を判断するための基準がなく、サービス提供者側
に取っては自社WWWサイトの品質を客観的にアピール
する手段がないのが現状である。
【0005】現在のWWWにおいては、複数のWWWサ
イトの「内容]に関する情報を提供するディレクトリサ
ービスや検索サービスは存在するものの、相互運用性、
応答性、整合性などの観点からWWWサイトの「質」に
関する情報を提供するサービスは存在していない。その
ため、利用者が実際にアクセスしてみない限り、特定の
サイトが電子商取引における取引先として好ましいかど
うかを判断するための情報を得ることができない。一
方、各WWWサイトを運営する企業等に取っても同業他
社に対してWWWサイトの品質で差別化を図る手段がな
く、WWWサイトの維持運営に対する直接的な投資効果
が分かりにくくなってしまう。
【0006】
【発明が解決しようとする課題】上述のような従来のイ
ンターネットサービスでは、WWWサイトから実際にデ
ータをダウンロードし、全てのデータを開くまでそのウ
ェブサイトの質を知ることが困難という問題があった。
また、インターネットの利用者は、インターネット上の
ホームページ検索サービスを用いて、目的のコンテンツ
を有するホームページをキーワードによって検索するこ
とができる。しかし、これらの検索サービスもそのホー
ムページのタイトル、文書に設定されたキーワード、文
書の内容の中から利用者が入力したキーワードを検索し
て目的のホームページを抽出し、そのキーワードの適合
度を表示するのみで、ウェブサイトの質については、上
述同様に開いて見るまで知ることができないという問題
があった。
【0007】この発明は上記のような課題を解決するた
めになされたもので、ネットワーク上に接続された情報
配信手段の評価を容易に取得できる情報処理装置、デー
タ評価方法、並びに、その記録媒体を提供することを目
的とする。
【0008】
【課題を解決するための手段】この発明にかかる情報処
理装置においては、ネットワークを介してこのネットワ
ークに接続された複数の情報配信手段から表示情報を取
得する情報取得手段と、この情報取得手段が取得した表
示情報のフォーマット記述に基づいて上記複数の情報配
信手段のそれぞれの表示情報の品質を評価し、評価結果
を上記ネットワークへ出力する評価手段と、を備えたも
のである。
【0009】また、上記評価手段は、上記フォーマット
記述とフォーマット規格との整合度を評価するものであ
る。
【0010】また、上記評価手段は、上記フォーマット
記述内のリンク情報と実際のリンクとの不整合度を評価
するものである。
【0011】また、ネットワークを介してこのネットワ
ークに接続された複数の情報配信手段から表示情報を取
得する情報取得手段と、この情報取得手段が取得した表
示情報のフォーマット記述に基づいて上記複数の情報配
信手段それぞれのコンテンツの充実度を評価し、評価結
果を上記ネットワークへ出力する評価手段と、を備えた
ものである。
【0012】また、ネットワークを介してこのネットワ
ークに接続された複数の情報配信手段から表示情報を取
得する情報取得手段と、この情報取得手段が取得した表
示情報のフォーマット記述に基づいて上記複数の情報配
信手段それぞれが提供するコンテンツとこのコンテンツ
を表示する端末との適合度を評価し、評価結果を上記ネ
ットワークへ出力する評価手段と、を備えたものであ
る。
【0013】また、上記複数の情報配信手段はウェブサ
イトであり、上記フォーマット記述は、タグ情報である
ことを特徴とするものである。
【0014】また、上記ネットワークを介して順位付け
の基準を受け取り、この基準に基づいて上記評価結果を
ソートするソート手段を備え、上記評価手段は、そのソ
ート手段がソートした評価結果を上記ネットワークへ出
力するものである。
【0015】また、上記評価手段は、1つの表示情報に
対して複数の評価基準で評価して複数の評価結果を算出
し、上記ソート手段は、上記複数の評価結果それぞれに
重み付けを行い、この重み付けに基づいた上記情報配信
手段の総合ランクを決定するものである。
【0016】また、不特定利用者に開示可能なウェブサ
イトの一覧と、利用者毎に開示可能なウェブサイトの一
覧とを格納した表示制御テーブルを備え、上記評価手段
は、利用者毎にデータの出力制限を行うことを特徴とす
るものである。
【0017】この発明にかかるネットワークデータ評価
方法は、ネットワークに接続された情報処理装置が複数
のウェブサイトにアクセスし、それぞれのウェブサイト
から文書データを取得するデータ取得ステップと、上記
情報処理装置がこのデータ取得ステップで取得した文書
データと文書規格との適合度を評価する評価ステップ
と、上記ネットワークを介して、複数の要求を受け付け
るステップと、上記複数の要求それぞれに対応して、上
記情報処理装置が上記適合度を上記ネットワークを介し
て出力する出力ステップと、を備えたものである。
【0018】また、ネットワークに接続された情報処理
装置が複数のウェブサイトにアクセスし、それぞれのウ
ェブサイトからハイパーテキストを取得するデータ取得
ステップと、上記ネットワークをアクセスし、上記デー
タ取得ステップで取得したハイパーテキスト内のリンク
情報と上記ネットワーク上の実際のデータとの整合度を
評価する評価ステップと、上記ネットワークを介して、
複数の要求を受け付けるステップと、上記複数の要求そ
れぞれに対応して、上記情報処理装置が上記整合度を上
記ネットワークを介して出力する出力ステップと、を備
えたものである。
【0019】ネットワークに接続された情報処理装置が
複数のウェブサイトにアクセスし、それぞれのウェブサ
イトからデータファイルを取得するデータ取得ステップ
と、上記情報処理装置が上記データファイルのファイル
名のファイル種別の記載が上記データファイルの中身と
一致しているかを評価する評価ステップと、上記情報処
理装置が評価結果を出力する出力ステップと、を備えた
ものである。
【0020】この発明にかかるコンピュータ読取り可能
な記録媒体は、上述のネットワークデータ評価方法を実
行させるためのプログラムを記録したものである。
【0021】
【発明の実施の形態】実施の形態1.図1はこの発明が
適用されるWWWサイト自動格付けシステムを示すブロ
ック図である。図1において1はインターネット4に接
続されたコンピュータシステム、2はHTMLやXML
等の表示情報を配信するWWWサーバ、3はインターネ
ット4を介してコンピュータシステム1又はWWWサー
バ2にアクセスする利用者端末、4はインターネットで
ある。利用者は利用者端末3を介してコンピュータシス
テム1にアクセスし、WWWサーバ毎に順位付けした値
を表示させたり、WWWサーバ名を指定して格付けの値
を表示させたりすることができる。ここで、WWWサイ
ト2はWWWサーバ上に構成されており、複数のWWW
サイト2が1つのWWWサーバ上に構成されていていて
もかまわない。
【0022】図2はコンピュータシステム1の内部を詳
細に示すブロック図である。図2において、図1と同一
の符号は同一又は相当の部分を表わしている。5はWW
Wサーバにアクセスしてウェブページを自動収集する自
動アクセス手段、6は自動アクセス手段5により収集さ
れたウェブページのデータやデータを取得する際の経過
時間、発生したエラーなどを記憶するためのデータ格納
手段、7はデータ格納手段6に格納されたデータを読み
出してWWWサイト2の格付けを計算するランク計算手
段、8はランク計算結果を記憶するための結果格納手
段、9はランク計算結果を利用者端末3に表示するため
のランク表示手段である。自動アクセス手段5、ランク
計算手段7、およびランク表示手段9はコンピュータシ
ステム1上で実行されるプログラムとして実現される。
また、データ格納手段6および結果格納手段8はハード
ディスク装置などの外部記憶装置を用いて実現される。
【0023】また、51は自動アクセス手段5が取得す
べきURLを列挙する取得要求リストであり、例えばコ
ンピュータシステム1の主記憶装置上に実現することが
できる。52は現在時刻を取得するためのリアルタイム
クロック装置であるが、一般的なコンピュータシステム
1が備えるものを利用することができる。71はランク
計算手段7が格付けを決定する際に参照するランク定義
テーブルであり、例えばコンピュータシステム1のハー
ドディスク装置に格納される。91はランク表示手段9
がインターネット4からランク表示要求を受付けた際
に、要求元の利用者の属性やWWWサイト2の属性に応
じて表示内容に制限を加えるための表示制御データであ
り、表示制御テーブルとしてハードディスク装置に格納
される。
【0024】図3は自動アクセス手段5の動作を示すフ
ローチャートである。始めにステップS2−1において
格付け対象WWWサイト2のURLを取得要求リスト5
1に挿入する。次いでステップS2−2において取得要
求リスト51にURLが含まれるかどうかを調べ、含ま
れていないなら処理を終了する。取得要求リスト51に
URLが含まれてる場合にはステップS2−3に進み、
取得要求リスト51からURLを一つ取り出す。ステッ
プS2−4において、リアルタイムクロック装置52か
ら現在時刻を取得し、URL取得開始時刻として記憶す
る。ステップS2−5において、取り出したURLが存
在するWWWサーバ2に対してHTTPのGET要求を
発行する。ステップS2−6において結果を調べ、GE
T要求が成功した場合には、ステップS2−7にてUR
Lに対応する文書データと文書データの最終更新時刻が
WWWサーバにより通知された場合にはその時刻を取得
する。さらにステップS2−8において、取得した文書
データがHTMLやXMLなどのハイパーテキストとし
て記述されていた場合は、文書データからリンクを抽出
し、リンクのURLが元のWWWサイト2または別の格
付け対象WWWサイト2に含まれる場合には、そのUR
Lを取得要求リスト51に追加し、ステップS2−9に
進む。
【0025】ここで、リンクの抽出は、ハイパーテキス
トの記述言語からリンク箇所を表わすフォーマット記述
に基づいて、抽出する。すなわち、文書データが例えば
HTMLで記載されている場合には、「<a href
="URL">」 「</a>」のように、通常画面上に
直接表示されないフォーマットに関する情報が含まれて
いるため、この記述からリンクのURLを抽出する。
【0026】GET要求が失敗した場合には、ステップ
S2−11においてエラーの種別を取得し、ステップS
2−9に進む。ステップS2−9において、リアルタイ
ムクロック装置52から現在時刻を取得し、URL取得
完了時刻として記憶する。次にステップS2−10にお
いて、現在のURLに関して記憶しておいた情報をデー
タ格納手段6により記憶する。
【0027】図4はデータ格納手段6により記憶される
URL情報の形式を示す。URL管理レコード6−1は
各URLにつき1件ずつ存在し、URL名、取得開始時
刻、取得完了時刻、ステータス、取得が成功し文書デー
タの最終更新時刻が判明した場合はその値、および取得
が成功した場合の文書データ長(バイト数)から構成さ
れる。また、URL文書データ6−2は、取得した文書
データを連結してディスク装置上のファイルに格納す
る。
【0028】図5はランク計算手段7の動作を示すフロ
ーチャートである。ステップS5−1においてWWWサ
イト2毎に要求したURL数と発生したエラーの数の比
からエラー発生率を計算する。次にステップS5−2に
おいてWWWサイト2毎に取得開始時刻と取得完了時刻
との差、すなわち応答時間の平均値を求める。ステップ
S5−3において、HTMLやXMLなどのハイパーテ
キスト文書データに対して文法チェックを行い、文法に
違反している箇所や特定ブラウザの拡張構文に依存した
部分を含む文書数の全体に対する割合をWWWサイト2
毎に求め、文書規格の不適合率とする。ここで、文法チ
ェックは、ウェブブラウザ、文書変換ソフトウェア、コ
ンパイラ等で使用されている公知の文法チェック技術を
適用して実施することができる。次に、ステップS5−
4において、文書データに含まれるリンクでリンク先が
同一WWWサイト2を指すものの内、リンク先URLに
対するアクセスが失敗したものの割合をWWWサイト2
毎に求め、リンク不整合率とする。この実施例では他の
WWWサーバに対するリンクは計算に入れず、同一WW
Wサーバ上のページ間のリンクを対象とする。また、ス
テップS5−5において、文書データの最終更新時刻が
判明しているものについて、取得完了時刻との差の平均
値をWWWサイト2毎に求め、平均文書更新間隔とす
る。
【0029】ステップS5−6において、ランク定義テ
ーブル71を参照し、上記の項目別計算値を項目別ラン
クに換算する。図6にランク定義テーブル71の構造を
示す。ここで参照するのはランク境界値テーブル71−
1であり、各項目の計算値とテーブルの値とを比較し、
計算値がテーブルの値を下回る部分のランク値を用い
る。ただし、計算値がテーブルのどの値よりも大きい場
合には、ランク値を1とする。この実施例ではランクを
5段階とし、大きな値が優れたランクを表すものとして
いる。次にステップS5−7において項目別のランク値
それぞれを、図6に示す項目別重みテーブル71−2の
値で重み付けして加算した値を求め、WWWサイト2の
総合ランクとする。
【0030】図7は結果格納手段8に記憶されるデータ
の形式である。WWWサーバ名、総合ランク値、エラー
発生率、平均応答時間、文書規格不適合率、リンク不整
合率、文書更新間隔、を格納する。ここで、エラー発生
率、平均応答時間、文書規格不適合率、リンク不整合
率、文書更新間隔の各ランク値を追加して記憶しても良
い。また、結果格納手段8はランク計算手段7で計算さ
れた評価結果を記憶するため、後述する(1)〜(8)
のような評価基準によって計算された評価結果等も記憶
される。
【0031】図8にランク表示手段9による表示例を示
す。要約表示画面10−1は結果格納手段8に記憶され
た図7のデータに基づいてランク表示手段9が作成し、
インターネット4に送信される。そして、利用者端末3
のWWWブラウザ上に表示される。この要約表示画面1
0−1により、各WWWサイト2に対するランク付けの
結果を要約し、上位のサイトを示すと共に、利用者が特
定WWWサイト名を指定するためのインタフェースを提
供する。要約表示画面10−1において利用者がWWW
サイト名を指定した場合や、上位サイトの表示に含まれ
る「詳細」リンクをクリックした場合には、ランク表示
手段9は結果格納手段8に記憶されたデータに基づい
て、詳細評価表示画面10−2をWWWブラウザ上に表
示させる。この画面では、特定サイトの総合ランク値、
項目別の評価値およびランク値が表示される。
【0032】図9にランク表示手段9が参照する表示制
御テーブル91の構造を示す。サーバ属性テーブル91
−1はWWWサーバ毎に一般利用者への開示が許される
かどうかを示したものであり、ランク表示手段9は、要
約表示画面10−1の上位サイトを表示する際には一般
公開可となっているWWWサーバだけを表示する。ま
た、利用者属性テーブル91−2は利用者毎に追加で表
示可能なWWWサーバ名を列挙したものであり、サーバ
属性テーブル91−1で一般公開不可となっているWW
Wサーバに対する表示を利用者毎に制御する。
【0033】図10は、このランク表示手段9の動作を
示すフローチャートである。インターネット4を介し
て、利用者端末3からアクセス要求を受け付けると、ス
テップS10−1で、結果格納手段8から図7のランク
データを読取り、予め定められた項目のランクに基づい
て、ソートをおこなう。ここでは、総合ランクの項目に
基づいてソートを行うこととする。続いて、ステップS
10−2で表示制御テーブル91を参照し、ソートされ
たサイトのうちの上位のサイトから順番に1つを選び、
当該サイトのサーバが一般公開可としてサーバ属性テー
ブル91−1に指定されているか否かを判断する。公開
可の場合には、ステップS10−3で当該サイトをコン
ピュータシステム1の主記憶装置に記憶された表示リス
トに追加する。次に、ステップS10−4に進み、全て
のサイトについて上述の処理を終了したかを判断する。
終了していない場合には、ステップS10−2に戻り同
様の処理を繰り返す。終了した場合には、ステップS1
0−5に進む。なお、ここで、表示するサイトの数が予
め定められている場合には、表示リスト内のサイト数が
この数に達した時点でステップS10−5に進むように
してもよい。
【0034】一方、ステップS10−2で一般公開不可
と判断された場合には、ステップS10−7に進み、利
用者属性テーブル91−2を参照して、アクセス要求を
してきた利用者が当該サーバにアクセスすることが許可
されているか否か、すなわち、利用者属性テーブル91
−2に指定されているか否かを判断する。ここで、利用
者に関する情報は、利用者がコンピュータシステム1に
アクセスしてきたときのログイン情報又はクッキーを用
いて判別することができる。許可されていると判断され
た場合には、ステップS10−3で当該サイトを表示リ
ストに追加する。許可されていない場合には、ステップ
S10−3の処理を飛ばしステップS10−4に進み、
他のサイトに関する処理に移る。以上のようにすること
で、アクセスが許可されている登録者のみにサイトの情
報を提供することができる。
【0035】ステップS10−4で、全てのサイトに関
する処理が終了したと判断された場合には、ステップS
10−5に移り、作成された表示リストから上位ランク
のサイトを抽出する。次に、ステップS10−6で抽出
したサイトの情報に基づき、図8に示すような表示画面
を作成し、アクセス要求を送信したユーザに対して、表
示画面のデータを送信する。
【0036】以上は、1人の利用者に対する処理を説明
したが、複数の利用者からアクセス要求があった場合に
は、図10に示す処理を利用者毎に実行すれば複数のア
クセス要求に対応することができる。上述の説明では、
ステップS10−1で総合ランクを基準にソートを行っ
たが、他の項目、例えば、図8の詳細評価表示画面に示
したエラー率、文書規格不適合率等を基準にソートを行
ってもよい。ここで、利用者からの指定に従ってどの項
目を基準にソートするかを指定するようにすることもで
きる。
【0037】以上のように、この実施の形態の情報処理
装置では、従来の検索エンジンと同様にして格付け対象
サイトからウェブページを自動的に収集し、その際にペ
ージの取得にかかった時間や発生したエラーなどの統計
値から応答性や整合性の評価を、取得したウェブページ
のHTML/XML規格への準拠度から相互運用性の評
価をそれぞれ行なうことで総合的なWWWサイト2の格
付けを決定し、その結果を一般あるいは契約ユーザに提
供することを可能にする。
【0038】なお、表示情報の品質、充実度、又は使用
環境との整合性の基準は以上に説明したものに限らず、
表示情報のフォーマット記述を利用した様々な基準を使
用することができる。例えば、下記のような基準を使う
ことができる。 (1)ダウンロードファイルの内容とその表示情報のフ
ァイルの拡張子が一致するか否かを基準とし、サイト全
体の一致度をランク付けする。例えば、以下の式を用い
て一致度を計算することができる。 (一致度)=(不一致のファイル数)/(サイト全体の
ファイル数) ファイルの内容と拡張子が一致しているか否かは、例え
ば、ファイル内の特定箇所に記載されているデータ種別
の記述からファイルの内容を判断し、このファイルの内
容と拡張子が予め定められた関係と一致するか否かを判
断することによって実行できる。
【0039】(2)リンク数の多さをカウントし、これ
をランク付けする。リンク数のカウントは、例えば<a
href=”URL”>といったタグをカウントする
ことによって行うことができる。
【0040】(3)ダウンロードプログラムの数をカウ
ントし、これをランク付けする。このカウントは、例え
ば、タグ中のファイル名からプログラムのダウンロード
に使用される拡張子の数をカウントすることによって行
うことができる。例えば、「exe」、「lzh」、
「zip」等である。
【0041】(4)画像データの数をカウントし、これ
をランク付けする。画像データは例えば、タグ中のファ
イル名から「gif」、「jpg」等の画像データファ
イルを示す拡張子の記述をカウントすることによって行
うことができる。
【0042】(5)音楽データの数をカウントし、これ
をランク付けする。画像データは例えば、タグ中のファ
イル名から「mp3」、「mdi」等の音楽データファ
イルを示す拡張子の記述をカウントすることによって行
うことができる。
【0043】(6)ビデオデータ数をカウントし、これ
をランク付けする。画像データは例えば、タグ中のファ
イル名から「avi」、「qt」、「ram」、「mp
eg」等のビデオ・データファイルを示す拡張子の記述
をカウントすることによって行うことができる。
【0044】(7)表示情報のキャラクタセットの種類
を調べる。キャラクタセットの種類は、例えば、文書中
のヘッダ部分に定義されているキャラクタセット情報
(例えばcharset=Shift_jis)を調べ
ることによって行うことができる。また、このキャラク
タセットの情報を用いて、日本語と英語の両方のページ
を持つウェブサイトのようなランクを設定することもで
きる。または、直接表示情報のキャラクタコードから使
用文字を調べてもよい。
【0045】(8)表示情報が、携帯電話等で表示され
る場合に、「iモード」で使用されるHTMLのサブセ
ットや、WAP(Wireless Applicat
ionProtocol)で使用されるWML(Wir
eless MarkupLanguage)等のハイ
パーテキスト文書が使用されることがある。しかし、こ
れらのフォーマットはユーザ端末の端末環境によって適
否がことなるため、ユーザの端末環境に適しているWW
Wサイトという評価を行うと便利である。例えば、iモ
ードでは、フォーマットがHTMLのサブセットである
ため、通常のHTML文書のうち全ての情報を表示する
ことはできない。そのため、ランク計算手段7は、UR
L文書データ6−2のうちHTMLのサブセットでは表
示できないタグを検索し(後述する図12のステップS
12−3、S12−4)、このタグをカウントすること
により(ステップS12−6)、iモード端末に適さな
い文書データを検出することができる。また、データの
内容においてもGIF画像は適するが、JPEG画像は
適さず、GIF画像でも画像が所定の大きさよりも大き
い場合には、完全な表示を実行することができないた
め、iモード端末に適さないといった基準を設定するこ
とも可能である。なお、複数の基準を組み合わせて判断
してもよい。そして、ステップS12−8の評価処理に
より、例えば、表示できないタグが予め定めた閾値より
少ないURL文書データ6−2数に基づいて、ユーザ端
末への適用度についてランク付けを行うことができる。
【0046】また、WAP対応端末のユーザでは、HT
ML文書ではなく、WML文書の充実度を知ることが重
要であるので、サイト中のWML文書数をカウントする
ことにより、充実度を評価することもできる。ここで、
WML文書の判別法は、文書データのヘッダ部分を参照
してもよいし、文書のフォーマット記述以外、すなわ
ち、文書のファイル拡張子を認識することにより、WM
L文書数をカウントするようにすることもできる。その
場合には、ステップS12−3〜S12−6の処理の代
わりに、ファイルの識別子を認識するステップと、この
認識結果に基づいてカウントするステップとを実行すれ
ばこの処理が実現できる。上述の説明は、移動体通信を
行う他の端末、例えば車載端末についても同様である。
図11にランク表示手段9の表示例を示す。なお、評価
基準となる利用者端末3の種別は、ネットワークを介し
てユーザから受け取ってもよい。また、利用者端末3か
ら送られてくるデータの送信要求には、WWWブラウザ
の種別情報が含まれるため、この送信要求に含まれる種
別情報に基づいてこの利用者端末3の端末環境を自動的
に識別し、この端末環境に適合する表示情報のフォーマ
ットを特定してもよい。
【0047】以上の(1)〜(8)の処理は、図12の
フローチャートに示したように実行することができる。
図12は、ランク計算手段7の評価処理を説明するフロ
ーチャートである。図12において、図5と同一の符号
は同一又は相当の部分を表わしている。図5のステップ
S5−4が終了すると、上述(1)〜(8)に示した評
価基準のいずれかに関連するタグを設定するとともに、
カウンタnを0に初期化する(ステップS11−1)。
次に、該当ウェブサイトの文書データを1つ選択しデー
タ格納手段6から読み出す(ステップS12−2)。続
いて、この文書データからステップS12−1で設定さ
れたタグを検索し(ステップS12−3)、この検索し
たタグの内容が、該当評価基準の内容と一致するか否か
を判定する(ステップS12−4)。もし、一致する場
合には、カウンタnに1を加算し(ステップS12−
5)、ステップS12−6に進む。一方一致しない場合
には、ステップS12−5の加算処理をスキップし、ス
テップS12−6に進む。
【0048】なお、ステップS12−3の検索処理は、
HTML文書のようにフォーマット記述がテキストで構
成されている場合には、例えば、”<a href=”
というようなステップS12−1で設定された当該評価
基準に対応した任意の文字列を検索すればよい。また、
ステップS12−4の判定処理も、タグの記述内容と評
価基準に対応して予め定められたフォーマットとテキス
トに合致するか否かを判定することによって実行するこ
とができる。例えば、該当タグが”<a href=”
http://・・・.html”>”等の文書をリン
ク先として指定されている否かを判定することにより、
基準に合致するか否かを調べることができる。文書形式
のフォーマットがテキスト形式でなく、バイナリ形式で
定義されている場合についても、同様の方法を用いて判
定処理等を実行することができる。
【0049】ステップS12−5までの判定処理が終了
すると、次に、該当文書データの全てのタグを検索し終
わったか否かを判断し(ステップS12−6)、終了し
ていなかった場合には、ステップS12−3に戻って次
のタグについての処理を行う。もし、終了している場合
には、該当WWWサイト内の全ての文書データについて
評価処理を実施したかを判断し、終了していない場合に
は、ステップS12−2に戻り、次の文書について評価
処理を行う。一方、終了していた場合には、カウンタn
の値を基に、当該WWWサイトの評価処理を行う(ステ
ップS12−8)。これで、1つのWWWサイトに対す
る評価処理が終了する。
【0050】最後に、評価対象である全てのWWWサイ
トについて評価処理を実行したかを判断し、終了してい
ない場合には、ステップS12−1に戻って次のWWW
サイトについて、上述ステップS12−1からステップ
S12−8の処理を実行する。終了している場合には、
図5のステップS5−5に移り、評価値に基づいてラン
ク付けの処理を行う。以上の説明では、1つの評価基準
について説明したが、上述(1)〜(8)の評価基準を
複数使用する場合には、それぞれの評価基準に対して図
12に示した処理を実行すればよい。
【0051】以上、WWWサイトを自動的に格付けする
システムについて説明したが、この発明は以上の実施の
形態の説明に限定されない。例えば、評価基準は上述の
評価基準に限定されず、さまざまな評価基準を使用する
ことができる。ネットワークは固定回線のインターネッ
トに限らず、ワイヤレスのネットワーク回線、LAN
(Local Area Network)等様々なタ
イプのネットワークを使用することができる。また、情
報配信手段は、WWWサーバに限らず、情報を配信する
様々なコンピュータを搭載した機器、デジタルデータで
記載されたコンテンツを含むデジタル放送のビデオサー
バ等も含まれる。
【0052】この実施の形態に係るWWWサイト自動格
付けシステムは、自動アクセス手段と、データ格納手段
と、を備えるので、格付け対象WWWサイトに自動的に
アクセスしてウェブページの内容とウェブページ取得に
かかった時間や発生したエラーなどのアクセスログ情報
を収集することができるというメリットがある。また、
前記自動アクセス手段は、格付け対象のWWWサイトの
URLを列挙した取得要求リスト51を備え、取得した
ウェブページからリンクURLを抽出して、新たな取得
対象として前記取得要求リストに追加するので、大規模
かつ多数のWWWサイトに対して効率的にアクセスする
ことが可能であり、さらに継続的にアクセスを行うこと
で収集したデータの有効性を維持することができる。ま
た、ランク計算手段を備えるので、収集したウェブペー
ジのHTML/XML規格への不適合度、リンクの不整
合率、更新間隔、などの尺度、アクセスログから応答時
間やエラー発生率などの尺度を計算し、それらの値に基
づいてサイトの総合的な格付けを決定することができ
る。計算方法を定式化することで評価の客観性を保証
し、消費者側と企業側の双方に有用な尺度を得ることが
できる。また、前記ランク計算手段は、ランク定義テー
ブルを備えるので、評価尺度の計算値からランク値への
変換や、各評価尺度から総合ランクを決定する計算法を
簡単に調整できる。また、ランク表示手段を備えるの
で、利用者からのアクセスに対してランクの上位サイト
一覧を表示することができる。上位サイトを運営するサ
イトにとっては大きな宣伝効果が得られると共に、下位
のサイトにとっても明確な目標が得られ、電子商取引の
プラットフォームの整備と発展が期待できる。また、前
記ランク表示手段は、表示制御テーブルを備え、不特定
利用者と特定の契約利用者とを区別して開示内容を制御
することができる。そのため、上位サイトに取っては不
特定利用者への開示を認めることで宣伝効果を期待する
ことができ、下位のサイトにとっては非公開で格付けを
依頼することで自サイトの改良指針を得ることができ
る。
【0053】
【発明の効果】この発明においては、利用者が指定した
キーワードと文書内容との関連性を示す単なる検索情報
を提供する従来の技術とは異なり、情報配信手段又はウ
ェブサイトの質の評価を提供することができる。
【図面の簡単な説明】
【図1】 この発明の実施の形態に係るWWWサイト自
動格付けシステムのブロック図である。
【図2】 この発明の実施の形態に係るコンピュータシ
ステムの内部構成を示すブロック図である。
【図3】 この発明の実施の形態に係る自動アクセス手
段の動作を示すフローチャートである。
【図4】 この発明の実施の形態に係るデータ格納手段
に格納されるURL情報のフォーマットを示す図であ
る。
【図5】 この発明の実施の形態に係るランク計算手段
の動作を示すフローチャートである。
【図6】 この発明の実施の形態に係るランク定義テー
ブルのフォーマットを示す図である。
【図7】 この発明の実施の形態に係る結果格納手段が
格納するデータのフォーマットを示す図である。
【図8】 この発明の実施の形態に係るランク表示手段
が表示する画面を示す図である。
【図9】 この発明の実施の形態に係る表示制御テーブ
ルのフォーマットを示す図である。
【図10】 この発明の実施の形態に係るランク表示手
段の動作を示すフローチャートである。
【図11】 この発明の実施の形態に係るランク表示手
段が表示する画面を示す図である。
【図12】 この発明の実施の形態に係るランク計算手
段の動作を示すフローチャートである。
【符号の説明】
1 コンピュータシステム、 2 WWWサイト、 3
利用者端末、 4インターネット、 5 自動アクセ
ス手段、 6 データ格納手段、 7 ランク計算手
段、 8 結果格納手段、 9 ランク表示手段

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 ネットワークを介してこのネットワーク
    に接続された複数の情報配信手段から表示情報を取得す
    る情報取得手段と、 この情報取得手段が取得した表示情報のフォーマット記
    述に基づいて上記複数の情報配信手段のそれぞれの表示
    情報の品質を評価し、評価結果を上記ネットワークへ出
    力する評価手段と、を備えた情報処理装置。
  2. 【請求項2】 上記評価手段は、上記フォーマット記述
    とフォーマット規格との整合度を評価する請求項1に記
    載の情報処理装置。
  3. 【請求項3】 上記評価手段は、上記フォーマット記述
    内のリンク情報と実際のリンクとの不整合度を評価する
    ことを特徴とする請求項1に記載の情報処理装置。
  4. 【請求項4】 ネットワークを介してこのネットワーク
    に接続された複数の情報配信手段から表示情報を取得す
    る情報取得手段と、 この情報取得手段が取得した表示情報のフォーマット記
    述に基づいて上記複数の情報配信手段それぞれのコンテ
    ンツの充実度を評価し、評価結果を上記ネットワークへ
    出力する評価手段と、を備えた情報処理装置。
  5. 【請求項5】 ネットワークを介してこのネットワーク
    に接続された複数の情報配信手段から表示情報を取得す
    る情報取得手段と、 この情報取得手段が取得した表示情報のフォーマット記
    述に基づいて上記複数の情報配信手段それぞれが提供す
    るコンテンツとこのコンテンツを表示する端末との適合
    度を評価し、評価結果を上記ネットワークへ出力する評
    価手段と、を備えた情報処理装置。
  6. 【請求項6】 上記複数の情報配信手段はウェブサイト
    であり、上記フォーマット記述は、タグ情報であること
    を特徴とする請求項1〜5のいずれかに記載の情報処理
    装置。
  7. 【請求項7】 上記ネットワークを介して順位付けの基
    準を受け取り、この基準に基づいて上記評価結果をソー
    トするソート手段を備え、 上記評価手段は、そのソート手段がソートした評価結果
    を上記ネットワークへ出力することを特徴とする請求項
    1〜6のいずれかに記載の情報処理装置。
  8. 【請求項8】 上記評価手段は、1つの表示情報に対し
    て複数の評価基準で評価して複数の評価結果を算出し、 上記ソート手段は、上記複数の評価結果それぞれに重み
    付けを行い、この重み付けに基づいた上記情報配信手段
    の総合ランクを決定することを特徴とする請求項7記載
    のシステム。
  9. 【請求項9】 不特定利用者に開示可能なウェブサイト
    の一覧と、利用者毎に開示可能なウェブサイトの一覧と
    を格納した表示制御テーブルを備え、 上記評価手段は、利用者毎にデータの出力制限を行うこ
    とを特徴とする請求項1〜8のいずれかに記載の情報処
    理装置。
  10. 【請求項10】 ネットワークに接続された情報処理装
    置が複数のウェブサイトにアクセスし、それぞれのウェ
    ブサイトから文書データを取得するデータ取得ステップ
    と、 上記情報処理装置がこのデータ取得ステップで取得した
    文書データと文書規格との適合度を評価する評価ステッ
    プと、 上記ネットワークを介して、複数の要求を受け付けるス
    テップと、 上記複数の要求それぞれに対応して、上記情報処理装置
    が上記適合度を上記ネットワークを介して出力する出力
    ステップと、を備えたネットワークデータ評価方法。
  11. 【請求項11】 ネットワークに接続された情報処理装
    置が複数のウェブサイトにアクセスし、それぞれのウェ
    ブサイトからハイパーテキストを取得するデータ取得ス
    テップと、 上記ネットワークをアクセスし、上記データ取得ステッ
    プで取得したハイパーテキスト内のリンク情報と上記ネ
    ットワーク上の実際のデータとの整合度を評価する評価
    ステップと、 上記ネットワークを介して、複数の要求を受け付けるス
    テップと、 上記複数の要求それぞれに対応して、上記情報処理装置
    が上記整合度を上記ネットワークを介して出力する出力
    ステップと、を備えたネットワークデータ評価方法。
  12. 【請求項12】 ネットワークに接続された情報処理装
    置が複数のウェブサイトにアクセスし、それぞれのウェ
    ブサイトからデータファイルを取得するデータ取得ステ
    ップと、 上記情報処理装置が上記データファイルのファイル名の
    ファイル種別の記載が上記データファイルの中身と一致
    しているかを評価する評価ステップと、 上記情報処理装置が評価結果を出力する出力ステップ
    と、を備えたネットワークデータ評価方法。
  13. 【請求項13】 請求項10〜12のいずれかに記載さ
    れたネットワークデータ評価方法を実行させるためのプ
    ログラムを記録したコンピュータ読取り可能な記録媒
    体。
JP2000387154A 2000-12-20 2000-12-20 情報処理装置、ネットワークデータ評価方法、並びにその評価方法を実行させるためのプログラムを記録した記録媒体 Pending JP2002189917A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000387154A JP2002189917A (ja) 2000-12-20 2000-12-20 情報処理装置、ネットワークデータ評価方法、並びにその評価方法を実行させるためのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000387154A JP2002189917A (ja) 2000-12-20 2000-12-20 情報処理装置、ネットワークデータ評価方法、並びにその評価方法を実行させるためのプログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2002189917A true JP2002189917A (ja) 2002-07-05

Family

ID=18854141

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000387154A Pending JP2002189917A (ja) 2000-12-20 2000-12-20 情報処理装置、ネットワークデータ評価方法、並びにその評価方法を実行させるためのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2002189917A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7152016B2 (en) 2002-09-19 2006-12-19 Fuji Xerox Co., Ltd. Usability evaluation support apparatus and method
JP2008181445A (ja) * 2007-01-26 2008-08-07 Just Syst Corp 文書情報提供方法、文書情報提供プログラム、文書情報提供装置、およびweb端末装置
JP2008197748A (ja) * 2007-02-08 2008-08-28 Ntt Docomo Inc コンテンツ流通管理装置、通信端末、プログラム及びコンテンツ流通システム
JP2010287117A (ja) * 2009-06-12 2010-12-24 Nomura Research Institute Ltd Webサイトセキュリティ保険システム
JP2015049893A (ja) * 2013-08-29 2015-03-16 富士通株式会社 キュレーションされたコンテンツを評価する方法及びシステム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7152016B2 (en) 2002-09-19 2006-12-19 Fuji Xerox Co., Ltd. Usability evaluation support apparatus and method
JP2008181445A (ja) * 2007-01-26 2008-08-07 Just Syst Corp 文書情報提供方法、文書情報提供プログラム、文書情報提供装置、およびweb端末装置
JP2008197748A (ja) * 2007-02-08 2008-08-28 Ntt Docomo Inc コンテンツ流通管理装置、通信端末、プログラム及びコンテンツ流通システム
JP2010287117A (ja) * 2009-06-12 2010-12-24 Nomura Research Institute Ltd Webサイトセキュリティ保険システム
JP2015049893A (ja) * 2013-08-29 2015-03-16 富士通株式会社 キュレーションされたコンテンツを評価する方法及びシステム

Similar Documents

Publication Publication Date Title
CN100399290C (zh) 收集高速缓存Web内容的多样化Web服务器活动数据
US9916293B2 (en) Module specification for a module to be incorporated into a container document
AU2010201642B2 (en) Remote module incorporation into a container document
US6507867B1 (en) Constructing, downloading, and accessing page bundles on a portable client having intermittent network connectivity
US7631263B2 (en) Methods, systems, and computer program products for characterizing links to resources not activated
US8639687B2 (en) User-customized content providing device, method and recorded medium
US9223895B2 (en) System and method for contextual commands in a search results page
US20070136443A1 (en) Proxy server collection of data for module incorporation into a container document
US20070204010A1 (en) Remote Module Syndication System and Method
CN101233510A (zh) 处理并基于无线网络将搜索结果发送到移动设备
US20070288477A1 (en) Information processing apparatus, information processing system, information processing method, and computer program
JP2003016001A (ja) コンテンツ変換方法及び変換後コンテンツ取得方法
WO2007070404A2 (en) Customized container document modules using preferences
KR20010106785A (ko) 실시간 역경매 방식의 전자 쇼핑몰 정보 제공 및 대행서비스 시스템 및 그 방법
US8135733B2 (en) Information retrieval apparatus, information retrieval method and information retrieval processing program
JP2003216608A (ja) 情報収集/分析方法及びシステム
EP1302868A2 (en) Document sorting method based on link relation
US20030204573A1 (en) Method of providing a web user with additional context-specific information
EP1041497A2 (en) Information fetching control scheme using data type dependent strategy for reducing user response time
US8140508B2 (en) System and method for contextual commands in a search results page
JP4963619B2 (ja) 情報検索システム、情報検索装置、検索結果画面情報生成方法及び検索結果画面情報生成処理プログラム
JP2002189917A (ja) 情報処理装置、ネットワークデータ評価方法、並びにその評価方法を実行させるためのプログラムを記録した記録媒体
JP3664906B2 (ja) 情報源観測装置および情報源観測方法ならびに情報源観測処理を実行させるプログラムを記録した記録媒体
JP2004206492A (ja) ドキュメント表示方法およびそれを用いたリンク先選択機能付ゲートウェイ装置
US8806326B1 (en) User preference based content linking