JP2008123425A - ウェブ文書データ提供装置、方法、およびシステム - Google Patents

ウェブ文書データ提供装置、方法、およびシステム Download PDF

Info

Publication number
JP2008123425A
JP2008123425A JP2006309132A JP2006309132A JP2008123425A JP 2008123425 A JP2008123425 A JP 2008123425A JP 2006309132 A JP2006309132 A JP 2006309132A JP 2006309132 A JP2006309132 A JP 2006309132A JP 2008123425 A JP2008123425 A JP 2008123425A
Authority
JP
Japan
Prior art keywords
document data
rss
html
url
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006309132A
Other languages
English (en)
Inventor
Tadashi Uchiyama
匡 内山
Hiroshi Ishikawa
広 石川
Ryoji Kataoka
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
NTT Resonant Inc
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Resonant Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Resonant Inc filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006309132A priority Critical patent/JP2008123425A/ja
Publication of JP2008123425A publication Critical patent/JP2008123425A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】個々の利用者に特化したRSS文書データやHTML文書データを生成するウェブ文書データ提供装置を提供する。
【解決手段】本発明のウェブ文書データ提供装置は、インターネット上で提供される任意のHTML文書データのURLを指定するURL指定手段と、URLからHTML文書データを取得するHTML取得手段と、HTML文書データの任意の範囲箇所を指定する部分指定手段と、URLと範囲箇所とを記憶する部分情報保存手段と、HTML文書データの任意の範囲箇所に含まれるリンク情報を抽出するリンク抽出手段と、リンク情報をまとめてRSS文書データを生成するRSS生成手段と、RSS文書データを保存するRSS文書保存手段とを有することを特徴とする。
【選択図】図1

Description

本発明は、インターネット上で提供されるHTML文書データの任意の範囲箇所を抽出してカスタマイズRSS文書データを生成し、生成した前記カスタマイズRSS文書データの内容とインターネット上に提供される他のRSS文書データの内容とを含んだカスタマイズHTML文書データを生成し、また、前記カスタマイズHTML文書データの表示レイアウトを利用者に変更可能とするウェブ文書データ提供装置、方法、およびシステムに関する。
従来、インターネット上のウェブページとして閲覧可能なHTML(Hyper Text Markup Language)文書データを生成する方法として、PC(Personal Computer)などのコンピュータ端末を用いてHTML形式に沿ったHTML文書データを生成し、生成したHTML文書データをウェブサーバに送信・登録する方法が知られている(例えば、特許文献1参照)。
近年では、ブログサービスの普及に伴って、XML(Extensible Markup Language)言語を用いて、 ウェブページ(HTML文書データ)に掲載される新着情報等の見出し等を抽出し要約したRSS(RDF Site Summary)文書データを生成し、生成したRSS文書データをウェブサーバに登録して、これを利用者に提供する方法が普及しつつある。利用者が、あらかじめ興味があるウェブページに対応する上記RSS文書データのURL(Uniform Resource Locator)をRSSリーダーアプリケーションに登録しておくと、RSSリーダーが定期的にRSS文書データを取得する。これにより、利用者はRSS文書データに対応するウェブページの新着情報・更新状態を、興味あるウェブページに個々にアクセスすることなく確認できる。RSSリーダーとしては、例えば、一または複数のRSS文書データをHTML文書データにまとめて提供するサービスが実施されている。
ところで、ブログサービスには、編集者が作成したブログ記事から、タイトルや作成日時、記事の概要等を含むRSS文書データを自動的に作成するRSS文書データ自動生成サービス機能を提供されている場合がある。
図2は、従来技術によるブログ記事生成時のRSS文書データ生成の動作例である。ブログ編集者は、専用ウェブページから記事タイトル、記事本文、記事カテゴリ等の記事情報を入力し、ブログサーバに送信する。ブログサーバは、受信した記事情報をブログサイトDB(Data Base)に記憶する。その後、ブログサーバ管理者が定める一定の時間間隔で、ブログサイトDBに蓄積された記事情報が読み出され、これらの記事情報がRSS形式にまとめられてRSS文書データが生成され、RSSDBに記憶される。
特開平10−133988号公報
しかしながら、上記のようなRSS文書データ自動生成サービスは全てのブログサービスが備えているわけではなく、また、ニュースサイト等の他のウェブページが全てRSS文書データを提供しているわけではない。このため、利用者の興味あるウェブページがRSS文書データを提供していなかった場合、そのウェブサイトには、ウェブページの更新状態を確認するために直接ウェブページへアクセスする必要があった。
また、上記のようなサイト運営者が提供するRSS文書データに含まれるウェブページ更新情報はサイト運営者の視点によって抽出されるため、必ずしも個々の利用者が望む更新情報を抽出して提供できるわけではない。例えば、上記のようなブログサービスにおけるRSS文書データ自動生成サービスにおいては、RSS文書データ化されるのは新着記事に限られる場合が多く、この場合は情報として有用な新着コメント、新着トラックバックなどの情報はRSS文書データに含まれないため、これらを参照するためには当該ウェブページへ直接アクセスする必要があった。
本発明は、このような状況に鑑みてなされたもので、利用者が、RSS文書データ化するHTML文書データの抽出部分を設定可能とし、また、利用者の設定に従って一または複数のRSS文書データをまとめてレイアウトしたHTML文書データを生成し、個々の利用者に特化したRSS文書データやHTML文書データを提供することを目的とする。
請求項1記載の発明は、インターネット上で提供される任意のHTML文書データの任意の範囲箇所を抽出して、RSS文書データを生成し提供するウェブ文書データ提供装置であって、インターネット上で提供される任意の前記HTML文書データのURLを指定するURL指定手段と、前記URLから前記HTML文書データを取得するHTML取得手段と、前記HTML文書データの任意の範囲箇所を指定する部分指定手段と、前記URLと、前記範囲箇所とを記憶する部分情報保存手段と、前記HTML文書データの任意の範囲箇所に含まれるリンク情報を抽出するリンク抽出手段と、前記リンク情報をまとめてRSS文書データを生成するRSS生成手段と、前記RSS文書データを保存するRSS文書保存手段とを有することを特徴とするウェブ文書データ提供装置。
この構成により、 HTML文書の任意の部分を指定して抽出し、抽出部分に含まれるリンク情報からRSS文書を生成することが可能となる。
請求項2記載の発明は、前記部分指定手段は、前記HTML文書データ中のコメントタグ情報を検出することによって範囲箇所を指定することを特徴とする請求項1に記載のウェブ文書データ提供装置。
この構成により、指定したい部分の前後に記述されているコメントタグを指定することで、 HTML文書中の部分を特定することができる。
請求項3記載の発明は、前記部分指定手段は、前記HTML文書データ中のHTML要素のID情報を検出することによって範囲箇所を指定することを特徴とする請求項1に記載のウェブ文書データ提供装置。
この構成により、HTML文書中で指定したい部分にIDが設定されている場合は、HTML文書中でIDはユニークに設定されていることから、このIDを指定することで、HTML文書中の部分を特定することができる。
請求項4記載の発明は、前記部分指定手段は、前記HTML文書データ中のHTML要素のタグ情報を検出することによって範囲箇所を指定することを特徴とする請求項1に記載のウェブ文書データ提供装置。
この構成により、指定したい部分のタグに対してHTML文書中でユニークに決定されるタグ情報を指定することで、 HTML文書中の部分を特定することができる。
請求項5記載の発明は、インターネット上で提供される一または複数のRSS文書データをまとめて表示するHTML文書データを提供するウェブ文書データ提供装置であって、インターネット上で提供される一または複数の任意の前記RSS文書データのURLを指定するURL指定手段と、前記URLからRSS文書データを収得するRSS取得手段と、一または複数の前記RSS文書データをまとめたHTML文書データを生成するRSS表示手段と、前記HTML文書データが含む一または複数のRSS文書データ情報の、少なくとも表示位置と表示スタイルとの編集を行う表示設定手段と
を有することを特徴とするウェブ文書データ提供装置。
この構成により、複数のRSS文書を取り込んで生成されるHTML文書のレイアウトなどを自在に利用者側で設定し、個々の利用者に特化されたHTML文書を提供することができる。
請求項6記載の発明は、インターネット上で提供される任意のHTML文書データの任意の範囲箇所を抽出して、RSS文書データを生成し提供するウェブ文書データ提供方法であって、インターネット上で提供される任意の前記HTML文書データのURLを指定するURL指定ステップと、前記URLから前記HTML文書データを取得するHTML取得ステップと、前記HTML文書データの任意の範囲箇所を指定する部分指定ステップと、前記URLと、前記範囲箇所とを記憶する部分情報保存ステップと、前記HTML文書データの任意の範囲箇所に含まれるリンク情報を抽出するリンク抽出ステップと、前記リンク情報をまとめてRSS文書データを生成するRSS生成ステップと、前記RSS文書データを保存するRSS文書保存ステップとを有することを特徴とするウェブ文書データ提供方法。
この構成により、 HTML文書の任意の部分を指定して抽出し、抽出部分に含まれるリンク情報からRSS文書を生成することが可能となる。
請求項7記載の発明は、前記部分指定ステップは、前記HTML文書データ中のコメントタグ情報を検出することによって範囲箇所を指定することを特徴とする請求項6に記載のウェブ文書データ提供方法。
この構成により、指定したい部分の前後に記述されているコメントタグを指定することで、 HTML文書中の部分を特定することができる。
請求項8記載の発明は、前記部分指定ステップは、前記HTML文書データ中のHTML要素のID情報を検出することによって範囲箇所を指定することを特徴とする請求項6に記載のウェブ文書データ提供方法。
この構成により、HTML文書中で指定したい部分にIDが設定されている場合は、HTML文書中でIDはユニークに設定されていることから、このIDを指定することで、HTML文書中の部分を特定することができる。
請求項9記載の発明は、前記部分指定ステップは、前記HTML文書データ中のHTML要素のタグ情報を検出することによって範囲箇所を指定することを特徴とする請求項6に記載のウェブ文書データ提供方法。
この構成により、指定したい部分のタグに対してHTML文書中でユニークに決定されるタグ情報を指定することで、 HTML文書中の部分を特定することができる。
請求項10記載の発明は、インターネット上で提供される一または複数のRSS文書データをまとめて表示するHTML文書データを提供するウェブ文書データ提供方法であって、インターネット上で提供される一または複数の任意の前記RSS文書データのURLを指定するURL指定ステップと、前記URLからRSS文書データを収得するRSS取得ステップと、一または複数の前記RSS文書データをまとめたHTML文書データを生成するRSS表示ステップと、前記HTML文書データが含む一または複数のRSS文書データ情報の、少なくとも表示位置と表示スタイルとの編集を行う表示設定ステップとを有することを特徴とするウェブ文書データ提供方法。
この構成により、複数のRSS文書を取り込んで生成されるHTML文書のレイアウトなどを自在に利用者側で設定し、個々の利用者に特化されたHTML文書を提供することができる。
請求項11記載の発明は、インターネット上で提供される任意のHTML文書データの任意の範囲箇所を抽出して、RSS文書データを生成し提供するウェブ文書データ提供システムであって、インターネット上で提供される任意の前記HTML文書データのURLを指定するURL指定手段と、前記URLから前記HTML文書データを取得するHTML取得手段と、前記HTML文書データの任意の範囲箇所を指定する部分指定手段と、前記URLと、前記範囲箇所とを記憶する部分情報保存手段と、前記HTML文書データの任意の範囲箇所に含まれるリンク情報を抽出するリンク抽出手段と、前記リンク情報をまとめてRSS文書データを生成するRSS生成手段と、前記RSS文書データを保存するRSS文書保存手段とを有することを特徴とするウェブ文書データ提供システム。
この構成により、 HTML文書の任意の部分を指定して抽出し、抽出部分に含まれるリンク情報からRSS文書を生成することが可能となる。
請求項12記載の発明は、前記部分指定手段は、前記HTML文書データ中のコメントタグ情報を検出することによって範囲箇所を指定することを特徴とする請求項11に記載のウェブ文書データ提供システム。
この構成により、指定したい部分の前後に記述されているコメントタグを指定することで、 HTML文書中の部分を特定することができる。
請求項13記載の発明は、前記部分指定手段は、前記HTML文書データ中のHTML要素のID情報を検出することによって範囲箇所を指定することを特徴とする請求項11に記載のウェブ文書データ提供システム。
この構成により、HTML文書中で指定したい部分にIDが設定されている場合は、HTML文書中でIDはユニークに設定されていることから、このIDを指定することで、HTML文書中の部分を特定することができる。
請求項14記載の発明は、前記部分指定手段は、前記HTML文書データ中のHTML要素のタグ情報を検出することによって範囲箇所を指定することを特徴とする請求項11に記載のウェブ文書データ提供システム。
この構成により、指定したい部分のタグに対してHTML文書中でユニークに決定されるタグ情報を指定することで、 HTML文書中の部分を特定することができる。
請求項15記載の発明は、インターネット上で提供される一または複数のRSS文書データをまとめて表示するHTML文書データを提供するウェブ文書データ提供システムであって、インターネット上で提供される一または複数の任意の前記RSS文書データのURLを指定するURL指定手段と、前記URLからRSS文書データを収得するRSS取得手段と、一または複数の前記RSS文書データをまとめたHTML文書データを生成するRSS表示手段と、前記HTML文書データが含む一または複数のRSS文書データ情報の、少なくとも表示位置と表示スタイルとの編集を行う表示設定手段と
を有することを特徴とするウェブ文書データ提供システム。
この構成により、複数のRSS文書を取り込んで生成されるHTML文書のレイアウトなどを自在に利用者側で設定し、個々の利用者に特化されたHTML文書を提供することができる。
以上説明したように、本発明によれば、インターネット上で提供されるHTML文書データの部分を抽出してカスタマイズRSS文書データを生成し、生成した前記カスタマイズRSS文書データの内容とインターネット上に提供される他のRSS文書データの内容とを含んだカスタマイズHTML文書データを生成し、また、前記カスタマイズHTML文書データの表示レイアウトを利用者に変更可能とするようにしたので、個々の利用者のニーズに応えるRSS利用環境を提供することができる。
以下、本発明の一実施形態について、図面を参照して説明する。
図1は、本実施形態によるシステムの構成を示すブロック図である。
編集者端末301は、ウェブサーバ302が提供するRSS文書データとHTML文書データとのウェブ文書データの内容、レイアウトを登録する。
ウェブサーバ302は、編集者端末301に登録された情報に従ってウェブ文書データを生成し、利用者端末303に提供する。
利用者端末303は、ウェブサーバ302からウェブ文書データを受信し、表示する。
なお、編集者端末301と利用者端末303とは、同じ利用者の同じ端末であっても良い。
編集者端末301と、ウェブサーバ302と、利用者端末303とはそれぞれデータ送受信部を有しており、インターネットなどのネットワークを介して互いにデータの送受信が可能であることとする。また、編集者端末301と、利用者端末303とは、ウェブ文書データを表示可能なディスプレイ等の表示デバイスおよびキーボードやマウス等の入力デバイスを有することとし、編集者端末301の利用者および利用者端末303の利用者は上記表示デバイスに表示されたデータを閲覧しながら、上記入力デバイスを利用して情報の入力が可能であることとする。
編集者端末301は、部分情報決定部110と、レイアウト情報決定部210とを有する。
部分情報決定部110は、HTML文書データからRSS文書データ化する範囲対象を決定する部分であり、URL指定部111と、ページ取得部112と、部分指定部113と、部分情報保存部114とを有する。
URL指定部111は、RSS文書データ化する対象のHTML文書データURLの入力を受け付ける。
ページ取得部112は、上記で入力されたHTML文書データURLへアクセスし、HTML文書データを取得する。
部分指定部113は、上記で取得したHTML文書データ中のRSS文書データ化するHTML部分範囲を決定する。
部分情報保存部114は、上記で決定したHTML部分範囲を特定する情報を、レイアウト情報記憶部221に送信し、記憶させる。
レイアウト情報決定部210は、一または複数のRSS文書データ内容をまとめて利用者に提供するHTML文書データのレイアウトを決定する部分であり、URL指定部211と、RSS取得部212と、RSS表示部213と、レイアウト指定部214と、レイアウト情報保存部215とを有する。
URL指定部211は、インターネット上で提供される任意のRSS文書データURLを決定する。
RSS取得部212は、上記RSS文書データURLからRSS文書データを取得する。
RSS表示部213は、上記RSS文書データを読み込んで、RSS文書データに含まれる記事タイトルや記事URLなどの情報を抽出し、ディスプレイに表示する。
レイアウト指定部214は、上記取得した一または複数のRSS文書データ内容を表示するHTML文書データのページレイアウトを設定する。
レイアウト情報保存部215は、上記HTML文書データのページレイアウト情報をレイアウト情報記憶部221に送信し、記憶させる。
ウェブサーバ302は、編集者端末301で設定された情報を元にRSS文書データとHTML文書データとを生成して利用者端末303に提供し、RSS提供部120と、レイアウト情報制御部220とを有する。
RSS提供部120は、編集者端末301で設定された情報を元にRSS文書データを生成する部分であり、部分情報記憶部121と、HTML取得部122と、部分抽出部123と、RSS生成部124と、RSS保存部125と、RSS記憶部126と、RSS配信部127とを有する。
部分情報記憶部121は、編集者端末301から受信するURLとHTML文書データの任意の範囲箇所情報を記憶する。
HTML取得部122は、上記URLからHTML文書データを取得する。
部分抽出部123は、上記HTML文書データから、HTML文書データの任意の範囲箇所を検出する。
RSS生成部124は、上記で検出したHTML文書データの任意の範囲箇所に含まれる情報からRSS文書データを生成する。
RSS保存部125は、上記で生成したRSS文書データをRSS記憶部126に記憶させる。
RSS記憶部126は、上記RSS文書データの記憶部である。
RSS配信部127は、上記RSS文書データの要求を受付け、提供する。
レイアウト情報制御部220は、編集者端末301で設定された情報を元にHTML文書データを生成する部分であり、レイアウト情報記憶部221と、HTML配信部222とを有する。
レイアウト情報記憶部221は、編集者端末301から受信するレイアウト情報を記憶する。
HTML配信部222は、上記レイアウト情報に従ってHTML文書データを生成し、提供する。
ウェブサーバに備えられているRSS保存部125およびレイアウト情報記憶部221はハードディスク、RAM(Random Access Memory)などの記憶装置でよい。
利用者端末303は、RSS提供部120から受信するRSS文書データとHTML文書データとを表示する端末であり、レイアウト表示部230を有する。
レイアウト表示部230は、RSS取得部231と、レイアウト情報取得部232と、レイアウト部233と、表示部234とを有する。
RSS取得部231は、ユーザから入力されるRSS文書データ取得要求情報に従って、RSS文書データを取得する。
レイアウト情報取得部232は、ユーザから入力されるRSS文書データ内容表示要求情報に従って、HTML配信部222からレイアウト制御HTML文書データを取得する。
レイアウト部233は、上記で取得したレイアウト制御HTML文書データをディスプレイに表示させる。
表示部234は、利用者端末303が有するディスプレイである。
次に、図3のフローチャートを参照して、HTML文書データのRSS文書データ化について説明する。
URL指定部111は、RSS文書データ化URL入力画面を編集者端末301のディスプレイに表示させる。RSS文書データ化URL入力画面はRSS文書データ化するウェブページのURLの入力を受け付ける画面であり、例えば、URL文字列を入力可能なテキストボックスを有する。または、複数のURLの一覧を表示し、その中から任意のURLを選択可能な画面などでも良い。編集者は、入力デバイスを利用して、RSS文書データ化対象URL情報を文字列で上記テキストボックスに入力する(ステップS301)。
上記RSS文書データ化対象URL情報の入力が完了すると、ページ取得部112は、RSS文書データ化対象URLにアクセスし、RSS文書データ化対象URLに対応するHTML文書データを受信する(ステップS302)。
上記でHTML文書データを受信すると、部分指定部113は、抽出部分指定画面を編集者端末301のディスプレイに表示させる。抽出部分指定画面は、例えば、画面がフレームにて左右2つに区切られており、画面左部には上記取得したHTML文書データを、画面右部には選択画面を表示する(図8)。
部分指定部113は、画面右部の選択画面には、「IDで指定」と「コメントで指定」と「マウスで指定」とのいずれかを選択可能な第1のドロップダウンリストを表示する。
部分指定部113は、編集者が入力デバイスを利用して上記第1のドロップダウンリストで「IDで指定」を選択した情報を検出した場合には、画面右部の第1のドロップダウンリストの下部に、上記画面左部に表示されたHTML文書データが含むタグIDを要素として備える第2のドロップダウンリストを表示する。
編集者は、上記第2のドロップダウンリストから、RSS文書データ化するタグIDを選択する。このとき、部分指定部113は、編集者が第2のドロップダウンリストからひとつのタグIDを選択した情報を抽出部分選択情報として検出し、画面左部の、抽出部分選択情報に対応する箇所に赤色の網掛けを行って表示する(図8では、画面左部の点線で囲まれた部分)。これにより、編集者は、画面右部で選択したタグIDが画面左部に表示されたHTML文書データのどの箇所にあたるのかを視覚的に把握することができる。
また、部分指定部113は、編集者が第2のドロップダウンリストから任意のID要素を選択すると、第2のドロップダウンリストの下部に、抽出部分選択情報に対応するHTML要素が含むリンクの一覧を表示する。これにより、編集者は、選択したHTML文書データの抽出部分が含むリンクを視覚的に把握することができる。
図8は、RSS文書データ化対象URLを「http://www.xxx.ne.jp.index.html」とし、第1のドロップダウンリストで「IDで指定」を選択した場合の画面例である。抽出部分選択情報は「ID=“personal”」となっている。画面はフレームによって左右に区切られ、画面左部にはウェブページが表示されており、画面右部には第1のドロップダウンリスト、第2のドロップダウンリスト、リンクの一覧が表示されている。第2のドロップダウンリストには、HTML文書データID要素「personal」が選択されている。リンクの一覧には、ID要素「personal」に対応するHTML要素が含むリンク「ゲスト」、「ゲストID」、「新規登録」、「ログイン」、「メール」、「ブログ」が表示されている。また、図8に示すように、リンク一覧にはそれぞれのリンクに対応するチェックボックスを設け、チェックするか否かによって、RSS文書データ化の対象とするか否かを選択できるようにしても良い。
あるいは、部分指定部113は、編集者が入力デバイスを利用して上記第1のドロップダウンリストで「コメントで指定」を選択した情報を検出した場合には、画面右部の第1のドロップダウンリストの下部に、上記画面左部に表示されたHTML文書データに含まれる全てのコメント要素を要素として有する第3のドロップダウンリストと、同様に画面左部に表示されたHTML文書データが含む全てのコメント要素を要素として有する第4のドロップダウンリストを表示する。
部分指定部113は、上記第3のドロップダウンリストで選択されたコメント要素を選択部分の開始位置と、また上記第4のドロップダウンリストで選択されたコメント要素を選択部分の終了位置とし、開始位置から終了位置までを抽出部分選択情報とする。部分指定部113は、抽出部分選択情報に対応する画面左部のHTML箇所に赤色の網掛けを行う(図9では、画面左部の点線で囲まれた部分)。
また、上記選択部分のHTML要素が含むリンクを全て、第4のドロップダウンリストの下部に一覧にして表示する。
図9は、RSS文書データ化対象URLを「http://www.xxx.ne.jp.index.html」とし、第1のドロップダウンリストで「コメントで指定」を選択した場合の画面例である。抽出部分選択情報は「COMMENT={“menu”、“/menu”}」となっている。画面はフレームによって左右に区切られ、画面左部にはウェブページが表示されており、画面右部には第1のドロップダウンリスト、第3のドロップダウンリスト、第4のドロップダウンリスト、リンクの一覧が表示されている。第3のドロップダウンリストには、コメント要素「menu」が選択されている。第4のドロップダウンリストには、コメント要素「/menu」が選択されている。リンクの一覧には、HTML文書データ中のコメント要素「menu」からコメント要素「/menu」までに含まれるリンク「ニュース」、「天気」、「スポーツ」、「テレビ番組」が表示されている。
あるいは、部分指定部113は、編集者が入力デバイスを利用して上記第1のドロップダウンリストで「マウスで指定」を選択した情報を検出した場合には、編集者がマウスポインタにて選択した画面左部の任意の箇所を選択部分とし、選択部分に対応するDOMツリー情報を抽出部分選択情報として生成する。例えば、編集者は、マウスポインタにて、画面左部の任意の箇所を白黒反転させて、選択部分を指定する。部分指定部113は、編集者が画面左部の任意の箇所の選択が完了した情報を受信した場合には、選択部分のHTML要素をDOM(Document Object Model)ツリーとして検出する(例えば、特許文献『構造化文書の部分指定・抽出方法及び装置及び構造化文書の部分指定・抽出プログラム及び構造化文書の部分指定・抽出プログラムを格納した記憶媒体』(特願2002−204641))。DOMツリーは、HTML文書データやXML文書データをオブジェクトとして扱い、その構造を木構造として表したツリーである。
本実施形態では、部分指定部113は、WIDL(Web Interface Definition Language)の規格(非特許文献『Web Interface Definition Language (WIDL) 』インターネット<URL:http://www.w3.org/TR/NOTE-widl.html>)に沿ったDOMツリーを生成し、DOMツリーの生成時には、開始タグと終了タグとを検出してツリー構造の解析を行うが、この際、タグID、タグ名、タグ書式属性名などを参考情報としてツリー解析を行っても良い(例えば、特許文献『構造化文書からの情報抽出方法及び情報抽出プログラム及び情報抽出プログラムを格納した記億媒体』(特願2002−190621))。
図11は、DOMツリーの木構造例である。HTML文書データが図11(a)に示したようである場合、これをブラウザで表示すると図11(b)のようになる。このHTML文書データからDOMツリーを生成すると、図11(c)に示すような木構造となる。
また、上記選択部分のHTML要素が含むリンクを全て、第1のドロップダウンリストの下部に一覧にして表示する。
図10は、RSS文書データ化対象URLを「http://www.xxx.ne.jp.index.html」とし、第1のドロップダウンリストで「マウスで指定」を選択した場合の画面例である。抽出部分選択情報は「DOM=“HTML[0].BODY[0].TABLE[3].TR[2].TD[1]”」となっている。これは、「http://www.xxx.ne.jp.index.html」で提供されるHTML文書データの4番目の表(TABLE[3])の第3列(TR[2])の左から2番目のセル(TD[1])を指定した例となっている。クライアントサイドスクリプトを動作させることによって、このようなDOMツリー情報を取得する(非特許文献『JavaScript(登録商標):The Definitive Guide,Fourth Edition』CHAPTER17 the Document Object Model,pp.274-313, O’Reilly & Associates,Inc(米国))。
画面はフレームによって左右に区切られ、画面左部にはウェブページが表示されており、画面右部には第1のドロップダウンリスト、リンクの一覧が表示されている。リンクの一覧には、上記DOMツリー情報「HTML[0].BODY[0].TABLE[3].TR[2].TD[1]」が示すHTML要素が含むリンク「自動車&バイク」、「旅行」、「住宅・不動産」、「求人&転職」、「進学&資格」、「恋愛&結婚」が表示されている(ステップS303)。
なお、上記で編集者が選択する抽出部分選択情報は、同一のHTML文書データから複数の範囲箇所を選択しても良い。同一のHTML文書データから複数の範囲箇所を選択する場合のフローチャートを、図4に示す。編集者が抽出部分選択情報を選択する処理は上記に示した通りであり、同様の処理・用語については説明を省略する。
編集者が抽出部分選択情報を選択する情報を入力する(ステップS401)と、部分指定部113は、抽出部分指定画面を表示する。上記で説明したように、編集者が「IDで指定」と、「コメントで指定」と、「DOMで指定」とから選択方法を選ぶ(ステップS402、ステップS411)。「DOMで指定」を選択した場合は、画面左部からマウスポインタにて選択範囲箇所を指定する(ステップS403、ステップS404)。編集者は画面表示から選択領域を確認し(ステップS405)、必要があれば選択領域の拡大・縮小を行う(ステップS412)。
また、編集者が「IDで指定」または「コメントで指定」を選択した場合には、それに対応する要素をドロップダウンリストから選択(ステップS411)すると、部分指定部113は、指定領域を表示させる(ステップS413)。
編集者が選択領域を決定する情報を入力すると、部分指定部113は、選択範囲箇所が含むリンクを抽出する。選択範囲箇所にリンクが存在しない場合は、選択エラーとして、もう一度抽出部分指定画面を表示させても良い(ステップS409)。
編集者はさらに範囲箇所を選択するか否かの情報を入力し、部分指定部113は、選択を行う情報を受信した場合にはもう一度抽出部分指定画面を表示させ、選択を終了する情報を受信すれば、本ステップを完了する。
部分情報保存部114は、上記でRSS文書データ化対象URL情報と抽出部分選択情報とが決定すると、RSS文書データ化対象URL情報と抽出部分選択情報とを部分情報記憶部121に送信し、記憶させる(ステップS304)。
部分情報記憶部121にRSS文書データ化対象URL情報と抽出部分選択情報とが記憶されると、部分抽出部123は、部分情報記憶部121からRSS文書データ化対象URL情報と抽出部分選択情報とを読み出し、RSS文書データ化対象URL情報に対応するURLにアクセスし、HTML文書データを取得する。また、部分抽出部123は、抽出部分選択情報がタグID情報である場合には、対応するタグIDを有するタグが含む情報をHTML部分情報として検出する。あるいは、抽出部分選択情報がコメントタグ情報かDOMツリー情報である場合には、それに対応するHTML部分情報を検出する(ステップS305)。あるいは、また、部分抽出部123は、上記HTML部分情報が含むリンク情報を検出する(ステップS306)。
部分抽出部123がHTML部分情報とリンク情報とを検出すると、RSS生成部124は、HTML部分情報とリンク情報とからRSS文書データを生成する(ステップS307)。
図12は、上記で選択したリンクからRSS文書データを生成する例である。図12(d)に示すのは、RSS文書データ化対象URLと、RSS文書データ化対象URLから取得したHTML文書データのページタイトルと、RSS文書データ化対象URLから取得したHTML文書データから抽出部分選択情報に従って抽出したリンクである。
これら図12(d)に示す情報から、RSS文書データを生成した例が、図12(e)である。
部分抽出部123がRSS文書データを生成すると、RSS保存部125は、RSS文書データ識別情報を生成し、これに上記生成したRSS文書データ情報を対応付けてRSS記憶部126に保存する(ステップS308)。
次に、図5のフローチャートを参照して、RSS記憶部126に記憶された情報を更新する動作例について説明する。
部分抽出部123は、システム管理者が定めた一定の時間間隔で、例えば10分間隔で定期的に、部分情報記憶部121からRSS文書データ化対象URL情報と抽出部分選択情報とを読み出し、RSS文書データ化対象URL情報に対応するURLにアクセスし、HTML文書データを取得する(ステップS501)。上記システム管理者が定めた一定の時間間隔は、RSS記憶部126の情報を最新に保つためにはより短い間隔であることが望ましいが、ネットワーク負荷状態や、利用者からの更新対象となるURLへの参照頻度などを考慮して設定して良い。
また、部分抽出部123は、抽出部分選択情報に対応するHTML部分情報を検出する(ステップS502)。次に、部分抽出部123は、上記HTML部分情報が含むリンク情報を検出する(ステップS503)。
部分抽出部123がHTML部分情報とリンク情報とを検出すると、RSS生成部124は、ステップS307と同様に、HTML部分情報とリンク情報とからRSS文書データを生成する(ステップS504)。
部分抽出部123がRSS文書データを生成すると、RSS保存部125は、RSS記憶部126から上記生成したRSS文書データに対応するRSS文書データ識別情報を検出し、これに上記生成したRSS文書データ情報を対応付けてRSS記憶部126に保存し、情報を更新する(ステップS505)。
次に、図6のフローチャートを参照して、編集者端末301が一または複数のRSS文書データからレイアウト制御HTML文書データを生成する動作例について説明する。
URL指定部211は、レイアウト制御対象URL入力画面を編集者端末301のディスプレイに表示させる。レイアウト制御対象URL入力画面は表示レイアウトを設定するRSS文書データを配信するURLの入力を受け付ける画面であり、例えば、RSS文書データ配信URL文字列を入力可能なテキストボックスを有する。または、複数のRSS文書データ配信URLの一覧を表示し、その中から任意のRSS文書データ配信URLを選択可能な画面などでも良い。編集者は、入力デバイスを利用して、RSS文書データ配信URL情報を文字列で上記テキストボックスに入力する(ステップS601、ステップS602)。
上記RSS文書データ配信URL情報の入力が完了すると、RSS取得部212は、対応するRSS文書データ配信URLにアクセスし、RSS文書データを受信する(ステップS603)。RSS取得部212がRSS文書データを受信すると、RSS表示部213は、RSS文書データを組み込んだレイアウト編集画面を生成し、編集者端末301が有するディスプレイに表示させる(ステップS604)。
レイアウト編集画面は、RSS文書データが含む記事タイトルと、記事概要との情報を有する。
レイアウト編集画面では、例えば、設定対象とするRSS文書データをマウスポインタで選択すると、対応するレイアウト設定画面を表示する。レイアウト設定画面では、例えば、複数のRSS文書データがある場合はその上下の表示順序、記事の背景色、記事の文字色、記事概要表示の有無、記事概要の文字色、更新日時表示の有無、更新時刻の文字色、RSS文書タイトルの背景色、RSS文書タイトルの文字色、RSS文書データの枠表示の有無などの設定項目を有する。また、背景に表示させる画像ファイルを登録できるようにしても良い。レイアウト設定画面は、RSS文書データごとに設定可能としても良い。また、複数のRSS文書データがある場合の表示順序は、ドラッグ&ドロップ操作で変更が可能な構成としても良い。(ステップS605)
図13は、レイアウト編集画面の画面例である。図13では、第1、第2、第3のRSS文書データが表示されており、第2のRSS文書データがマウスポインタによって選択され、第2のRSS文書データに対応するレイアウト設定画面が表示されている。
編集者は、複数のRSS文書データをレイアウトに組み込む場合には、ステップS601からステップS605までの動作を繰り返し、複数のRSS文書データのレイアウトを設定しても良い。
レイアウト情報保存部215は、編集者がレイアウト設定を完了した情報を受信すると、設定した上記設定項目情報をレイアウト制御HTML文書データとして、レイアウト情報記憶部221に送信し、保存させる(ステップS607)。
次に、図7のフローチャートを参照して、利用者端末303がHTML文書データとRSS文書データとを取得する動作例について説明する。
レイアウト情報取得部232は、HTML配信部222にHTML文書データ要求情報を送信する。HTML配信部222は、HTML文書データ要求情報を受信すると、HTML文書データ要求情報から利用者端末303を識別し、レイアウト情報記憶部221から対応するレイアウト制御HTML文書データを読み出してHTML配信部222に送信する。
レイアウト情報取得部232は、上記レイアウト制御HTML文書データを受信すると(ステップS701)、レイアウト制御HTML文書データが含むレイアウト制御プログラムを実行する。
レイアウト制御プログラムは、レイアウト制御HTML文書データからRSS文書データを検出(ステップS702)すると、対応するURLにアクセスし(ステップS703)、RSS文書データを取得する(ステップS704)。また、レイアウト制御プログラムは、取得したRSS文書データを、レイアウト制御HTML文書データの情報に従って表示部234に表示させる(ステップS705)。
図14は、3通りのRSS文書データを含むレイアウト制御HTML文書データを表示した画面例である。
次に、レイアウト制御プログラムは、レイアウト制御HTML文書データがRSS文書データを複数含む場合には、検出した全てのRSS文書データについてステップS703からステップS705の処理を行う。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、様々な変更・応用が可能である。
以上のように、本発明による情報提供方法によれば、インターネット上で閲覧可能に提供されるHTML文書データの必要部分を指定してRSS文書データ化し、生成されたRSS文書データに加えてインターネット上で閲覧可能に提供される複数のRSS文書データを取り込んで生成されるHTML文書データのレイアウトなどを自在に利用者側で設定し、個々の利用者に特化されたRSS文書データやHTML文書データを提供することが可能となるため、個々の利用者のニーズに適切に応えることができる。
なお、図1における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによりウェブ文書データ提供を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
本発明の一実施形態を示すブロック図である。 従来技術におけるRSS生成を説明する図である。 本発明によりHTMLの任意の範囲箇所を選択するフローチャートである。 本発明によりHTMLの任意の範囲箇所を選択するフローチャートである。 本発明によりRSS生成を行うフローチャートである。 本発明により複数のRSSからHTMLを生成するフローチャートである。 本発明におり提供するHTMLのレイアウト制御を行うフローチャートである。 本発明によりHTML部分の選択を行う画面例である。 本発明によりHTML部分の選択を行う画面例である。 本発明によりHTML部分の選択を行う画面例である。 DOMツリーの説明図である。 本発明により抽出されたリンクとこれに基づいて生成されるRSS文書の例である。 本発明によるレイアウト編集の画面例である。 本発明により生成されるHTMLの画面例である。
符号の説明
110 部分情報決定部
111 URL指定部
112 ページ取得部
113 部分指定部
114 部分情報保存部
120 RSS提供部
121 部分情報記憶部
122 HTML取得部
123 部分抽出部
124 RSS生成部
125 RSS保存部
126 RSS記憶部
127 RSS配信部
210 レイアウト情報決定部
211 URL指定部
212 RSS取得部
213 RSS表示部
214 レイアウト指定部
215 レイアウト情報保存部
220 レイアウト情報制御部
221 レイアウト情報記憶部
222 HTML配信部
230 レイアウト表示部
231 RSS取得部
232 レイアウト情報取得部
233 レイアウト部
234 表示部
301 編集者端末
302 ウェブサーバ
303 利用者端末

Claims (15)

  1. インターネット上で提供される任意のHTML文書データの任意の範囲箇所を抽出して、RSS文書データを生成し提供するウェブ文書データ提供装置であって、
    インターネット上で提供される任意の前記HTML文書データのURLを指定するURL指定手段と、
    前記URLから前記HTML文書データを取得するHTML取得手段と、
    前記HTML文書データの任意の範囲箇所を指定する部分指定手段と、
    前記URLと、前記範囲箇所とを記憶する部分情報保存手段と、
    前記HTML文書データの任意の範囲箇所に含まれるリンク情報を抽出するリンク抽出手段と、
    前記リンク情報をまとめてRSS文書データを生成するRSS生成手段と、
    前記RSS文書データを保存するRSS文書保存手段と
    を有することを特徴とするウェブ文書データ提供装置。
  2. 前記部分指定手段は、前記HTML文書データ中のコメントタグ情報を検出することによって範囲箇所を指定する
    ことを特徴とする請求項1に記載のウェブ文書データ提供装置。
  3. 前記部分指定手段は、前記HTML文書データ中のHTML要素のID情報を検出することによって範囲箇所を指定する
    ことを特徴とする請求項1に記載のウェブ文書データ提供装置。
  4. 前記部分指定手段は、前記HTML文書データ中のHTML要素のタグ情報を検出することによって範囲箇所を指定する
    ことを特徴とする請求項1に記載のウェブ文書データ提供装置。
  5. インターネット上で提供される一または複数のRSS文書データをまとめて表示するHTML文書データを提供するウェブ文書データ提供装置であって、
    インターネット上で提供される一または複数の任意の前記RSS文書データのURLを指定するURL指定手段と、
    前記URLからRSS文書データを収得するRSS取得手段と、
    一または複数の前記RSS文書データをまとめたHTML文書データを生成するRSS表示手段と、
    前記HTML文書データが含む一または複数のRSS文書データ情報の、少なくとも表示位置と表示スタイルとの編集を行う表示設定手段と
    を有することを特徴とするウェブ文書データ提供装置。
  6. インターネット上で提供される任意のHTML文書データの任意の範囲箇所を抽出して、RSS文書データを生成し提供するウェブ文書データ提供方法であって、
    インターネット上で提供される任意の前記HTML文書データのURLを指定するURL指定ステップと、
    前記URLから前記HTML文書データを取得するHTML取得ステップと、
    前記HTML文書データの任意の範囲箇所を指定する部分指定ステップと、
    前記URLと、前記範囲箇所とを記憶する部分情報保存ステップと、
    前記HTML文書データの任意の範囲箇所に含まれるリンク情報を抽出するリンク抽出ステップと、
    前記リンク情報をまとめてRSS文書データを生成するRSS生成ステップと、
    前記RSS文書データを保存するRSS文書保存ステップと
    を有することを特徴とするウェブ文書データ提供方法。
  7. 前記部分指定ステップは、前記HTML文書データ中のコメントタグ情報を検出することによって範囲箇所を指定する
    ことを特徴とする請求項6に記載のウェブ文書データ提供方法。
  8. 前記部分指定ステップは、前記HTML文書データ中のHTML要素のID情報を検出することによって範囲箇所を指定する
    ことを特徴とする請求項6に記載のウェブ文書データ提供方法。
  9. 前記部分指定ステップは、前記HTML文書データ中のHTML要素のタグ情報を検出することによって範囲箇所を指定する
    ことを特徴とする請求項6に記載のウェブ文書データ提供方法。
  10. インターネット上で提供される一または複数のRSS文書データをまとめて表示するHTML文書データを提供するウェブ文書データ提供方法であって、
    インターネット上で提供される一または複数の任意の前記RSS文書データのURLを指定するURL指定ステップと、
    前記URLからRSS文書データを収得するRSS取得ステップと、
    一または複数の前記RSS文書データをまとめたHTML文書データを生成するRSS表示ステップと、
    前記HTML文書データが含む一または複数のRSS文書データ情報の、少なくとも表示位置と表示スタイルとの編集を行う表示設定ステップと
    を有することを特徴とするウェブ文書データ提供方法。
  11. インターネット上で提供される任意のHTML文書データの任意の範囲箇所を抽出して、RSS文書データを生成し提供するウェブ文書データ提供システムであって、
    インターネット上で提供される任意の前記HTML文書データのURLを指定するURL指定手段と、
    前記URLから前記HTML文書データを取得するHTML取得手段と、
    前記HTML文書データの任意の範囲箇所を指定する部分指定手段と、
    前記URLと、前記範囲箇所とを記憶する部分情報保存手段と、
    前記HTML文書データの任意の範囲箇所に含まれるリンク情報を抽出するリンク抽出手段と、
    前記リンク情報をまとめてRSS文書データを生成するRSS生成手段と、
    前記RSS文書データを保存するRSS文書保存手段と
    を有することを特徴とするウェブ文書データ提供システム。
  12. 前記部分指定手段は、前記HTML文書データ中のコメントタグ情報を検出することによって範囲箇所を指定する
    ことを特徴とする請求項11に記載のウェブ文書データ提供システム。
  13. 前記部分指定手段は、前記HTML文書データ中のHTML要素のID情報を検出することによって範囲箇所を指定する
    ことを特徴とする請求項11に記載のウェブ文書データ提供システム。
  14. 前記部分指定手段は、前記HTML文書データ中のHTML要素のタグ情報を検出することによって範囲箇所を指定する
    ことを特徴とする請求項11に記載のウェブ文書データ提供システム。
  15. インターネット上で提供される一または複数のRSS文書データをまとめて表示するHTML文書データを提供するウェブ文書データ提供システムであって、
    インターネット上で提供される一または複数の任意の前記RSS文書データのURLを指定するURL指定手段と、
    前記URLからRSS文書データを収得するRSS取得手段と、
    一または複数の前記RSS文書データをまとめたHTML文書データを生成するRSS表示手段と、
    前記HTML文書データが含む一または複数のRSS文書データ情報の、少なくとも表示位置と表示スタイルとの編集を行う表示設定手段と
    を有することを特徴とするウェブ文書データ提供システム。
JP2006309132A 2006-11-15 2006-11-15 ウェブ文書データ提供装置、方法、およびシステム Pending JP2008123425A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006309132A JP2008123425A (ja) 2006-11-15 2006-11-15 ウェブ文書データ提供装置、方法、およびシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006309132A JP2008123425A (ja) 2006-11-15 2006-11-15 ウェブ文書データ提供装置、方法、およびシステム

Publications (1)

Publication Number Publication Date
JP2008123425A true JP2008123425A (ja) 2008-05-29

Family

ID=39508087

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006309132A Pending JP2008123425A (ja) 2006-11-15 2006-11-15 ウェブ文書データ提供装置、方法、およびシステム

Country Status (1)

Country Link
JP (1) JP2008123425A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010238125A (ja) * 2009-03-31 2010-10-21 Fujitsu Ltd 抽出条件生成プログラム、抽出条件生成装置、および抽出条件生成方法
CN102456050A (zh) * 2010-10-27 2012-05-16 中国移动通信集团四川有限公司 从网页中抽取数据的方法和装置
JP2012512487A (ja) * 2008-12-17 2012-05-31 マイクロソフト コーポレーション コンテンツをネットワーク上で自動的にシンジケートする技術
JP2014235631A (ja) * 2013-06-04 2014-12-15 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Rdf表現の生成方法、プログラム、及びシステム
JP2016149117A (ja) * 2015-10-13 2016-08-18 株式会社 ディー・エヌ・エー アンカー生成表示システム、送信端末、装置、及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006139470A (ja) * 2004-11-11 2006-06-01 Nippon Telegraph & Telephone East Corp 情報提供装置および情報提供方法ならびにそのプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006139470A (ja) * 2004-11-11 2006-06-01 Nippon Telegraph & Telephone East Corp 情報提供装置および情報提供方法ならびにそのプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012512487A (ja) * 2008-12-17 2012-05-31 マイクロソフト コーポレーション コンテンツをネットワーク上で自動的にシンジケートする技術
US8924471B2 (en) 2008-12-17 2014-12-30 Microsoft Corporation Techniques to automatically syndicate content over a network
US9467503B2 (en) 2008-12-17 2016-10-11 Microsoft Technology Licensing, Llc Techniques to automatically syndicate content over a network
US10075546B2 (en) 2008-12-17 2018-09-11 Microsoft Technology Licensing, Llc Techniques to automatically syndicate content over a network
JP2010238125A (ja) * 2009-03-31 2010-10-21 Fujitsu Ltd 抽出条件生成プログラム、抽出条件生成装置、および抽出条件生成方法
CN102456050A (zh) * 2010-10-27 2012-05-16 中国移动通信集团四川有限公司 从网页中抽取数据的方法和装置
JP2014235631A (ja) * 2013-06-04 2014-12-15 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Rdf表現の生成方法、プログラム、及びシステム
JP2016149117A (ja) * 2015-10-13 2016-08-18 株式会社 ディー・エヌ・エー アンカー生成表示システム、送信端末、装置、及びプログラム

Similar Documents

Publication Publication Date Title
US9900297B2 (en) System, method and apparatus for selecting content from web sources and posting content to web logs
US9064028B2 (en) Custom rendering of webpages on mobile devices
JP5505671B2 (ja) 更新通知方法及びブラウザ
JP5233220B2 (ja) ページ付加情報共有管理方法
US10769216B2 (en) Data acquisition method, data acquisition apparatus, and recording medium
JP2008226202A (ja) 情報処理装置および方法、並びにプログラム
JP2012133515A (ja) 情報処理装置、情報処理方法、プログラム、情報処理システム
US20050149853A1 (en) Document display program and method
JP2008123425A (ja) ウェブ文書データ提供装置、方法、およびシステム
JP2000067038A (ja) ホームページ作成装置
JP4859873B2 (ja) コメント表示システム、その方法、管理サーバおよびプログラム
JP5887971B2 (ja) ポートレット処理装置、ポータルサーバ、ポータルシステム、ポートレット処理方法、および、コンピュータ・プログラム
JP2008071116A (ja) 情報配信システム、情報配信装置、情報配信方法および情報配信用プログラム
JPH10307845A (ja) 閲覧支援装置およびその方法
JP4995152B2 (ja) 情報処理装置、情報処理方法、及び、情報処理プログラム
JP2008287383A (ja) リンク先情報表示装置,リンク先情報表示方法,その方法を実装したリンク先情報表示プログラム及びそのプログラムを格納した記録媒体
JP4204608B2 (ja) ウェブテキスト抽出装置、方法及びプログラム
JP2008046879A (ja) ページ表示装置、ページ表示方法、およびコンピュータプログラム
JP2011128970A (ja) ウェブページ作成支援装置、ウェブページ作成支援方法、コンピュータプログラム
JP2011192223A (ja) クライアント装置、表示方法、プログラム、情報処理装置、及び情報処理システム
JP5276903B2 (ja) 閲覧システム、プラグインプログラム、ならびに、紹介プログラム
JP2007102693A (ja) データ管理システム、データ管理装置、データ管理方法、データ管理プログラムおよびそれを記録した記録媒体
CN112364270B (zh) 一种网页元素收纳方法、电子设备及存储介质
US9189555B2 (en) Displaying customized list of links to content using client-side processing
JP5230717B2 (ja) 情報処理システム、情報処理方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110329

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110726