JP4901985B2 - 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法 - Google Patents

関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法 Download PDF

Info

Publication number
JP4901985B2
JP4901985B2 JP2010183953A JP2010183953A JP4901985B2 JP 4901985 B2 JP4901985 B2 JP 4901985B2 JP 2010183953 A JP2010183953 A JP 2010183953A JP 2010183953 A JP2010183953 A JP 2010183953A JP 4901985 B2 JP4901985 B2 JP 4901985B2
Authority
JP
Japan
Prior art keywords
web page
server
text
feature word
web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010183953A
Other languages
English (en)
Other versions
JP2011138478A5 (ja
JP2011138478A (ja
Inventor
裕 石上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TAGGY Inc
Original Assignee
TAGGY Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TAGGY Inc filed Critical TAGGY Inc
Priority to JP2010183953A priority Critical patent/JP4901985B2/ja
Publication of JP2011138478A publication Critical patent/JP2011138478A/ja
Publication of JP2011138478A5 publication Critical patent/JP2011138478A5/ja
Application granted granted Critical
Publication of JP4901985B2 publication Critical patent/JP4901985B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は,関連するウェブページ内コンテンツを分類・整理して表示する方法に関する。より詳しく説明すると,キーワード検索やカテゴリー検索などでヒットする関連するウェブページ内のコンテンツをあらかじめ属性ごとに分類し整理しておき,その上で関連するウェブページへのリンクと,整理したコンテンツとを自由自在に再構成して表示するための方法に関する。
特開2009−87106号公報には,インターネット情報提供システムが開示されている。このようにある検索語と関連した複数のウェブページ又はウェブページのリンクを表示する方法は,既に知られている。
特開2009−87106号公報
また,たとえば,ある企業のウェブサイトであっても,複数のコンテンツを有しており,それぞれのコンテンツに対応したウェブページを有しているものがある。そのような場合も,その企業のウェブサイトにおいて,検索を用いることで,コンテンツを抽出して,リンク表示を行うことができる。
しかしながら,そのようなリンク表示は,テキスト情報の羅列であり,メリハリがない。また,テキストのみのリンク表示は,ユーザフレンドリーではなく,すべての文字を読まなければ,適切なリンク先を検討できない。
このため,せっかくユーザがあるコンテンツに興味を持つ可能性があって,しかも複数のリンクが表示されていても,ユーザが実際にそのコンテンツにアクセスしない可能性が高いという問題がある。
そこで,本発明は,関連するウェブページ内コンテンツを分類・整理して自由自在に再構成して表示することで,ユーザのアクションを促進させる方法を提供することを目的とする。
本発明は,複数の関連ウェブページ内のコンテンツを分類・整理して自由自在に再構成して表示するための方法に関する。
この方法では,サーバが,複数の関連ウェブページ内のコンテンツをテキスト,及び画像に分類して,各関連ウェブページのテキスト及び画像の配置を把握する(ウェブ内配置把握工程)。
サーバが,ウェブ内配置把握工程で把握したテキスト及び画像の配置に基づいて,各関連ウェブページを複数の区分に分割する(ウェブ分割工程)。
サーバが,ウェブ分割工程で分割した各関連ウェブページの区分ごとに,当該区分に含まれるテキストに基づいて当該区分の特徴語を抽出する(特徴語抽出工程)。
サーバが,特徴語抽出工程で抽出した各関連ウェブページの区分ごとの特徴語を整理する(特徴語整理工程)。
サーバが,特徴語整理工程で整理した特徴語に基づいて,特徴語に関連したテキスト及び当該特徴語に関連した画像を整理する(表示情報整理工程)。
そして,サーバが,サーバと通信回線を介して接続された端末に,表示情報整理工程で整理された特徴語に関連したテキスト及び整理された特徴語に関連した画像を,複数の関連ウェブページへのリンクとともに表示させる(関連ウェブページ表示工程)。
このように本発明の方法は,ウェブページ内の情報をコンテンツ単位で属性ごとに整理することで,これらのコンテンツを自由自在に再構成して表示させることができる。
本発明の好ましい態様は,関連ウェブページが,インターネットを用いたウェブ検索により関連するとされたウェブページである。
従来,インターネットを用いた関連サイト検索は,入力されたキーワードを用いて,そのキーワードが含まれるか,キーワードと類似度の高い語が含まれるウェブページを機械的に検索するものであった。このため,機械はそのキーワードの意義を理解できないため,そのキーワードと関連の高いサイトが必ずしも検索にヒットしない。また,検索結果の表示リストは,テキスト情報の羅列であり一義的であった。このため,ユーザの欲しい情報を直接表示することができなかった。たとえば,関連ウェブサイト内の画像として,ユーザがそれを見たときに大変興味を引くであろうものがあったとする。従来の関連サイト検索では,検索結果を示す画面にそのようなウェブサイトの運営者が自由自在に設定した要求に関する画像は含まれていない。このためせっかくユーザが興味を持つと考えられるサイトが存在しても,ユーザがそのサイトへアクセスしないという事態が生じた。
そこで,この態様では,サイト検索結果を表示する際に,ウェブサイトの運営者からのリクエストに応じたコンテンツをも自由自在に再構成して表示する。
本発明の好ましい態様は,複数の関連ウェブページの全ては,あるウェブサイトに含まれるウェブページであり,特徴語抽出工程で抽出した特徴語をあるウェブサイトのトップページに検索インデックスとして追加する工程を含むものである。すると,トップページに含まれる検索インデックスをユーザが選択すると,特徴語に関連したリンク表示が自動的に生成される。
この機能を用いることで,たとえば,ウェブサイトの運営者が,ある特集ページを編集する場合,自由自在にそのコンテンツを指定することができる。そして,そのコンテンツを示す特徴語を検索インデックスとすることで,その検索インデックスに関連したウェブページのリンクを表示することができるとともに,そのリンクされたウェブページに割り当てられたスペースに掲載するコンテンツを自由自在に設計できる。このシステムは,その検索インデックスと関連したリンク表示画面が固定されているものではない。このため,あるウェブサイトに関連したウェブページが追加された場合,その追加されたウェブページをもあわせて解析するため,検索インデックスに関連したウェブページのリンクを表示する際に,自動的に追加されたウェブページをも考慮することができることとなる。
本発明の好ましい別の態様は,特徴語としてタグを用いるものである。そして,この態様では,ウェブページ内のコンテンツにはタグが振られている。そして,そのタグを用いて,端末に表示されるコンテンツを整理する。その上で,テキストやそのコンテンツへのリンクのみならず,たとえば,そのコンテンツに関連した画像をも合わせて端末が表示する。
この態様の方法は,複数の関連ウェブページ内のコンテンツを整理して表示するための方法である。そして,各関連ウェブページ内の各コンテンツは,タグが付与されたものである。複数の関連ウェブページの例は,ウェブ検索により関連するとされたウェブページである。
サーバが,複数の関連ウェブページ内のコンテンツについてタグを用いて,各関連ウェブページのテキスト及び画像の配置を把握する(ウェブ内配置把握工程)。
サーバが,ウェブ内配置把握工程で把握したテキスト及び画像の配置に基づいて,各関連ウェブページを複数の区分に分割する(ウェブ分割工程)。
サーバが,特徴語抽出工程で抽出した各関連ウェブページの区分ごとのタグを整理する(特徴語整理工程)。
サーバが,特徴語整理工程で整理したタグに基づいて,タグに関連したテキスト及び当該タグに関連した画像を整理する(表示情報整理工程)。
サーバが,サーバと通信回線を介して接続された端末に,表示情報整理工程で整理されたタグに関連したテキスト及び整理されたタグに関連した画像を,複数の関連ウェブページへのリンクとともに表示する(関連ウェブページ表示工程)。
本発明によれば,関連するウェブページ内コンテンツを分類・整理して自由自在に再構成して表示する方法を提供することができる。
図1は,本発明の方法を実現するためのフローチャートである。 図2は,本発明の方法を実現するためのシステムのブロック図である。 図3は,サーバの基本構成を示す機能ブロック図である。 図4は,関連ウェブページの例を示す図である。 図5は,あるウェブサイトを区分に分割した例を示す図である。 図6は,本発明のシステムを導入する前の○○ハウス社のウェブサイトを示す。 図7は,本発明のシステムを導入した後の○○ハウス社のウェブサイトを示す。 図8は,本発明のシステムを導入する前の○×○×のウェブサイトを示す。 図9は,本発明のシステムを導入した後の○×○×のウェブサイトを示す。
以下,本発明を実施するための形態について説明する。本発明の第1の側面は,複数の関連ウェブページ内のコンテンツを分類・整理して自由自在に再構成して表示するための方法に関する。図1は,本発明の方法を実現するためのフローチャートである。図1中Sはステップを意味する。図1に示されるとおり,この方法は,ウェブ内配置把握工程(ステップ101),ウェブ分割工程(ステップ102),特徴語抽出工程(ステップ103),特徴語整理工程(ステップ104),表示情報整理工程(ステップ105),関連ウェブページ表示工程(ステップ106)を含む。
図2は,本発明の方法を実現するためのシステムのブロック図である。図2に示されるとおり,本発明のシステム1は,本発明のシステムを実装するサーバ2を含む。サーバ2とクライアント3およびサーバ4とはインターネットなどの通信回線を介して接続されている。なお,通常,クライアント3およびサーバ4は複数である。
そして,サーバ2は,入出力部11,制御部12,演算部13,記憶部14を有しており,それらの要素はバス15などで接続されており,情報の授受を行うことができるようにされている。すなわち,入出力部11から所定の情報が入力されると,制御部12は,記憶部14のメインメモリに格納されている制御プログラムを読み出す。そして,制御部12は,制御プログラムの指令に従って,適宜記憶部14に記憶されたデータを読み出し,演算部13にて所定の演算を行う。そして,演算結果を記憶部14に一時的に記憶して,入出力部11から出力する。この構成は,クライアント3およびサーバ4も同様である。
図3は,サーバ2の基本構成を示す機能ブロック図である。図3に示されるとおり,サーバ2は,ウェブ内配置把握手段21,ウェブ分割手段22,特徴語抽出手段23,特徴語整理手段24,表示情報整理手段25,及び関連ウェブページ表示手段26を有する。
ウェブ内配置把握手段21は,関連するとされた複数の関連ウェブページ内のコンテンツをテキスト,及び画像に分類して,各関連ウェブページのテキスト及び画像の配置を把握するための手段である。
ウェブ分割手段22は,ウェブ内配置把握手段が把握したテキスト及び画像の配置に基づいて,各関連ウェブページを複数の区分に分割するための手段である。
特徴語抽出手段23は,ウェブ分割手段が分割した各関連ウェブページの区分ごとに,当該区分に含まれるテキストに基づいて当該区分の特徴語を抽出するための手段である。
特徴語整理手段24は,特徴語抽出手段が抽出した各関連ウェブページの区分ごとの特徴語を整理するための手段である。
表示情報整理手段25は,特徴語整理手段が整理した特徴語に基づいて,特徴語に関連したテキスト及び当該特徴語に関連した画像を整理するための手段である。
関連ウェブページ表示手段26は,サーバ2と通信回線を介して接続された端末に,表示情報整理手段で整理された特徴語に関連したテキスト及び整理された特徴語に関連した画像を,複数の関連ウェブページへのリンクとともに表示させるための情報を整えるための手段である。
次に,実施例を用いて,本発明の第1の側面に関する複数の関連ウェブページ内のコンテンツを整理して表示するための方法について説明する。
以下の例では,○○ハウス社のウェブサイトを例に説明する。○○ハウス社のサーバ4は,○○ハウス社の複数のウェブページを含んでいる。それぞれのウェブページは,サーバ4内のデータベースに格納されている。
あるユーザのクライアント3は,サーバ2およびサーバ4と通信回線を介して接続されている。たとえば,ユーザが○○ハウス社のウェブサイトにアクセスする。そして,中古マンション,地域,価格帯を選択したとする。この情報は,ユーザのクライアント3からサーバ2へと伝えられる。
サーバ2は,クライアント3から受け取ったウェブ検索に用いる情報(中古マンション,地域,価格帯に関する情報)を用いて,サーバ2内のデータベースを検索する。サーバ2は,クライアント3がそれらのウェブページやウェブページへのリンク情報を検索結果として表示できるように,サーバ4と接続する○○ハウス社のウェブサイトから情報をあらかじめ集約し,サーバ2のデータベースに格納している。
図4は,関連ウェブページの例を示す図である。
通常,ウェブページは,ウェブページを作成するための言語により作成されている。そして,テキスト及び画像については,異なるタグが振られている。このため,例えば,タグの出現位置を把握することで,ウェブページ内のコンテンツをテキスト,及び画像に分類することができ,しかも関連ウェブページのテキスト及び画像の配置を把握することができる。
具体的に説明すると,ウェブ内配置把握手段21が,サーバ4と接続するウェブサイトから,関連ウェブページを読み出す。そして,ウェブ内配置把握手段21が,関連ウェブページに振られたタグを用いて,関連ウェブページを構成するコンテンツをテキスト,及び画像に分類する。これにより,ウェブ内配置把握手段21は,関連ウェブページのテキスト及び画像の配置を把握する(ステップ101)。なお,この配置情報は手入力によって修正されてもよい。この場合,入力された情報をサーバが受け取り,適宜情報処理を行えばよい。
ウェブ分割手段22が,ウェブ内配置把握手段が把握したテキスト及び画像の配置に基づいて,各関連ウェブページを複数の区分に分割する(ステップ102)。
たとえば,画像にはその付近の位置に画像を説明する文章が付されている。よって,画像がどのような属性のものであるか把握するためにウェブページを複数の区分に分割する。また,タイトルと本文とでは,フォントの大きさが異なっていたり,フォントの色が異なる場合がある。たとえば,フォントの大きさやフォントの色は,ウェブページを作成する言語におけるタグにより区別される。このため,タグを解析することで,フォントの相違を把握することができる。このようにして,ウェブページを複数の区分に分割することができる。また,この区分情報は手入力によって修正されてもよい。この場合,入力された情報をサーバが受け取り,適宜情報処理を行えばよい。
図5は,あるウェブサイトを区分に分割した例を示す図である。図中符号31は,分割れた区分を示す。
特徴語抽出手段23が,ウェブ分割手段が分割した各関連ウェブページの区分ごとに,当該区分に含まれるテキストに基づいて当該区分の特徴語を抽出する(ステップ103)。
この特徴語がテキストに含まれており,テキストから特徴語が抽出されても良い。サーバ2の特徴語データベースを用いて,テキストに含まれていない語が特徴語として特徴語データベースから抽出されても良い。またこの特徴語は手入力によって抽出,追加されてもよい。この場合,入力された情報をサーバが受け取り,適宜情報処理を行えばよい。
サーバ2の特徴語データベースは,たとえば,ある単語と関連する特徴語とを関連付けて記憶したデータベースである。たとえば,ある単語(8畳,100平米)と関連付けて特徴語「間取り」が記憶されている。テキストを複数の単語群に分割する方法は既に知られている。そこで,特徴語抽出手段23は,区分に含まれるテキストを単語に分ける。そして,単語ごとに特徴語データベースへアクセスして,特徴語を抽出する。このようにすることで,その区分がどのような特徴語と関連しているかを把握できる。また,テキストから,どのような情報と関連しているかについて特徴語を推奨することができる。これによりテキストに用いられる単語によらず,その区分の属性を適切に把握できる。属性の例は,「間取り図」である。またこの属性情報は手入力によって修正されてもよい。この場合,入力された情報をサーバが受け取り,適宜情報処理を行えばよい。
上記のようにすることで,各関連ウェブページを区分に分割し,区分ごとの属性を把握できる。属性の例は,タイトル(マンション名),最寄り駅,最寄り駅からの近さ,家賃,間取り情報,間取り図,屋内写真,及び建物外観である。
また,ウェブページごとに,最小コンテンツ単位に分割して,それぞれを特徴語と関連付けてサーバ2のデータベースに記憶させることができる。このような最小コンテンツ単位(区分)の例は,カテゴリー,タイトル,商品名,価格,本文,画像,投稿者名,コメント,評価,家賃,最寄り駅,最寄り駅からの近さ,家賃,間取り情報,間取り図,屋内写真,及び建物外観などである。
特徴語整理手段24は,特徴語抽出手段が抽出した各関連ウェブページの区分ごとの特徴語を整理する(ステップ104)。たとえば,ウェブサイトの運営者が,マンション名,家賃,最寄り駅,間取り図,屋内写真を検索結果に表示することを希望したとする。本発明は,固定化されたリンク表示を行うのではなく,関連ウェブページを分析・把握した上で,関連ウェブページへのリンク画面を表示する。このため,本発明によれば,関連ウェブページから抽出する内容を自由自在に調整することができる。すると,サーバ2は,各関連ウェブページに含まれるマンション名,家賃,最寄り駅,間取り図,及び屋内写真に関する情報を各関連ウェブページと関連させて抽出する。その上で,サーバ2は,ウェブページ1画面に5つのウェブページへのリンクと関連情報を表示させるための整理を行う。この整理には,画像の大きさ,情報の割り当てが含まれる。
サーバ2は,ウェブページ1画面に5つのウェブページへのリンクと関連情報を表示させるためのスペースを演算する。そして,各スペースにおける本文と画像の割り当てを求める。この割り当ては,各スペースの面積,テキストの数,及び画像の数を用いることでサーバ2が自動的に求めることができる。またこの割り当ては手入力によって修正されてもよい。この場合,入力された情報をサーバが受け取り,適宜情報処理を行えばよい。そして,サーバ2は,画像の大きさが決まったら,各関連ウェブページの画像を決まった大きさへ修正する処理を行う。この作業は,各画像の大きさに関する情報を読み出す。そして,各画像のスペースに関する情報を用いて,各画像の拡大又は縮小する値を求める。その上で,求めた拡大又は縮小に関する値に基づいて,各画像を拡大又は縮小して,記憶部に記憶する。
また,サーバ2は,各関連ウェブページについて,各関連ウェブページに含まれるマンション名,家賃,最寄り駅,間取り図,及び屋内写真に関する情報を記憶している。このため,ステップ104では,各スペースに配置するマンション名,家賃,最寄り駅などテキストの配置をも決定した上で,適切な部分に配置される情報として,マンション名,家賃,最寄り駅などに関する情報をそれぞれの関連ウェブページと関連させて記憶する。このようにして,各関連ウェブページの区分ごとの特徴語が整理される。
関連ウェブページ表示手段26が,サーバ2と通信回線を介して接続された端末に,表示情報整理手段で整理された特徴語に関連したテキスト及び整理された特徴語に関連した画像を,複数の関連ウェブページへのリンクとともに表示させるための情報を整える(ステップ105)。
すなわち,サーバ2は,クライアント3が各スペースに画像を含めたリンク情報を表示できるように,サーバ4と接続するウェブサイトから情報をあらかじめ集約しサーバ2のデータベースに格納している。この情報は,スペースの分割数,各スペースにおける,マンション名,家賃,最寄り駅,間取り図,及び屋内写真の配置情報,特徴語に関連するテキスト,及び大きさの修正された画像を含む。そして,画像表示を行うための情報が,サーバ2からクライアント3へと伝えられる。この情報を受け取ったクライアント3は,もモニタに画像を含めたリンク画面を表示することができる。
本発明の好ましい態様は,関連ウェブページが,インターネットを用いたウェブ検索により関連するとされたウェブページである。
インターネット検索サイトは,多数知られている。本発明のサーバ2は,インターネット検索に用いられる既に知られたサーチエンジンの機能を備える。そして,ユーザがサイト検索を行った場合,通常の方法に基づいて,ランクの高いウェブページのリストを作成する。その際,ランクの高い(たとえば,1位から10位である)ウェブページを上記の関連ウェブページとする。すると,ウェブサイトの運営者の自由自在な設定に基づいて,リンクと関連付けて表示するコンテンツが決められる。そして,各関連ウェブページを上記したと同様にして最小コンテンツに分類する。その上で,サーバ2が,ウェブサイトの運営者の自由自在な設定に基づきリンクと関連付けて表示されるコンテンツを整理してユーザのクライアントへ送信する。このようにすれば,関連ウェブページへのリンクを表示する際にも,それらウェブページに含まれるコンテンツをあわせて表示することができることとなる。
本発明の好ましい態様は,複数の関連ウェブページの全ては,あるウェブサイトに含まれるウェブページであり,特徴語抽出工程で抽出した特徴語をあるウェブサイトのトップページに検索インデックスとして追加する工程を含むものである。すると,トップページに含まれる検索インデックスをユーザが選択すると,特徴語に関連したリンク表示が自動的に生成される。
この機能を用いることで,たとえば,ウェブサイトの運営者が,ある特集ページを編集する場合,自由自在にそのコンテンツを指定することができる。そして,そのコンテンツを示す特徴語を検索インデックスとすることで,その検索インデックスに関連したウェブページのリンクを表示することができるとともに,そのリンクされたウェブページに割り当てられたスペースに掲載するコンテンツを自由自在に設計できる。このシステムは,その検索インデックスと関連したリンク表示画面が固定されているものではない。このため,あるウェブサイトに関連したウェブページが追加された場合,その追加されたウェブページをもあわせて解析するため,検索インデックスに関連したウェブページのリンクを表示する際に,自動的に追加されたウェブページをも考慮することができることとなる。
本発明は,コンピュータを,
複数の関連ウェブページ内のコンテンツを分類・整理し自由自在に再構成して表示するための方法であって,
前記コンピュータが,複数の関連ウェブページ内のコンテンツをテキスト,及び画像に分類して,各関連ウェブページのテキスト及び画像の配置を把握するウェブ内配置把握工程と,
前記コンピュータが,前記ウェブ内配置把握工程で把握したテキスト及び画像の配置に基づいて,各関連ウェブページを複数の区分に分割するウェブ分割工程と,
前記コンピュータが,前記ウェブ分割工程で分割した各関連ウェブページの区分ごとに,当該区分に含まれるテキストに基づいて当該区分の特徴語を抽出する特徴語抽出工程と,
前記コンピュータが,特徴語抽出工程で抽出した各関連ウェブページの区分ごとの特徴語を整理する特徴語整理工程と,
前記コンピュータが,前記特徴語整理工程で整理した特徴語に基づいて,前記特徴語に関連したテキスト及び当該特徴語に関連した画像を整理する表示情報整理工程と,
を含む方法を実行するためのサーバとして機能させるためのプログラムをも提供する。
上記のプログラムは,先に説明した本発明の方法の構成を適宜採用することができる。
本発明は,さらに,上記のプログラムを格納したコンピュータにより読み取り可能な情報記録媒体をも提供する。
実施例1は,○○ハウス社のウェブサイトである。図6は,本発明のシステムを導入する前の○○ハウス社のウェブサイトを示す。図7は,本発明のシステムを導入した後の○○ハウス社のウェブサイトを示す。
図6に示されるとおり,ある検索語を用いて関連するウェブサイトを検索した際,従来はリンク表示とテキストの羅列が表示されるだけであった。これでは,各ウェブサイトへアクセスしなければ,それぞれのウェブサイトのコンテンツを容易に把握できなかった。
図7に示されるとおり,本発明のシステムを導入した後は,このシステムが各関連ウェブページのコンテンツを自動的に解析する。その上で,図7に示されるカスタマイズしたリンク表示を行うことができる。また,このリンク表示におけるコンテンツは,ウェブサイトの運営者が自由に選択することもできる。すなわち,ウェブサイトの運営者がリンク表示に表示することを希望するコンテンツを選択する。すると,サーバ2は,この選択情報を受け取る。その上で,リンク表示画面に表示される各リンク先のウェブページに関するスペースを決定する。その上でそのスペースに,ウェブサイトの運営者が希望するコンテンツの表示領域を割り当てる。このようにすることで,ウェブサイトの運営者が自由自在に表示するコンテンツを選択できることとなる。図7の例では,マンション名が表示される。また,ウェブサイトの運営者が選択した4つのテキスト情報が,リンク先ごとに表示される。さらに,ウェブサイトの運営者は,物件の外観画像,内装,見取り図を選択したので,リンク表示画面には,それらの画像情報も含めて表示されている。
実施例2は,ある旅行代理店○×○×のウェブページである。図8は,本発明のシステムを導入する前の○×○×のウェブサイトを示す。図9は,本発明のシステムを導入した後の○×○×のウェブサイトを示す。
従来,ユーザが温泉という用語を用いて○×○×のウェブサイトにおいて検索を行うと,図8に示されるように,それぞれの温泉を紹介するウェブページへのリンクとあわせて,テキスト情報のみが表示されるだけであった。
一方,本発明のシステムを導入した後の○×○×のウェブサイトは,図9に示されるとおり,料理の画像のほか,温泉の特徴といえる画像も表示される。
本発明は情報通信技術に関するため,情報通信関連の分野において利用されうる。
21 ウェブ内配置把握手段
22 ウェブ分割手段
23 特徴語抽出手段
24 特徴語整理手段
25 表示情報整理手段
26 関連ウェブページ表示手段

Claims (2)

  1. サーバが,複数のウェブページ内のコンテンツを分類・整理し,再構成するための方法であって,
    前記サーバが,あるウェブサイトに含まれる複数のウェブページ,又はインターネットを用いたウェブ検索により関連するとされた複数のウェブページを,複数の関連ウェブページとして取得する関連ウェブページ取得工程と,
    前記サーバが,前記関連ウェブページ取得工程で取得した前記複数の関連ウェブページ内のコンテンツをテキスト及び画像に分類して,各関連ウェブページ内のテキスト及び画像の配置を把握するウェブ内配置把握工程と,
    前記サーバが,前記ウェブ内配置把握工程で把握したテキスト及び画像の配置に基づいて,各関連ウェブページを,前記テキストのみ又は前記テキストと前記画像を含む複数の区分に分割するウェブ分割工程と,
    前記サーバが,前記区分の属性を示す特徴語が当該特徴語と関連する単語と関連付けて記憶されている特徴語データベースを参照し,前記ウェブ分割工程で分割した各関連ウェブページの区分ごとに,当該区分に含まれるテキストに基づいて当該区分の属性を示す特徴語を抽出する特徴語抽出工程と,
    前記サーバが,前記各関連ウェブページに含まれる区分ごとに,当該区分に含まれるテキスト又は画像を,前記特徴語抽出工程で抽出した前記特徴語と関連付けて,コンテンツデータベースに記憶する特徴語記憶工程と,
    前記サーバが,前記区分の属性を示す一又は複数の特徴語の入力を受け付ける特徴語入力工程と,
    前記サーバが,前記コンテンツデータベースに記憶された区分に含まれるテキスト又は画像のうち,前記特徴語入力工程で入力された一又は複数の特徴語と関連付けて記憶されている区分に含まれるテキスト又は画像を読み出し,当該テキストの数又は当該画像の数に基づいて,当該テキスト又は当該画像が含まれる各関連ウェブページへのリンク情報とともに,当該テキスト又は当該画像を表示するための表示領域を演算する表示情報整理工程と,
    前記サーバが,前記表示情報整理工程で演算した前記表示領域に,前記特徴語と関連した前記区分に含まれるテキスト又は画像を割り当てて,当該割り当ての情報を記憶部に記憶する表示情報記憶工程と,
    を含む方法。

  2. 前記複数の関連ウェブページの全ては,あるウェブサイトに含まれるウェブページであり,
    さらに,前記特徴語抽出工程で抽出した特徴語を前記あるウェブサイトのトップページに検索インデックスとして追加する工程を含む,
    請求項1に記載の方法。
JP2010183953A 2010-08-19 2010-08-19 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法 Active JP4901985B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010183953A JP4901985B2 (ja) 2010-08-19 2010-08-19 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010183953A JP4901985B2 (ja) 2010-08-19 2010-08-19 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009299304A Division JP4870809B2 (ja) 2009-12-30 2009-12-30 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法

Publications (3)

Publication Number Publication Date
JP2011138478A JP2011138478A (ja) 2011-07-14
JP2011138478A5 JP2011138478A5 (ja) 2012-01-19
JP4901985B2 true JP4901985B2 (ja) 2012-03-21

Family

ID=44349800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010183953A Active JP4901985B2 (ja) 2010-08-19 2010-08-19 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法

Country Status (1)

Country Link
JP (1) JP4901985B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03132872A (ja) * 1989-10-19 1991-06-06 Nippon Telegr & Teleph Corp <Ntt> 索引情報生成装置
JP2937520B2 (ja) * 1991-03-08 1999-08-23 株式会社東芝 文書検索装置
JP2005267344A (ja) * 2004-03-19 2005-09-29 Canon Inc 文書整形装置、文書整形方法及びプログラム

Also Published As

Publication number Publication date
JP2011138478A (ja) 2011-07-14

Similar Documents

Publication Publication Date Title
JP4150415B2 (ja) ドキュメントデータ表示処理方法、ドキュメントデータ表示処理システム及びドキュメントデータ表示処理用のソフトウェアプログラム
US20080046254A1 (en) Electronic Service Manual Generation Method, Additional Data Generation Method, Electronic Service Manual Generation Appartus, Additional Data Generation Apparatus, Electronic ServIce Manual Generation Program, Additional Data Generation Program, And Recording Media On Which These Programs Are Recorded
WO2011080899A1 (ja) 情報推薦方法
JP5827208B2 (ja) 文書管理システムおよび文書管理方法並びに文書管理プログラム
JP5150799B1 (ja) 情報処理装置、情報処理方法、情報処理装置用プログラム、および、記録媒体
CN101986306B (zh) 一种用于基于查询序列获取黄页信息的方法与设备
WO2013036688A2 (en) Identifying product variants
CN105005562A (zh) 检索结果的显示处理方法及装置
JP2010218376A (ja) ユーザ関心ジャンル分析システム
US9390446B2 (en) Consumer centric online product research
KR20140050217A (ko) 키워드 연관 관계 시각화 제공 시스템 및 방법과, 이를 지원하는 장치
JP4870809B2 (ja) 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法
KR101667199B1 (ko) 키워드 검색을 통한 웹 페이지의 상대적 품질 지수 평가 장치
JP2002149854A (ja) 情報収集システム
JP2006215659A (ja) カタログ管理装置およびカタログ作成方法およびカタログ検索方法
JP2008009582A (ja) 広告配信サーバ、広告配信プログラム、広告配信方法、及び広告配信システム
US20100191616A1 (en) Software method and system to enable automatic, real-time extraction of item price and availability from a supplier catalog during a buyer&#39;s electronic procurement shopping process
US8065265B2 (en) Methods and apparatus for web-based research
JP4901985B2 (ja) 関連するウェブページ内コンテンツを分類・整理し自由自在に再構成して表示する方法
WO2016011452A1 (en) System for aggregating, comparing and acquiring collectibles, methods and uses thereof
JP2009187401A5 (ja)
US8886665B2 (en) Systems and methods for enhancing management effectiveness
KR20010055126A (ko) 인터넷 쇼핑몰 상품정보 학습 시스템 및 그 방법
US20230359460A1 (en) Interactive documentation pages for software products and features
JP4385087B2 (ja) 生活情報支援システム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111129

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111129

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20111129

TRDD Decision of grant or rejection written
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20111220

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111227

R150 Certificate of patent or registration of utility model

Ref document number: 4901985

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20180113

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250