以下、ウェブページ生成装置を含む情報システム等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
本実施の形態において、2以上の用語を有する用語DBから1以上の用語を取得し、当該用語を用いて1以上のウェブページを生成し、蓄積するウェブページ生成装置を含む情報システムについて説明する。
また、本実施の形態において、生成するウェブページの中で、あらかじめ決められた既存のウェブページへのリンクを張る技術についても説明する。
図1は、本実施の形態における情報システム1の概念図である。情報システム1は、用語データベースサーバ装置11、ウェブページ生成装置12、1以上のウェブサーバ装置13、1以上の端末装置14を具備する。用語データベースサーバ装置11は、用語データベースを格納している。ウェブサーバ装置13は、既存のウェブページを格納している。端末装置14は、ユーザ端末であり、ウェブページを検索する検索エンジンを搭載している。
図2は、本実施の形態における情報システム1のブロック図である。用語データベースサーバ装置11は、用語データベース格納部111、用語群送信部112を具備する。ウェブページ生成装置12は、既存ウェブページ特定情報格納部121、用語取得部122、ウェブページ生成部123、蓄積部124を具備する。ウェブサーバ装置13は、ウェブページ格納部131、ウェブページ送信部132を具備する。端末装置14は、受付部141、ウェブページ受信部142、ウェブページ出力部143を具備する。
用語データベース格納部111は、用語データベースを格納している。用語データベースのデータ構造は問わない。用語データベース[0]は、区切り記号(スペースやカンマなど)で用語を区切った用語群でも良いし、リレーショナルDBの構造等でも良い。用語データベース[0]は、ウェブページ生成装置12の外部の装置(ここでは、用語データベースサーバ装置11)に存在するのが好適であるが、ウェブページ生成装置12内に存在しても良い。用語データベース[0]内の用語は、人手により、図示しない入力手段により蓄積されても良いし、他の装置やソフトウェア等により自動蓄積されても良い。用語データベース[0]は、文章を含んでも良い。また、用語データベース[0]は、EPGなどでも良い。用語データベース[0]は、単に文書ファイルでも良い。用語データベース[0]は、通常、時々刻々と更新されるデータベースである。用語データベース[0]は、用語が追記されていくようになっていることが好適である。さらに、用語データベース[0]は、人手により入力される放送番組のキーワードの集合であることが好適である。ただし、用語データベース[0]の中の用語は問わない。用語データベース格納部111は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
用語群送信部112は、ウェブページ生成装置12からのアクセス要求に応じて、1以上の用語を、ウェブページ生成装置12に送信する。用語群送信部112は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
既存ウェブページ特定情報格納部121は、1以上の既存ウェブページ特定情報を格納し得る。既存ウェブページ特定情報は、既存のウェブページを特定する情報である。既存のウェブページとは、ウェブサーバ装置13内のウェブページである。また、既存ウェブページ特定情報とは、URLや、URLとアイコンや、URLとアイコンと文などである。既存ウェブページ特定情報は、生成されるウェブページ内に記載される情報(アイコンと文など)を含んでも良い。
既存ウェブページ特定情報格納部121は、1以上の既存ウェブ情報を格納していることが好適である。既存ウェブ情報とは、既存ウェブページ特定情報と1以上の用語の組である。ここでの用語とは、通常、既存ウェブページを象徴する用語である。
既存ウェブページ特定情報格納部121は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。既存ウェブページ特定情報格納部121に既存ウェブページ特定情報が記憶される過程は問わない。例えば、記録媒体を介して既存ウェブページ特定情報が既存ウェブページ特定情報格納部121で記憶されるようになってもよく、通信回線等を介して送信された既存ウェブページ特定情報が既存ウェブページ特定情報格納部121で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された既存ウェブページ特定情報が既存ウェブページ特定情報格納部121で記憶されるようになってもよい。
用語取得部122は、2以上の用語を格納している用語データベースから、1以上の用語を取得する。用語取得部122は、通常、用語データベースサーバ装置11にアクセスに行き、1以上の用語を受信する。ここで、用語取得部122が取得する用語とは、通常、単語であるが、2以上の単語を有する単語列や文の一部などでも良い。
用語取得部122は、用語データベースから、2以上の用語を有する用語群を取得し、用語群を2以上の用語に分割し、2以上の用語を有する複数用語を1組以上取得しても良い。つまり、用語取得部122は、2以上の用語を有する複数用語を取得しても良い。複数用語の取得の場合も、用語取得部122は、通常、用語データベースサーバ装置11にアクセスに行き、1組以上の複数用語を受信する。ここで、用語群とは、例えば、一番組の情報である。例えば、用語群は、チャンネルと放送時間で区切られた番組の情報である。
用語取得部122は、用語データベースから、現在から所定期間内に登録された用語のみを取得することは好適である。また、用語取得部122は、用語データベースから、現在から所定期間内に登録された用語のみを有する用語群を取得し、用語群を2以上の用語に分割し、2以上の用語を有する複数用語を1組以上取得することは好適である。ここで、所定期間内とは、現在から予め決められた期間内(例えば、1時間以内など)でも良いし、前回にアクセスした後、現在までの期間など、不定期間でも良い。
用語取得部122は、定期的に用語データベースにアクセスし、前回のアクセス時以降に用語データベースが更新されている場合、新たに追記された1以上の用語を用語データベースから取得することは好適である。
用語取得部122は、通常、MPUやメモリ等から実現され得る。用語取得部122の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
ウェブページ生成部123は、用語取得部122が取得した用語を用いて、1以上のウェブページを生成する。ここで、ウェブページとは、多数のユーザが検索対象とする情報を言う。ウェブページは、通常、ファイルであるが、ファイルには限らない。ウェブページは、狭義には、ウェブ上の文書であるが、ここでは、広く、不特定多数のユーザが検索対象とする情報と捉えても良い。また、ここでのウェブページの生成とは、用語または用語から生成された用語関連情報がウェブページ内に記載されることを言う。
ウェブページ生成部123は、例えば、ウェブページの雛形を予め格納している、当該雛形に、用語取得部122が取得した用語を埋め込んでウェブページを、新たに生成する。ウェブページ生成部123は、一用語ずつ、用語の数だけ、ウェブページを生成しても良い。
ウェブページ生成部123は、1組以上の各複数用語を用いて、1以上のウェブページを生成する。つまり、ウェブページ生成部123は、複数用語ごとに、一のウェブページを生成しても良い。
ウェブページ生成部123は、用語取得部122が取得した1以上の用語をタイトルまたはURLに有する、1以上のウェブページを生成することは好適である。つまり、ウェブページ生成部123は、タイトルを自動生成して、ウェブページを生成しても良い。例えば、「<用語1>,<用語2>,・・・に関するページ」などというタイトルの雛形の文に、取得された用語を<用語1>や<用語2>などの変数に埋め込むことにより、ウェブページ生成部123は、タイトルを自動生成しても良い。また、ウェブページ生成部123は、URLを自動生成しても良い。ウェブページ生成部123は、例えば、「http://www.sg.co.jp/<用語1><用語2>page/page.html」などというURLの雛形の文に、取得された用語を<用語1>や<用語2>などの変数に埋め込むことによりURLを自動生成しれても良い。このURLは、蓄積部124が蓄積するファイル名に対応する。
ウェブページ生成部123は、既存ウェブページ特定情報を用いて、既存のウェブページとのリンクを1以上のウェブページに付加する処理をさらに行うことは好適である。つまり、ウェブページ生成部123は、既存ウェブページ特定情報格納部121から、1以上の既存ウェブページ特定情報を読み出し、当該1以上の既存ウェブページ特定情報で特定される既存のウェブページへのリンク(アンカー)をウェブページに付加する処理をさらに行う。ウェブページにリンクを付加する処理は、リンクを示すHTMLの記述を、ウェブページの所定箇所に書き込むことである。リンクを示すHTMLの記述は、例えば、「<a href="ファイル名">」や「<a style="background-image: URL(http://・・・・/画像.jpg);" class="imgfilter" id="splimgfilter" href="・・・"></a>」などである。なお、上記において「画像.jpg」は画像ファイルである。なお、ウェブページの記述言語は、HTML、C−HTML、XML等、問わないことは言うまでもない。
さらに、ウェブページ生成部123は、用語取得部122が取得した用語と対になる既存ウェブページ特定情報を、既存ウェブページ特定情報格納部121から取得し、取得した既存ウェブページ特定情報を用いて、既存のウェブページとのリンクを1以上のウェブページに付加する処理をさらに行うことは好適である。
ウェブページ生成部123は、通常、MPUやメモリ等から実現され得る。ウェブページ生成部123の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
蓄積部124は、ウェブページ生成部123が生成した1以上のウェブページを、予め決められた蓄積場所に蓄積する。予め決められた蓄積場所とは、予め決められた装置、予め決められた装置とフォルダなどである。蓄積場所を特定する情報である蓄積先情報は、蓄積部124が予め保持している。蓄積先情報とは、例えば、装置を識別するIPアドレスや、装置とフォルダを特定するURIやURLなどである。予め決められた蓄積場所とは、ファイル名までが予め決められていることを意味しない。蓄積部124は、ウェブページ生成部123が用語を用いて生成したファイル名を、蓄積するウェブページのファイル名としても良い。
蓄積部124は、通常、MPUやメモリ等から実現され得る。蓄積部124の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
ウェブページ格納部131は、ウェブページを格納している。ウェブページは、既存ウェブページである。ウェブページ格納部131は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。ウェブページ格納部131にウェブページが記憶される過程は問わない。
ウェブページ送信部132は、端末装置14からの指示に応じて、ウェブページ格納部131からウェブページを読み出し、当該ウェブページを端末装置14に送信する。ウェブページ送信部132は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
受付部141は、ユーザから、各種の入力を受け付ける。受け付ける入力は、キーワードや、ウェブページ検索指示などの指示である。各種の入力の手段は、テンキーやキーボードやマウスやメニュー画面によるもの等、何でも良い。受付部141は、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
ウェブページ受信部142は、受付部141が、1以上のキーワードと検索指示を受け付けた場合、受付部141が受け付けたキーワードを用いて、ウェブサーバ装置13や、ウェブページ生成装置12などを検索し、ウェブページを取得する。ウェブページ受信部142は、例えば、いわゆるウェブの検索エンジンである。
ウェブページ受信部142は、通常、MPUやメモリや無線または有線の通信手段等から実現され得る。ウェブページ生成部123の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
ウェブページ出力部143は、ウェブページ受信部142が受信したウェブページを出力する。ウェブページ出力部143は、例えば、インターネットブラウザである。ウェブページ出力部143は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。ウェブページ出力部143は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。また、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタへの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。
次に、情報システム1の動作について説明する。まず、用語データベースサーバ装置11の動作について説明する。用語データベースサーバ装置11の用語群送信部112は、ウェブページ生成装置12からのアクセス要求に応じて、1以上の用語を、ウェブページ生成装置12に送信する。アクセス要求がすべての用語を要求する場合、用語群送信部112は、用語データベース格納部111内のすべての用語をウェブページ生成装置12に送信する。アクセス要求が、現在から所定期間内に登録された用語のみを要求する場合、用語群送信部112は、用語データベース格納部111から、現在から所定期間内に登録された1以上の用語を検索し、当該1以上の用語をウェブページ生成装置12に送信する。また、アクセス要求が、前回にアクセスした後現在までに登録された用語を要求する場合、用語群送信部112は、用語データベース格納部111から、前回にアクセスした後現在までに登録された1以上の用語を検索し、当該1以上の用語をウェブページ生成装置12に送信する。なお、かかる場合、用語データベースサーバ装置11は、ウェブページ生成装置12が、最近にアクセスした時刻を格納している、とする。さらに、用語データベースサーバ装置11は、用語が登録された時刻も判断可能なように、用語が登録された時刻に関する情報(時刻そのものも情報も含む)を格納している。
次に、ウェブページ生成装置12の動作について、図3のフローチャートを用いて説明する。
(ステップS301)用語取得部122は、用語を取得するタイミングであるか否かを判断する。用語を取得するタイミングであればステップS302に行き、用語を取得するタイミングでなければステップS301に戻る。
(ステップS302)用語取得部122は、1以上の用語を取得するためのアクセス要求を構成し、当該アクセス要求を、用語データベースサーバ装置11に送信する。
(ステップS303)用語取得部122は、ステップS302におけるアクセス要求の送信に対応して、1以上の用語を受信したか否かを判断する。1以上の用語を受信すればステップS304に行き、1以上の用語を受信しなければステップS303に戻る。
(ステップS304)用語取得部122は、取得した1以上の用語を分割し、1以上の用語の集合を取得する。なお、用語取得部122は、取得した1以上の用語を、一つずつの用語に分割しても良いし、所定の単位で1以上の用語に分割しても良い。用語の集合は、通常、2以上の用語であるが、一つの用語であっても良い。所定の単位とは、番組の単位などである。
(ステップS305)ウェブページ生成部123は、カウンタiに1を代入する。
(ステップS306)ウェブページ生成部123は、ステップS304で取得された用語の集合の中に、i番目の用語の集合が存在するか否かを判断する。i番目の用語の集合が存在すればステップS307に行き、i番目の用語の集合が存在しなければステップS301に戻る。なお、i番目の用語の集合は、一の用語でも良い。
(ステップS307)ウェブページ生成部123は、ウェブページを生成する。このウェブページ生成処理について、図4のフローチャートを用いて説明する。
(ステップS308)蓄積部124は、ステップS307で生成された1以上のウェブページを予め決められた蓄積場所に蓄積する。ウェブページごとに異なる装置、異なるフォルダに蓄積されても良いし、同じ装置の同じフォルダに蓄積されても良い。
(ステップS309)ウェブページ生成部123は、カウンタiを1、インクリメントする。ステップS306に戻る。
なお、図3のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
次に、ステップS307のウェブページ生成処理について、図4のフローチャートを用いて説明する。
(ステップS401)ウェブページ生成部123は、i番目の用語の集合を取得する。
(ステップS402)ウェブページ生成部123は、格納しているウェブページの雛形を読み出す。
(ステップS403)ウェブページ生成部123は、ステップS401で取得したi番目の用語の集合を、ステップS402で取得したウェブページの雛形に埋め込む。埋め込む場所は固定であっても良いし、ウェブページの雛形の中に指示されていても良い。また、i番目の用語の集合を埋め込む場合、ウェブページ生成部123は、i番目の用語の集合から文や情報を生成してから、当該生成した文や情報を、ウェブページの雛形の中に埋め込んでも良い。
(ステップS404)ウェブページ生成部123は、i番目の用語の集合の中の1以上の用語をキーとして、既存ウェブページ特定情報格納部121を検索する。そして、ウェブページ生成部123は、既存ウェブページ特定情報格納部121から、0または1以上の既存ウェブページ特定情報を取得する。なお、ウェブページ生成部123は、i番目の用語の集合の中の各用語の各々をキーとして、1以上の回数、繰り返して、既存ウェブページ特定情報格納部121を検索しても良いし、i番目の用語の集合すべてをキーとして既存ウェブページ特定情報格納部121を検索しても良い。ここでの検索とは、通常、i番目の用語の集合の中の用語と、既存ウェブページ特定情報の中の用語の一致であるが、部分一致でも良い。つまり、既存ウェブページ特定情報の中の用語が、i番目の用語の集合の中の用語を一部に含む場合にも、検索結果を真、としても良い。また、i番目の用語の集合の中の用語が、既存ウェブページ特定情報の中の用語を一部に含む場合にも、検索結果を真、としても良い。
(ステップS405)ウェブページ生成部123は、ステップS404で、既存ウェブページ特定情報を取得できたか否かを判断する。既存ウェブページ特定情報を取得できればステップS406に行き、既存ウェブページ特定情報を取得できばければステップS407に行く。
(ステップS406)ウェブページ生成部123は、ステップS404で取得できた1以上の各既存ウェブページ特定情報に対応するウェブページへのリンクを、ステップS403で用語の集合を埋め込んだ後のウェブページに付加する。上位処理にリターンする。
(ステップS407)ウェブページ生成部123は、何らかの既存ウェブページ特定情報に対応するウェブページへのリンクを、ステップS403で用語の集合を埋め込んだ後のウェブページに付加する。ウェブページ生成部123は、何らかの既存ウェブページ特定情報をランダムに、既存ウェブページ特定情報格納部121から選択しても良いし、順番に既存ウェブページ特定情報格納部121から選択しても良いし、固定の既存ウェブページ特定情報を選択しても良い。その他、何らかの既存ウェブページ特定情報を取得する方法は問わない。上位処理にリターンする。
なお、図4のフローチャートにおいて、ステップS407において、何らかの既存ウェブページ特定情報を取得したが、既存ウェブページ特定情報を取得しなくても良い。かかる場合、ウェブページに、既存ウェブページ特定情報に対応するウェブページへのリンクが付加されない。
また、図4のフローチャートにおいて、i番目の用語の集合が複数の用語を含む場合、用語ごとに、ウェブページを生成しても良い。ウェブページの生成処理は、上述した通りである。
さらに、図4のフローチャートにおいて、用語ごとにウェブページを生成する場合、ステップS304の用語を分割する処理は不要である。
次に、本実施の形態における情報システム1の具体的な動作について説明する。情報システム1の概念図は図1である。
今、既存ウェブページ特定情報格納部121は、図5に示す既存ウェブページ特定情報管理表を保持している。既存ウェブページ特定情報管理表は、「ID」「URL」「アイコン」「文」「用語」の属性を有するレコードを1以上格納している。「ID」は、レコードを識別する情報である。「URL」は、既存ウェブページ特定情報で特定されるウェブページのURLである。また、「アイコン」は、生成されるウェブページ上に貼り付けられる画像データである。画像データは、動画でも良く、その形式は問わない。画像データは、バナー広告になっても良い。画像データがバナー広告である場合、そのリンク先は、「URL」で特定されるウェブページである。「文」は、生成されるウェブページ上に付加される文であり、リンクになっていても良い。リンクの飛び先は、「URL」で特定されるウェブページである。「用語」は、既存ウェブページ特定情報が検索されるための文字列の集合である。「用語」の中の一つの用語が一致すれば、既存ウェブページ特定情報が検索されても良いし、すべての用語が一致すれば、既存ウェブページ特定情報が検索されても良い。また、「用語」の中の一つの用語が部分一致した場合でも、既存ウェブページ特定情報が検索されても良い。
図6は、用語データベース格納部111の用語データベースである。用語データベースは、放送されている番組ごとに、キーワードを管理しているデータベースである。用語データベースには、番組が放送されている間、または放送終了後、ただちに、人手により、番組の内容を示すキーワードが入力される、とする。図6は、2009年7月30日14:00における用語データベースの状況である。14:00の時点で、13時から14時までに放送された番組の内容を示すキーワードが、用語データベースに追記された、とする。つまり、現在、2009年7月30日14:00である。
かかる状況において、ウェブページ生成装置12の用語取得部122は、定期的(例えば、1時間ごと)に、用語データベースサーバ装置11にアクセスに行く、とする。つまり、用語取得部122は、番組ごとに、1以上の用語を送信する指示であるアクセス要求を構成し、当該アクセス要求を、用語データベースサーバ装置11に送信する。
次に、用語データベースサーバ装置11は、アクセス要求を受信する。そして、用語データベースサーバ装置11の用語群送信部112は、番組ごとに用語を取得する。つまり、用語群送信部112は、用語データベース格納部111から「ニュース,スポーツ,株価,事件,・・・」「番組A,出演者X,ファッション,レストランR,牛肉,・・・」「・・・」という用語群を取得する。そして、用語群送信部112は、1以上の用語群をウェブページ生成装置12に送信する。
次に、用語取得部122は、アクセス要求の送信に対応して、1以上の用語「ニュース,スポーツ,株価,事件,・・・,番組A,出演者X,ファッション,レストランR,牛肉,・・・,・・・」を受信する。
次に、ウェブページ生成部123は、ここでは用語毎に、以下のようにウェブページを生成する。
つまり、ウェブページ生成部123は、受信した用語の集合「ニュース,スポーツ,株価,事件,・・・,番組A,出演者X,ファッション,レストランR,牛肉,・・・」から、用語「ニュース」を取得する。
次に、ウェブページ生成部123は、格納しているウェブページの雛形を読み出す。格納しているウェブページの雛形は、例えば、図7である。
そして、ウェブページ生成部123は、用語「ニュース」等をウェブページの雛形に埋め込む。つまり、図7において、「<」「>」で囲まれたものが変数であり、文字列等に置き換わる。つまり、図7の変数<用語>は、ウェブページ生成部123が取得した一つの用語に置き換わる。
また、ウェブページ生成部123が、用語をキーとした検索により、既存ウェブページ特定情報を取得できた場合、図7の変数<すべての用語>は、図5に示す既存ウェブページ特定情報管理表の属性「用語」内のすべての用語に置き換わる。また、図7の変数<文>は、既存ウェブページ特定情報管理表の属性「文」の属性値に置き換わる。また、図7の変数<URL>は、既存ウェブページ特定情報管理表の属性「URL」の属性値に置き換わる。さらに、図7の変数<アイコン>は、既存ウェブページ特定情報管理表の属性「アイコン」の属性値に置き換わる。
なお、ウェブページ生成部123が、用語をキーとした検索により、既存ウェブページ特定情報を取得できなかった場合、何らかの既存ウェブページ特定情報のレコードの情報により、<>内の変数値が置き換わる。
そして、ここでは、ウェブページ生成部123は、用語「ニュース」をキーとして、既存ウェブページ特定情報格納部121を検索する。しかし、既存ウェブページ特定情報を検索できなかった、とする。そこで、ウェブページ生成部123は、最初(ID=1)の既存ウェブページ特定情報を、図5の既存ウェブページ特定情報管理表から取得する、とする。そして、ウェブページ生成部123は、ウェブページの雛形の変数<すべての用語>には、「肉,牛,牛肉,・・・」を代入する。また、ウェブページ生成部123は、変数<文>には、「○○肉の焼肉店「XX]・・・」を代入する。また、ウェブページ生成部123は、変数<URL>には、「http://www.xx.co.jp/」を代入する。さらに、ウェブページ生成部123は、変数<アイコン>には、アイコンのファイル名(ここでは「xx-icon.jpg」)を代入し、アイコンファイルを構成する。以上により、ウェブページ生成部123は、用語「ニュース」についてのウェブページを生成する(図8参照)。
次に、蓄積部124は、生成されたウェブページを予め決められた蓄積場所(例えば、ウェブページ生成装置12内の予め決められたフォルダ)に蓄積する。ここで、蓄積部124は、蓄積場所を示す自装置内のフォルダの情報"/top/"を保持しており、かかるフォルダの下に、以下のファイル名のファイルを蓄積する。このファイル名は、例えば、「ニュース.html」である。つまり、ウェブページ生成装置12は、「<用語>.html」のファイル名を生成していた、とする。
次に、第二番目の用語「スポーツ」を取得する。次に、ウェブページ生成部123は、格納しているウェブページの雛形(図7)を読み出す。
そして、ウェブページ生成部123は、用語「スポーツ」等をウェブページの雛形の<用語>の位置に埋め込む。
また、ウェブページ生成部123は、用語「スポーツ」をキーとして、既存ウェブページ特定情報管理表を検索する。そして、ウェブページ生成部123は、既存ウェブページ特定情報管理表の「ID=2」のレコードを取得する。
そして、ウェブページの雛形(図7)の変数の箇所に、既存ウェブページ特定情報管理表の「ID=2」のレコードの各属性値を埋め込む。
そして、ウェブページ生成部123は、図9のウェブページを得る。なお、「ID=2」のレコードのアイコンの属性値が空であるので、図9において、<アイコン>が空に置き換わる。以上により、ウェブページ生成部123は、用語「スポーツ」についてのウェブページを生成する。
次に、蓄積部124は、生成されたウェブページを予め決められた蓄積場所(例えば、ウェブページ生成装置12内の予め決められたフォルダ)に蓄積する。
以後、「株価」などの他の用語についても、ウェブページ生成部123は、ウェブページを生成する。そして、蓄積部124は、生成されたウェブページを予め決められた蓄積場所に蓄積する。
次に、ユーザは、例えば、2chで13:00から放送していたテレビ番組を見て、スポーツについて調べたくなり、「スポーツ」を、端末装置14の検索エンジンに入力した、とする。
次に、端末装置14の受付部141は、キーワード「スポーツ」と、検索指示を受け付ける。そして、ウェブページ受信部142(検索エンジン)は、ウェブ上のウェブページを、キーワード「スポーツ」を用いて検索する。
そして、さきほど生成した「用語「スポーツ」についてのウェブページ」は、少し前に生成されたばかりなので、検索エンジンの検索結果の上位に出力されることが期待される。
また、その後、ユーザは検索結果の中から、「用語「スポーツ」についてのウェブページ」へのリンクをクリックする、とする。
すると、「用語「スポーツ」についてのウェブページ」が、端末装置14のディスプレイに表示される。
そして、「用語「スポーツ」についてのウェブページ」に記載されている「sportZ」へのリンクがクリックされる可能性が極めて高くなる。
以上、本実施の形態によれば、多くのユーザからアクセスされ得るウェブページを自動的に構築できる。
また、本実施の形態によれば、構築したウェブページの中に、ユーザに閲覧して欲しいウェブページのリンクを挿入できる。
また、本実施の形態において、用語取得部122が取得する用語は、まだ、世の中に浸透していない用語であることは好適である。つまり、用語データベース[0]は、放送番組のキーワードの集合など、新出の用語の集合、希少である用語の集合であることは好適である。
また、本実施の形態において、用語取得部122は、2以上の用語を格納している用語データベースから、希少な用語のみを取得することは好適である。かかる場合、希少な用語のみを用いて、ウェブページを生成できる。なお、かかる場合、用語取得部122は、用語取得手段1221、希少性判断手段1222、用語選択手段1223を具備する。用語取得手段1221は、2以上の用語を格納している用語データベースから、1以上の用語を取得する。希少性判断手段1222は、用語取得手段1221が取得した用語が、ある閾値より希少度の大きいか否かを判断する。ここで、閾値より希少度が大きいとは、いわゆる検索エンジンに用語を渡し、起動した場合の、被検索数が予め決められた値より小さいこと、予め決められた辞書(いわゆるウィキペディアなども含む)を検索し、ヒットしなかったこと、などである。用語選択手段1223は、希少性判断手段1222が閾値より希少度の大きいと判断した用語を選択する。そして、ウェブページ生成部123は、用語選択手段1223により選択された用語を用いて、ウェブページを生成する。
かかる場合のウェブページ生成装置12のブロック図を図10に示す。
また、図10におけるウェブページ生成装置12において、例えば、TV番組の情報(例えば、EPGの情報)「王様のブランチ、辻希子10万円お買い物パジャマの着方がダサいダンナの変身大作戦:おいしい!楽しい!肉料理テーマパーク:蛯原友子プロデュース超おしゃれなバッグ:草食男子」が、用語データベースサーバ装置11の用語データベース格納部111に格納されている、とする。
そして、ウェブページ生成装置12の用語取得部122は、1以上の用語を取得するためのアクセス要求を構成し、当該アクセス要求を、用語データベースサーバ装置11に送信する。
そして、用語取得部122は、アクセス要求の送信に対応して、用語データベースサーバ装置11から、1以上の用語を含む情報(前記TV番組の情報)を受信する。
そして、用語取得部122の用語取得手段1221は、TV番組の情報から用語「王様のブランチ」「辻希子」「10万円」「お買い物」「パジャマ」・・・「蛯原友子」「プロデュース」・・・「草食男子」を取得する。なお、用語取得手段1221は、例えば、TV番組の情報から名詞または名詞句を取得しても良い。また、用語取得手段1221は、例えば、形態素解析を行い、名詞または名詞句を取得しても良い。
次に、希少性判断手段1222は、用語取得手段1221が取得した用語に対して、ある閾値(例えば「5」)より希少度の大きいか否かを判断する。つまり、例えば、希少性判断手段1222は、いわゆるWebの検索エンジンに各用語を渡し、当該検索エンジンを起動した場合の、被検索数が予め決められた値(例えば「5」)より小さい用語のみを希少性のある用語である、と判断する。なお、Webの検索エンジンは、公知技術であるので、詳細な説明を省略する。
そして、用語選択手段1223は、希少性判断手段1222の判断の結果を利用し、用語取得手段1221が取得した用語の中から、「草食男子」のみを取得した、とする。
次に、ウェブページ生成部123は、用語「草食男子」を用いて、上述した処理により、ウェブページを生成する。つまり、まず、ウェブページ生成部123は、格納しているウェブページの雛形(ここでは、図11)を読み出す。
次に、ウェブページ生成部123は、用語「草食男子」を変数<用語>の箇所に埋め込み、用語の集合(「王様のブランチ」「辻希子」「10万円」「お買い物」「パジャマ」・・・「蛯原友子」「プロデュース」・・・「草食男子」)を、取得したウェブページの雛形の<すべての用語>の箇所に埋め込む。また、ウェブページ生成部123は、番組のタイトル「王様のブランチ」を変数<番組タイトル>の箇所に埋め込み。なお、ウェブページ生成部123は、番組のタイトルが存在する箇所を予め知っている、とする。
次に、ウェブページ生成部123は、既存ウェブページ特定情報を取得する。ここでは、既存ウェブページ特定情報は、URLが草食男子のページTOPである、とする。
次に、ウェブページ生成部123は、既存ウェブページ特定情報に対応するウェブページへのリンクを、用語の集合を埋め込んだ後のウェブページに付加する。そして、ウェブページ生成部123は、図12に示すウェブページを得る。
次に、蓄積部124は、生成されたウェブページを予め決められた蓄積場所に蓄積する。
以上により、希少度が大きい用語に関するウェブページが自動生成される。そして、ユーザが新出の用語を用いてウェブ検索を行った場合、自動生成されたウェブページが検索できる。
なお、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態におけるウェブページ生成装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、2以上の用語を格納している用語データベースから、1以上の用語を取得する用語取得部と、前記用語取得部が取得した用語を用いて、1以上のウェブページを生成するウェブページ生成部と、前記ウェブページ生成部が生成した1以上のウェブページを、予め決められた蓄積場所に蓄積する蓄積部として機能させるためのプログラム、である。
また、上記プログラムにおいて、前記用語取得部は、前記用語データベースから、2以上の用語を有する用語群を取得し、当該用語群を2以上の用語に分割し、当該2以上の用語を有する複数用語を1組以上取得し、前記ウェブページ生成部は、前記1組以上の各複数用語を用いて、1以上のウェブページを生成するものとして、コンピュータを機能させるためのプログラムであることは好適である。
また、上記プログラムにおいて、前記用語取得部は、前記用語データベースから、現在から所定期間内に登録された用語のみを有する用語群を取得し、当該用語群を2以上の用語に分割し、当該2以上の用語を有する複数用語を1組以上取得するものとして、コンピュータを機能させるためのプログラムであることは好適である。
また、上記プログラムにおいて、前記ウェブページ生成部は、前記用語取得部が取得した1以上の用語をタイトルまたはURLに有する、1以上のウェブページを生成するものとして、コンピュータを機能させるためのプログラムであることは好適である。
また、上記プログラムにおいて、前記ウェブページ生成部は、既存のウェブページを特定する情報である1以上の既存ウェブページ特定情報を用いて、前記既存のウェブページとのリンクを1以上のウェブページに付加する処理をさらに行うものとして、コンピュータを機能させるためのプログラムであることは好適である。
また、上記プログラムにおいて、前記既存ウェブページ特定情報と、1以上の用語の組である1以上の既存ウェブ情報を、記憶媒体に格納しており、前記ウェブページ生成部は、前記用語取得部が取得した用語と対になる既存ウェブページ特定情報を、前記記憶媒体から取得し、当該取得した既存ウェブページ特定情報を用いて、前記既存のウェブページとのリンクを1以上のウェブページに付加する処理をさらに行うものとして、コンピュータを機能させるためのプログラムであることは好適である。
さらに、上記プログラムにおいて、前記用語取得部は、定期的に前記用語データベースにアクセスし、前回のアクセス時以降に前記用語データベースが更新されている場合、新たに追記された1以上の用語を前記用語データベースから取得するものとして、コンピュータを機能させるためのプログラムであることは好適である。
また、図13は、本明細書で述べたプログラムを実行して、上述した実施の形態のウェブページ生成装置等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図13は、このコンピュータシステム340の概観図であり、図14は、コンピュータシステム340のブロック図である。
図13において、コンピュータシステム340は、FDドライブ、CD−ROMドライブを含むコンピュータ341と、キーボード342と、マウス343と、モニタ344とを含む。
図14において、コンピュータ341は、FDドライブ3411、CD−ROMドライブ3412に加えて、MPU3413と、CD−ROMドライブ3412及びFDドライブ3411に接続されたバス3414と、ブートアッププログラム等のプログラムを記憶するためのROM3415とに接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM3416と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク3417とを含む。ここでは、図示しないが、コンピュータ341は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
コンピュータシステム340に、上述した実施の形態のウェブページ生成装置等の機能を実行させるプログラムは、CD−ROM3501、またはFD3502に記憶されて、CD−ROMドライブ3412またはFDドライブ3411に挿入され、さらにハードディスク3417に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ341に送信され、ハードディスク3417に記憶されても良い。プログラムは実行の際にRAM3416にロードされる。プログラムは、CD−ROM3501、FD3502またはネットワークから直接、ロードされても良い。
プログラムは、コンピュータ341に、上述した実施の形態のウェブページ生成装置等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム340がどのように動作するかは周知であり、詳細な説明は省略する。
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
また、上記各実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。
また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。