JP2008262339A - 検索最適化装置、方法、及びコンピュータプログラム - Google Patents

検索最適化装置、方法、及びコンピュータプログラム Download PDF

Info

Publication number
JP2008262339A
JP2008262339A JP2007103863A JP2007103863A JP2008262339A JP 2008262339 A JP2008262339 A JP 2008262339A JP 2007103863 A JP2007103863 A JP 2007103863A JP 2007103863 A JP2007103863 A JP 2007103863A JP 2008262339 A JP2008262339 A JP 2008262339A
Authority
JP
Japan
Prior art keywords
keyword
content data
web page
url
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007103863A
Other languages
English (en)
Other versions
JP4002943B1 (ja
Inventor
Satoru Suzuki
哲 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2007103863A priority Critical patent/JP4002943B1/ja
Priority to PCT/JP2007/071521 priority patent/WO2008129710A1/ja
Application granted granted Critical
Publication of JP4002943B1 publication Critical patent/JP4002943B1/ja
Publication of JP2008262339A publication Critical patent/JP2008262339A/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/972Access to data in other repository systems, e.g. legacy data or dynamic Web page generation

Abstract

【課題】検索エンジン、更にはインターネット利用者に対して、データベースに記憶されている情報を検索可能なものとした上、当該情報から構成されるWebページを動的に生成する。
【解決手段】Webページを構成するコンテンツデータを固有のURLと関連付けて記憶すると共に、キーワードを記憶する装置であって、外部端末から、所定のURLと共に、当該URLに係るコンテンツデータにより構成されたWebページの取得要求を受信すると、当該URLに基づき、当該URLと関連付けて記憶されているコンテンツデータを抽出した上、上記記憶されているキーワードであって、上記抽出したコンテンツデータ中に含まれるキーワードに対し、当該キーワードを含むコンテンツデータの一覧により構成されるWebページの取得を要求するリンクを生成すると共に、これをインターネット上でアクセス可能なWebページとして上記外部端末に対して送信する。
【選択図】図1

Description

本発明は、データベース内に記憶されているコンテンツに対し動的にリンクを生成し、当該コンテンツを検索エンジンの検索対象にする技術に関する。
インターネットにおける資料調査や調べものなどの情報検索においては、Webサイトを検索する検索エンジンが広く利用されている。この検索エンジンでは、操作者がキーワードなどの検索式を入力し、検索エンジンのデータベースに記憶されている情報から、入力された検索式に対応する情報を提示する。
検索エンジンは、クローラがWebページのリンクをたどって、URL(Uniform Resource Locator)等のWebページの情報を収集した上、当該URLとキーワードとを関連付けて記憶したものを、検索結果として静的に提示するものである。
そのため、従来、全くリンクが貼られていないコンテンツを記憶したデータベースを、直接、外部の汎用検索エンジンから検索することは不可能であり、これを行うには、データベースを検索するために設けられた専用のポータルサイト上からキーワード検索を行うなどするしかなかった。即ち、直接、汎用検索エンジンからデータベースの検索結果を得ることはできなかった。
また、上述の通り、検索エンジンは検索結果を静的に表示するものであり、データベースから所定のキーワードを含むコンテンツを検索し、当該コンテンツの最新の状態が反映された検索結果を動的に提示することはできなかった。
この点、独自のフォーマットで各種データベースに蓄積された情報を、インターネット上で検索エンジンの検索対象にすることを目的とした情報提供システムとして、登録DBから商品情報が読み出し、当該ウェブページを表示するためのタグが生成すると共に、タグ単位で表示形態の指定及び商品情報のコンテンツを記述したHTMLソースと当該HTMLソースを特定するためのURLを生成し、生成したURL及びそのURLで特定されるウェブページ中のキーワードを検索エンジンの分類DBに登録することにより、商品情報が掲載されたウェブページを検索対象にすることができるものが提案されている(特許文献1参照)
特開2003−296350号公報
しかしながら、上記特許文献1記載の技術においては、データベースに記憶されている情報に基づいてHTMLソースが生成されるに過ぎず、検索エンジンのクローラの要求に応じて最新状態の情報を動的に提供することはできない。
そこで、本発明は、検索エンジン、更にはインターネット利用者に対して、データベースに記憶されている情報を検索可能なものとした上、当該情報から構成されるWebページを動的に生成することを目的とする。
そこで、上記目的を達成するため、本発明に係る検索最適化装置は、外部端末とネットワークを介して通信可能に構成され、上記外部端末からの要求に応じてWebページを送信する装置であって、Webページを構成するコンテンツデータを、当該コンテンツデータ毎の固有のURLと関連付けて記憶するコンテンツデータ記憶手段と、キーワードを記憶するキーワード記憶手段と、上記外部端末から、所定のURLと共に、当該URLに係るコンテンツデータにより構成されたWebページの取得要求を受信する取得要求受信手段と、上記コンテンツデータ記憶手段を参照して、上記受信したURLに基づき、当該URLと関連付けて記憶されているコンテンツデータを抽出するコンテンツデータ抽出手段と、上記キーワード記憶手段を参照して、上記キーワード記憶手段に記憶されているキーワードであって、上記抽出したコンテンツデータ中に含まれるキーワードに対し、当該キーワードを含むコンテンツデータの一覧により構成されるWebページの取得を要求するリンクを生成するリンク生成手段と、上記キーワードにリンクが生成されたコンテンツデータをインターネット上でアクセス可能なWebページに変換する変換処理手段と、上記変換されたWebページを上記外部端末に対して送信するWebページ送信手段とを有することを特徴とする。
また、上記キーワード記憶手段は、更に、キーワード毎に当該キーワードに対する説明データを関連付けて記憶し、上記変換処理手段は、上記キーワード記憶手段を参照して、上記抽出したコンテンツデータ中のキーワードと関連付けて記憶されている説明データを抽出し、当該抽出した説明データを、上記キーワードにリンクが生成されたコンテンツデータと共に、インターネット上でアクセス可能なWebページに変換するものとしてもよい。
また、上記取得要求受信手段は、上記外部端末から、所定のキーワードを含むコンテンツデータの一覧から構成されるWebページの取得要求を受信し、上記コンテンツデータ抽出手段は、上記コンテンツデータ記憶手段を参照して、上記所定のキーワードに基づき、上記所定のキーワードを含むコンテンツデータを抽出するものとしてもよい。
また、上記取得要求受信手段によりWebページの取得要求を受信する際に、リファラーを取得するリファラー取得手段と、上記取得したリファラーを解析して、リンク元ページのURLを特定した上、当該URLのパラメータからキーワードを抽出するキーワード抽出手段と、を有し、上記抽出したキーワードが上記キーワード記憶手段に記憶されていない場合に、当該キーワードを上記キーワード記憶手段に追加することにより、上記キーワード記憶手段を更新するキーワード更新手段、を有するものとしてもよい。
また、上記キーワード記憶手段は、更に、上記キーワード抽出手段により抽出されたキーワードをカウントして当該カウント数を記憶し、上記キーワード更新手段は、更に、上記キーワード抽出段により、既に上記キーワード記憶手段に記憶されているキーワードと同一のキーワードが抽出された場合に、上記カウント数を上書きすることにより上記キーワード記憶手段を更新し、上記リンク生成手段は、上記キーワード記憶手段を参照して、カウント数が多い上位の所定の件数のキーワードであって、上記生成したWebページに含まれるキーワードに対し、当該キーワードを含むコンテンツデータの一覧により構成されるWebページの取得を要求するリンクを生成するものとしてもよい。
また、現在日時を計測する計時手段、を有し、上記キーワード記憶手段は、更に、キーワード毎に、当該キーワードを追加又は更新した日時からなる日時情報を記憶し、上記キーワード更新手段は、更に、上記キーワード抽出手段によりキーワードが抽出された際に、当該日時を上記計時手段により取得して上記日時情報に上書きすることにより上記キーワード記憶手段を更新し、上記リンク生成手段は、上記キーワード記憶手段を参照して、日時情報が所定の日時より新しいキーワードであって、上記生成したWebページに含まれるキーワードに対し、当該キーワードを含むコンテンツデータの一覧により構成されるWebページの取得を要求するリンクを生成するものとしてもよい。
また、上記キーワード更新手段は、更に、上記計時手段により現在日時を取得すると共に、上記キーワード記憶手段を参照して、上記日時情報から所定の期間が経過したキーワードを消去することによりキーワード記憶手段を更新するものとしてもよい。
また、本発明の別の観点に係る検索最適化方法は、外部端末とネットワークを介して通信可能に構成され、Webページを構成するコンテンツデータを、当該コンテンツデータ毎の固有のURLと関連付けて記憶するコンテンツデータ記憶手段と、キーワードを記憶するキーワード記憶手段とを有するコンピュータにより、上記外部端末からの要求に応じてWebページを送信する処理を実行する方法であって、上記コンピュータが、上記外部端末から、所定のURLと共に、当該URLに係るコンテンツデータにより構成されたWebページの取得要求を受信する処理と、上記コンテンツデータ記憶手段を参照して、上記受信したURLに基づき、当該URLと関連付けて記憶されているコンテンツデータを抽出する処理と、上記キーワード記憶手段を参照して、上記キーワード記憶手段に記憶されているキーワードであって、上記抽出したコンテンツデータ中に含まれるキーワードに対し、当該キーワードを含むコンテンツデータの一覧により構成されるWebページの取得を要求するリンクを生成する処理と、上記キーワードにリンクが生成されたコンテンツデータをインターネット上でアクセス可能なWebページに変換する処理と、上記変換されたWebページを上記外部端末に対して送信する処理とを実行することを特徴とする。
また、本発明の更に別の観点に係るコンピュータプログラムは、外部端末とネットワークを介して通信可能に構成され、Webページを構成するコンテンツデータを、当該コンテンツデータ毎の固有のURLと関連付けて記憶するコンテンツデータ記憶手段と、キーワードを記憶するキーワード記憶手段とを有するコンピュータを、上記外部端末からの要求に応じてWebページを送信する処理を実行する検索最適化装置として機能させるためのコンピュータプログラムであって、上記コンピュータに対して、上記外部端末から、所定のURLと共に、当該URLに係るコンテンツデータにより構成されたWebページの取得要求を受信する処理と、上記コンテンツデータ記憶手段を参照して、上記受信したURLに基づき、当該URLと関連付けて記憶されているコンテンツデータを抽出する処理と、上記キーワード記憶手段を参照して、上記キーワード記憶手段に記憶されているキーワードであって、上記抽出したコンテンツデータ中に含まれるキーワードに対し、当該キーワードを含むコンテンツデータの一覧により構成されるWebページの取得を要求するリンクを生成する処理と、上記キーワードにリンクが生成されたコンテンツデータをインターネット上でアクセス可能なWebページに変換する処理と、上記変換されたWebページを上記外部端末に対して送信する処理とを実行させる。
本発明によれば、検索エンジン、更にはインターネット利用者に対して、データベースに記憶されている情報を検索可能なものとした上、当該情報から構成されるWebページを動的に生成することができる。
また、キーワードに対してリンクが生成されることから、ユーザがより興味を持っている情報へアクセスしやくすることができる。
次に、本発明の第一の実施形態について図を参照して説明する。
図1は、第一の実施形態に係る検索最適化装置1を利用したシステムの全体構成、及び、本システムを運用する管理者の下に設置される検索最適化装置1と、検索最適化装置1とインターネットを介して通信可能に構成された外部端末2とが備える機能を示した機能ブロック図である。
なお、外部端末2は、ユーザ端末3及び検索エンジン4の総称である。
ユーザ端末3は、インターネットを介して検索最適化装置1にアクセスして、所定のWebページの送信を要求するユーザが利用する端末である。このユーザ端末3は、例えば、いわゆるパーソナルコンピュータ、PDA(Personal Digital Assistance)、携帯電話機等で構成することができ、少なくとも、インターネット通信を可能とすべく、所定のWebブラウザ等によって実現される通信処理部31、インターネットを介してデータの入出力を行うためのディスプレイ、マウス、キーボード等の入出力部32を備えている。
検索エンジン4は、コンピュータ実行可能な所定の情報検索プログラムを実行することにより、Webサーバを巡回して、Webサーバが有するコンテンツ情報を収集する装置である。
この検索エンジン4は、クローラ40、及びインターネット通信を可能にする通信処理部44によって構成される。
クローラ40は、アンカータグ等の情報に基づいてリンクされているWebサイトを巡回してインターネット上のWebサイト情報を収集する。
具体的には、所定のプログラムに基づいてクローリングを実行するクローリング実行部41、クローリングにより収集されたWebサイトのHTMLから形態素解析によりキーワードを切り出し、これを当該WebサイトのURLと対応付けてインデクス43を作成するインデクサ42等により構成される。
検索エンジンは、ユーザ端末3からキーワードが供給されると、インデクス43からキーワードに該当するWebサイトのURL等の情報を抽出し、これを検索結果としてユーザ端末3に提供する。
検索最適化装置1は、外部端末2からのWebページの取得要求に応じてWebページを配信する処理を実行するコンピュータである。この検索最適化装置1は、CPU(Central Processing Unit)、CPUが実行するコンピュータプログラム、コンピュータプログラムや所定のデータを記憶するRAM(Random Access Memory)及びハードディスクドライブなどの外部記憶装置により図1に示す各機能ブロックを構成することができる。
即ち、図1に示す機能ブロックは、コンテンツデータ記憶部11、キーワード記憶部12、解析処理部13、更新処理部14、コンテンツデータ抽出部15、リンク生成処理部16、変換処理部17、通信処理部18から構成される。
コンテンツデータ記憶部11は、外部端末2に対して送信されるWebページを構成するコンテンツデータが記憶された記憶部である。
このコンテンツデータ記憶部には、例えば、図2に示すように、タイトル51、固有のURL52、本文データ53、画像54、55、56からなるコンテンツデータが夫々相互に関連付けて記憶されている。
画像54、55、56には、PNG(Portable Network Graphics)、JPEG(Joint Photographic Experts Group)やGIF(Graphic Interchange Format)等の画像形式により画像を記憶することができる。
なお、本実施形態においては、記憶できる画像数を画像54、55、56の3つとしているが、これに限るものではなく、任意に構成することができる。
キーワード記憶部12は、検索に用いられるキーワードを記憶することができる記憶部である。このキーワード記憶部には、例えば、図3に示すように、キーワード61と、当該キーワードの説明データ62、当該キーワードを抽出した回数であるカウント数63、当該キーワードを抽出した日時であるタイムスタンプ64を関連付けて記憶することができる。
なお、キーワード記憶部12に記憶されるキーワード61、及びカウント数63は、後述する更新処理部14により更新されるが、キーワード記憶部12に対して直接入力可能な入力部(図示省略)から直接入力することによって記憶させてもよい。
解析処理部13は、外部端末2からWebページの取得要求を受信する際に、HTTPヘッダからリファラーを取得すると共に、当該リファラーを解析してリンク元のURLを特定し、更に、当該URLのパラメータにキーワードが含まれる場合には、当該キーワードを抽出する。この際、上記抽出したキーワードはURLエンコード化されているので、デコード処理を実行する。
なお、例えば、リンク元URLにキーワードが複数含まれ、当該複数のキーワードの論理積による検索結果が要求された場合には、キーワード毎に抽出することができる。即ち、リンク元URL中に「不動産 東京 マンション」と3つのキーワードが含まれていた場合には、「不動産」、「東京」、「マンション」という各キーワード毎に抽出することができる。
更新処理部14は、解析処理部13によりキーワードが抽出された際に、キーワード記憶部12を更新する処理を実行する。即ち、既にキーワード記憶部12に記憶されているキーワードが抽出された際には、同じキーワードのカウント数を抽出数に応じて加算し、キーワード記憶部に記憶されていないキーワードが抽出された際には、当該キーワードを新たに記憶することにより、キーワード記憶部12を更新する処理を実行する。
コンテンツデータ抽出部15は、外部端末2からのWebページの取得要求に応じて、当該Webページを構成するコンテンツデータをコンテンツデータ記憶部11から抽出する処理を実行する。
当該抽出処理は、各コンテンツデータ固有のURLを指定して、当該コンテンツデータにより構成されるWebページの取得要求を受信した場合には、当該URLに係るコンテンツデータをコンテンツデータ記憶部11から抽出する。
一方、所定のキーワードを含むコンテンツデータの一覧により構成されるWebページの取得要求を受信した場合には、当該キーワードに基づき、コンテンツデータ記憶部11を検索して、当該キーワードをタイトル51又は本文データ53内に含むコンテンツデータをコンテンツデータ記憶部11から抽出する。
なお、コンテンツデータ記憶部11を検索する処理は、例えば、形態素解析により実行することができる。即ち、コンテンツデータを言語解析し、形態素の品詞情報等を記憶した言語解析辞書を参照して当該コンテンツデータを形態素に分け、これをキーワードと照合して当該キーワードを含むコンテンツデータを特定することにより実行することができる。
リンク生成処理部16は、キーワード記憶部12を参照して、カウント数63について上位X件のキーワードを特定した上、コンテンツデータ抽出部15により抽出されたコンテンツデータ中に、当該特定されたキーワードと同じ文字が存在するか否かを判断し、存在する場合には、当該コンテンツデータ内の文字に対してリンクを生成する。なお、抽出する件数(上位X件)は任意に設定することができる。また、キーワード記憶部12に記憶されているキーワードの総数の一定割合の件数分を上記X件として抽出するよう設定することもできる。例えば、キーワード総数の5分の1の件数を上記X件として設定することで、キーワードが100件ある場合には、100件の5分の1である20件が上記X件に該当し、上位20件のキーワードが抽出される。これにより、ユーザ等が間違って入力したキーワードを抽出しても、当該抽出したキーワードに対してリンクが生成されるのを防ぐことができる。また、コンテンツデータ記憶部11を特定の内容からなるコンテンツデータにより構成し、当該特定の内容に係る情報を提供するWebサイトを構築した場合に、当該特定の内容との関係性が乏しいキーワードにリンクが生成されるのを防いで、当該特定の内容に特化したサイトを構築することができる。例えば、コンテンツデータ記憶部12を不動産に関するコンテンツデータにより構成し、不動産に特化したWebサイトを提供する場合、コンテンツデータ中の不動産とは関係ないキーワードにリンクが生成されるのを防ぐことができ、不動産に関して有意義なキーワードに対してのみリンクを生成することができる。即ち、このように間違って入力されたキーワードや特定の内容と関係性が乏しいキーワードは、通常、抽出件数が少ないため、上位X件のキーワードのみを抽出することで、これらのキーワードにリンクが生成されるのを防ぐことができる。
ここで、生成されるリンクは、当該リンクを生成する対象の文字をキーワードとして、当該キーワードを含むコンテンツデータの一覧により構成されるWebページを要求するURLである。例えば、コンテンツデータ抽出部15により抽出されたコンテンツデータの本文データ中に「横浜」という文字があり、キーワード記憶部12に記憶されているキーワードのカウント数上位X件に「横浜」というキーワードが含まれている場合には、上記コンテンツデータ内の「横浜」という文字にリンクを生成する。そして、この「横浜」という文字に生成されたリンクは、「横浜」をキーワードとして、当該「横浜」というキーワードをコンテンツデータ内に含むコンテンツデータの一覧により構成されるWebページにアクセスするものである。
変換処理部17は、コンテンツデータ抽出部15によりコンテンツデータ記憶部11から抽出されたコンテンツデータに対して、Webページを表示するためのタグを生成し、表示形態のコンテンツデータをHTMLソースに記述する。ここで、表示形態とは、各コンテンツデータの表示位置や表示方法、フォントなどであり、コンテンツデータに含まれる各項目やWebページのデザインを考慮して予め設定されているものである。また、リンク生成処理部16により特定されたキーワードがコンテンツデータ内に含まれる場合には、キーワード記憶部12において当該キーワードと関連付けて記憶されている説明データを抽出し、当該説明データについても、上記抽出されたコンテンツデータと同様に、Webページを表示するためのタグを生成し、表示形態のコンテンツデータをHTMLソースに記述する。
そして、上記コンテンツデータに対して、リンク生成処理部16により生成されたリンクをHTMLソースに埋め込む。
この結果、各コンテンツデータ固有のURLに係るWebページの取得要求を受信していた場合には、当該固有のURLに係るHTMLソースが生成される。
一方、所定のキーワードを含むコンテンツデータの一覧により構成されるWebページの取得要求を受信していた場合には、変換処理により生成されたHTMLソースを特定するためのURLが生成されて、当該URLに係るHTMLソースが生成される。なお、ここにおいて生成されるURLには、上記所定のキーワードがパラメータとして含まれている。
また、上記HTMLソースに対応するURLは、例えば、Apacheのmod_rewriteの機能により、動的URLから静的URLに変換することができる。
通信処理部18は、外部端末2との間でインターネットを介して所定のプロトコルに従ってデータの送受信処理を実行する。この通信処理部18は、例えば、外部端末2からWebページの取得要求を受信したり、変換処理部17による変換処理が実行されたWebページを外部端末2に対して送信したりする。
次に、本実施形態における検索最適化装置により実行される一連の処理の流れを図を参照して説明する。
まず、検索最適化装置1の初期状態においては、コンテンツデータ記憶部15内に記憶されているコンテンツデータから構成されるWebページ自体はリンクを有していないので、検索エンジン4によるクローリングの対象とする。
この方法としては、例えば、図4に示すコンテンツデータから構成されるWebページの一つ(以下、初期Webページ80という)に関するURL情報を、クローリングの対象として検索エンジン4に直接記憶させることで、クローリング実行部41が当該Webページをクローリングする。なお、初期Webページ80は、一のコンテンツデータをWebページとして構成したものであって、当該コンテンツデータ固有のアドレス81、タイトル82、本文データ83、画像84、85、86の出力欄が設けられており、各項目は、それぞれ、コンテンツデータ記憶部11に記憶されているリンク52、タイトル51、本文データ53、画像54、55、56に対応する。
また、クローリングの対象とするための他の方法として、初期Webページ80を外部のWebサイトにリンクさせてもよい。これにより、クローリング実行部41が上記外部のWebサイトのリンクをたどって、初期Webページ80に関するURL等の情報を取得し、この情報がインデクサ42によってインデクス43に記憶される。
以上により、初期Webページ80が検索エンジン4により検索可能なWebページとしてユーザに提供される。
続いて、この状態から、キーワード記憶部12にキーワードが記憶されるまでの処理について説明する。
図5に示すように、ユーザが、初期Webページ80に含まれる文字をキーワードとして、検索エンジン4に対して検索を要求すると(S101)、検索エンジン4は、当該キーワードと関連付けられているWebサイト情報をインデクス43から抽出する(S102)。そして、当該抽出したWebサイト情報を図6の出力イメージに示される検索結果としてユーザ端末3に対して送信する(S103)。
図6は、ユーザが、検索エンジン4に対して、キーワードを「横浜」として要求した検索結果の出力イメージであるが、当該検索結果を示すWebページ(以下検索結果ページ90という)のURL91には、検索エンジン4において使用されている文字コードに従ってURLエンコード化された「横浜」というキーワードが含まれている。
そして、この検索結果ページ90中には、初期Webページ80のURL情報を含むサイト情報92が含まれている。
ユーザが、ユーザ端末3により、サイト情報92に含まれるURLに基づき、検索結果ページ90上から、検索最適化装置1に対して初期Webページ80の取得要求を送信した場合において、キーワードがキーワード記憶部12に記憶されるまでの処理の流れを図7、9に示す。
まず、初期Webページ80の取得要求を受信してから、キーワード記憶部12にキーワードが記憶されるまでの処理について図7により説明する。
ユーザが、ユーザ端末3により、検索結果ページ90上から検索最適化装置1に対して初期Webページ80の取得要求を送信すると、検索最適化装置1は、当該取得要求を受信すると共に、解析処理部13により、HTTPヘッダからリファラーを取得した上(S111)、当該リファラーからリンク元URLを特定する(S112)。ここにおいて、リンク元URLは、検索結果ページ90のURL91であり、このURL91にはURLエンコード化された「横浜」というキーワードが含まれている。
解析処理部13は、上記URLエンコード化されている「横浜」というキーワードを抽出すると共にデコードする(S113)。そして、当該抽出されたキーワードは、更新処理部14によりキーワード記憶部12に記憶される(S114)。
これにより、まず一つ目のキーワードがキーワード記憶部12に記憶されたことになる。
続いて、上述の通りキーワードを記憶した後、初期Webページ80の取得要求に応じて初期Webページ80をユーザ端末3に対して送信するまでの処理を図8により説明する。
コンテンツデータ抽出部15は、コンテンツデータ記憶部11を参照して、要求されたURLと関連付けて記憶されているコンテンツデータを抽出する(S121)。
そして、キーワード記憶部12を参照して、キーワードを抽出する(S122)。なお、通常、キーワードの抽出は、キーワード記憶部12に記憶されているキーワードのうち、カウント数が上位X件のものを抽出するが、ユーザ端末3から初めてアクセスがあった状況においては、キーワードが一件記憶されたばかりであり、当該キーワードが抽出される。ただし、ユーザが、最初の検索時に複数のキーワードを用いて検索を行っていた場合には、記憶されているキーワードも複数であるが、当該キーワードの件数がX件に満たない限りは、全てのキーワードが抽出される。本例においては、「横浜」というキーワードが一件記憶された状況にあるものとして説明する。
リンク生成処理部16は、上記抽出されたコンテンツデータについて、上記抽出したキーワードと同じ文字に対してリンクを生成する(S123)。即ち、キーワード記憶部12に記憶されている「横浜」というキーワードと同じ、上記抽出されたコンテンツデータ中の「横浜」という文字にリンクを生成する。
ここにおいて生成されるリンクは、当該リンクを生成した文字をキーワードとして含むコンテンツデータから構成されるWebページを要求するものである。
リンクが生成されると、変換処理部17は、コンテンツデータをWebページに変換する(S124)。
この変換処理は、上記抽出されたコンテンツデータに対して、Webページを表示するためのタグを生成し、表示形態のコンテンツデータをHTMLソースに記述することにより行なわれる。また、リンク生成処理部16により生成されたリンクをHTMLソースに埋め込む。
この結果、各コンテンツデータ固有のURLに係るHTMLソースが生成される。
上記の通り変換されたWebページは、通信処理部18により、図9の出力イメージに示すWebページ100として外部端末2に対して送信される(S125)。
即ち、図9に示すように、固有のアドレス101に係るWebページ100上には、タイトル102、本文データ103、画像104、105、106の出力欄が設けられており、各項目は、それぞれ、コンテンツデータ記憶部11に記憶されているタイトル51、本文データ53、画像54、55、56に対応する。また、本文データ103中においては、リンク生成処理部16により「横浜」という文字にリンク103aが生成されている。
以上により、キーワードがキーワード記憶部12に記憶されると共に、初期Webページ80内にリンク103aが生成され、リンク103aを検索エンジン4のクローリング実行部41がたどることで、リンク103aのリンク先のWebページが新たにインデクス43に記憶され、検索エンジン4による検索結果としてユーザに対して供給されるコンテンツデータが増え、最終的には全てのコンテンツデータが検索対象となる。
次に、以上のようにして検索エンジン4によるクローリング、及びユーザ端末3からのアクセスが繰り返し行われ、キーワード記憶部12に記憶されているキーワードが所定の件数Xを超え、コンテンツデータ記憶部15に記憶されているコンテンツデータの全てが検索エンジン4の検索対象となった状況において、外部端末2からWebページの取得要求を受信し、これに応じてキーワード記憶部12を更新すると共に、Webページを返信するまでの処理の流れについて説明する。
まず、リンク元のWebページのURLからキーワードを抽出し、キーワード記憶部12を更新するまでの処理について、図10により説明する。
検索最適化装置1は、外部端末2から所定のURLと共に、当該URLに係るWebページの取得要求を受信する(S201)。なお、当該Webページの取得要求の受信する際に、HTTPヘッダからリファラーを取得する。
上記Webページの取得要求の一例は、検索エンジン4による所定のキーワードに基づく検索結果ページ中のURLから行われる。
即ち、図5により既述したように、ユーザ端末3により、検索エンジン4に対して所定のキーワードによるWebサイトの検索結果の取得要求が送信され(S101)、これに対して、検索エンジン4がインデクス43を参照して、上記キーワードと関連付けて記憶されているWebサイト情報を抽出する(S102)。そして、抽出したWebサイト情報を、検索結果ページとしてユーザ端末3に対して送信し(S103)、ユーザが、受信した検索結果ページ中に示されたURLに基づき、検索最適化装置1が有するWebページの取得要求を送信する。
この検索結果ページのURLには、検索に用いたキーワードがパラメータとして含まれている。
また、上記Webページの取得要求の別の一例では、ユーザ端末3、ないしは検索エンジン4のクローリング実行部41が、キーワードをパラメータとして含まない固有のURLを有するWebページ上から、検索最適化装置1が有するWebページへのリンクをたどって当該Webページの取得要求を送信する。
解析処理部13は、上記取得したリファラーからリンク元URLを特定した上(S202)、当該リンク元URLからキーワードが抽出可能か否かを判断する(S203)。
上述したWebページの取得要求の例において、検索エンジン4が有する検索結果ページ中に示されたURLに基づいて、取得要求が行われた場合には、当該検索結果ページのURLには、ユーザが検索したキーワードがパラメータとして含まれており、リファラーから当該キーワードを抽出することが可能である。
一方、ユーザ端末3ないしは検索エンジン4のクローリング実行部41が、キーワードをパラメータとして含まない固有のURLを有するWebページ上から、検索最適化装置1が有するWebページへのリンクをたどって当該Webページの取得要求を送信した場合には、キーワードがパラメータとして含まれていないので、リファラーからキーワードを抽出することができない。
S203の処理において、キーワードが抽出可能な場合には、解析処理部13によりキーワードが抽出されると共にデコードされ(S204)、更新処理部14により、当該抽出したキーワードに基づいて、キーワード記憶部12が更新される(S205)。
この更新処理は、既にキーワード記憶部12に記憶されているキーワードが抽出された場合には、同じキーワードのカウント数を抽出数に応じて加算し、キーワード記憶部12に記憶されていないキーワードが抽出された際には、当該キーワードを新たに記憶することにより実行される。
他方、S203の処理において、キーワードが抽出できない場合には、解析処理部13は、キーワードの抽出処理をキャンセルする(S206)。
これにより、キーワードが随時、追加ないしはカウントされ、ユーザが興味をもつキーワードが収集される。
続いて、検索最適化装置1が配信するWebページ中にリンクを生成する処理について図11により説明する。なお、Webページにリンクを生成する処理は、ユーザ端末3あるいは検索エンジン4のクローリング実行部41からのWebページの取得要求を受信する都度、実行される。
コンテンツデータ抽出部15は、コンテンツデータ記憶部11を参照して、コンテンツデータを抽出する(S211)。
当該抽出処理は、コンテンツデータ固有のURLにより構成されるWebページの取得要求を受けていた場合には、当該URLに基づき、コンテンツデータ記憶部11を検索して、当該URLと関連付けて記憶されているコンテンツデータを抽出することにより行われる。
また、所定のキーワードを含むコンテンツデータの一覧から構成されるWebページの取得要求を受けていた場合には、当該キーワードに基づいてコンテンツデータ記憶部11を検索し、当該キーワードと同一の文字を本文データ等に含むコンテンツデータを抽出することにより行われる。
S211において、コンテンツデータが抽出されると、リンク生成処理部16は、キーワード記憶部12からカウント数が上位X件のキーワードを抽出する(S212)。なお、抽出する件数は、任意に設定することができる。
更に、リンク生成処理部16は、抽出したキーワードと同じ文字が、S212の処理においてコンテンツデータ抽出部15により抽出されたコンテンツデータに含まれるか否かを判断する(S213)。
その結果、上記抽出したキーワードと同じ文字が、上記抽出されたコンテンツデータに含まれる場合には、リンク生成処理部16により、当該コンテンツデータ内の文字に対して、当該文字をキーワードとして含むコンテンツデータの一覧により構成されるWebページの取得を要求するリンクを生成する(S214)。
変換処理部17は、S211の処理において抽出されたコンテンツデータをWebページに変換する(S215)。
この変換処理は、上記抽出されたコンテンツデータに対して、Webページを表示するためのタグを生成し、表示形態のコンテンツデータをHTMLソースに記述することにより行なわれる。また、S214の処理において、リンク生成処理部16によりリンクが生成された場合には、上記抽出されたコンテンツデータに対して、当該生成されたリンクをHTMLソースに埋め込む。また、S212の処理において抽出されたキーワードと同じ文字がコンテンツデータ内に含まれる場合には、キーワード記憶部12において当該キーワードと関連付けて記憶されている説明データを抽出し、当該説明データについても、上記抽出されたコンテンツデータと同様に、Webページを表示するためのタグを生成し、表示形態のコンテンツデータをHTMLソースに記述する。
この結果、各コンテンツデータ固有のURLに係るWebページの取得要求を受信していた場合には、当該固有のURLに係るHTMLソースが生成される。
一方、所定のキーワードを含むコンテンツデータの一覧により構成されるWebページの取得要求を受信していた場合には、変換処理により生成されたHTMLソースを特定するためのURLが生成されて、当該URLに係るHTMLソースが生成される。なお、ここにおいて生成されるURLには、上記所定のキーワードがパラメータとして含まれている。
各コンテンツデータ固有のURLに係るWebページの取得要求を受信していた場合において、変換処理部17により変換されたWebページの出力画面の一例を図12に示す。即ち、図12に示すように、各コンテンツデータ固有のURL111に係るWebページ110上には、タイトル112、本文データ113、画像114、115、116、説明データ117の出力欄が設けられており、各項目は、それぞれ、コンテンツデータ記憶部11に記憶されているタイトル51、本文データ53、画像54、55、56、キーワード記憶部12に記憶されている説明データ62に対応する。また、本文データ112中においては、リンク生成処理部16によりキーワードにリンク113a、113b、113cが生成されている。また、説明データ116の欄には、各キーワード113a、113b、113cごとに説明データが出力されている。
一方、所定のキーワードを含むコンテンツデータの一覧により構成されるWebページの取得要求を受信していた場合において、変換処理部17により変換されたWebページの出力画面の一例を図13に示す。即ち、図13に示すように、当該Webページ120上には、コンテンツデータ抽出部15により、上記所定のキーワードを含むものとして抽出されたコンテンツデータ120a、120b、120cの一覧が出力されている。更に、コンテンツデータ120aにおいては、リンクが貼られたタイトル122、本文データ123、画像124の出力欄が設けられおり、本文データ123中においては、キーワード記憶部12に記憶され、カウント数が上位X件に含まれるキーワードと同じ文字に対して、リンク生成処理部16によりリンク123a、123b、123cが生成されている。また、本文データ123中には、少なくとも、上記所定のキーワードが文字として含まれており、上記所定のキーワードがキーワード記憶部12に記憶され、カウント数が上位X件に含まれるものである場合には、上記所定のキーワードと同一の文字に対してもリンクが生成されることになる。即ち、Webページ120の例では、検索で指定された「横浜」というキーワードが本文データ123中には含まれており、この「横浜」というキーワードがキーワード記憶部12にカウント数上位X件内に記憶されている場合を示している。
タイトル122に対して生成されているリンクのURLは、各コンテンツデータ固有のURLであり、当該リンク先に進むことによって、図12に示されるWebページ110を取得することができる。
また、このWebページ120のURL121には、検索において指定された「横浜」というキーワードがパラメータとして含まれている。
なお、このWebページ120は、コンテンツデータのうちの一部のみを抽出して検索結果として表示しており、図12における画像115、画像116、説明データ117が省かれているが、この表示の構成は、これに限らず、例えば、本文データの一部のみを表示するようにしたり、画像データは表示しないようにしたりすることができる。
また、キーワードにより検索されたコンテンツデータの数が多い場合に、所定の件数毎にコンテンツデータを表示すべく、出力されるコンテンツデータを切り換えるための「次の○○件」ボタン125が、必要に応じて設けられている。
通信処理部18は、上記の通り変換されたWebページを外部端末2に対して送信し(S216)、一連の処理を終了する。
これにより、外部端末2に対して、コンテンツデータ記憶部11に記憶されているコンテンツデータを検索可能なものとした上、当該コンテンツデータから構成されるWebページを動的に生成することができる。また、ユーザが検索エンジン4を使用した際に指定したキーワードが収集され、コンテンツデータ中の、当該キーワードと同一の文字にリンクが貼られることになるので、ユーザにとって有用なリンクが生成されたWebページを供給することができる。
ここで、上記処理において、Webページ上のキーワードと同一の文字対して生成されたリンクから、リンク先へと進んだ場合の流れについて説明する。
まず、ユーザ端末3あるいは検索エンジン4により、図12に示すWebページ110上から、「港北区」という文字に生成されたリンク113bからリンク先のWebページの取得が要求された場合、検索最適化装置1は、まず、解析処理部13によりリンク先Webページの取得要求と共に取得したリファラーを解析して、リンク元WebページであるWebページ110のURL111を特定する。特定されたURL111にはキーワードが含まれていないため、解析処理部13は以降の解析処理をキャンセルする。
そして、コンテンツデータ抽出部15は、コンテンツデータ記憶部11を参照して、「港北区」をキーワードとして、当該「港北区」というキーワードと同一の文字を含むコンテンツデータを検索して抽出する。更に、リンク生成処理部16は、キーワード記憶部12を参照してカウント数上位X件のキーワードを抽出し、上記抽出したコンテンツデータについて、上記抽出したキーワードと同一の文字にリンクを生成する。更に、変換処理部17が、上記リンクが生成されたコンテンツデータをWebページに変換し、通信処理部18が当該Webページをユーザ端末3あるいは検索エンジン4に対して送信する。
ここで、上記の通り送信されるWebページの一例を図14に示す。図14に示すように、Webページ130上には、本文データ133内に「港北区」というキーワードが含まれたコンテンツデータ130a、130b、130cが抽出されており、キーワード記憶部12に記憶されているカウント数上位X件のキーワードと同一の文字にはリンク133a、133b、133cが生成されている。また、このWebページ131のURLには、「港北区」というキーワードがパラメータとして含まれている。
一方、ユーザ端末3あるいは検索エンジン4により、図13に示すWebページ120上から「港北区」というキーワードに生成されたリンク123bからリンク先のWebページの取得が要求された場合、検索最適化装置1は、まず、解析処理部13によりリンク先Webページの取得要求と共に取得したリファラーを解析して、リンク元WebページであるWebページ120のURL121を特定する。特定されたURL121には「横浜」というキーワードが含まれているため、解析処理部13が当該キーワードを抽出すると共に、更新処理部14が当該キーワードをキーワード記憶部12に記憶することにより、キーワード記憶部12を更新する。
そして、コンテンツデータ抽出部15は、コンテンツデータ記憶部11を参照して「港北区」という文字を含むコンテンツデータを検索して抽出する。更に、リンク生成処理部16は、キーワード記憶部12を参照してカウントする上位X件のキーワードを抽出し、上記抽出したコンテンツデータについて、上記抽出したキーワードと同一の文字にリンクを生成する。更に、変換処理部17が、上記リンクが生成されたコンテンツデータをWebページに変換し、通信処理部18が当該Webページをユーザ端末3あるいは検索エンジン4に対して送信する。
ここで、上記の通り送信されるWebページの一例は、上述した図14のWebページ130と同様に示される。即ち、Webページ130上には、本文データ133内に「港北区」というキーワードが含まれたコンテンツデータ130a、130b、130cが抽出されており、キーワード記憶部12に記憶されているカウント数上位X件のキーワードと同一の文字にはリンク133a、133b、133cが生成されている。また、このWebページ131のURLには、「港北区」というキーワードがパラメータとして含まれている。
同様にして、Webページ130上から、リンク133a、133b、133cにアクセスすることで、リンクが生成されている「横浜」、「港北区」、「東横線」というキーワードがキーワード記憶部12に記憶されていく。
また、検索エンジン4のクローリング実行部41がWebページ130をクローリングすることによって、当該Webページ130がインデクサ42によりインデクス43に記憶され、検索エンジン4を介したキーワード検索において、Webページ130が検索対象となる。
次に、本発明の第二の実施形態について図を参照して説明する。なお、本第二の実施形態では、コンテンツデータ中において、リンクを生成するキーワードを、カウント数ではなく、更新日時に基づいて選択する。
図13は、本第二の実施形態に係る検索最適化装置1を利用したシステムの全体構成、及び、本システムを運用する管理者の下に設置される検索最適化装置1と、検索最適化装置1とインターネットを介して通信可能に構成された外部端末2とが備える機能を示した機能ブロック図である。
なお、本第二の実施形態において、外部端末2は、既述した第一の実施形態における外部端末2と同様の構成を有する。
本第二の実施形態において、検索最適化装置1は、コンテンツデータ記憶部11、キーワード記憶部12、解析処理部13、更新処理部14、コンテンツデータ抽出部15、リンク生成処理部16、変換処理部17、通信処理部18、計時部19の各機能ブロックを有する。
ここで、コンテンツデータ記憶部11、解析処理部13、コンテンツデータ抽出部15、変換処理部17、通信処理部18は、既述した第一の実施形態において対応する各機能ブロックと同様の機能を果たす。
計時部19は、随時、現在日時を計測し、更新処理部14及びリンク変換処理部16の要求に応じて、現在日時を更新処理部14に対して供給する。
キーワード記憶部12は、第一の実施形態と同様、検索に用いられるキーワードを記憶することができる記憶部であるが、本第二の実施形態においては、図14に示すように、キーワード61、説明データ62、カウント数63に加えて、タイムスタンプ64を記憶することができる。
タイムスタンプ64には、更新処理部14によりキーワード記憶部12が更新された際に、当該更新された日時をキーワード毎に記憶することができる。
更新処理部14は、第一の実施形態と同様、解析処理部13によりキーワードが抽出された際に、キーワード記憶部12を更新する処理を実行するが、本第二の実施形態においては、更に、解析処理部13によりキーワードが抽出された後、更新処理部14により当該抽出されたキーワードに基づきキーワード記憶部12を更新する際に、計時部19から現在日時を取得して、当該日時をタイムスタンプ64に上書して更新する処理を実行する。
リンク生成処理部16は、計時部19から現在日時を取得した上、所定の日時、例えば、現在日時の1ヶ月前の日時を割り出す。そして、キーワード記憶部12に記憶されているタイムスタンプ64に基づき、当該タイムスタンプ64に記憶されている日時が、上記割り出した1ヶ月前の日時よりも新しいキーワードを特定する。その上で、コンテンツデータ抽出部15により抽出されたコンテンツデータ中に、当該特定されたキーワードが存在するか否かを判断し、存在する場合には、当該コンテンツデータ内のキーワードに対してリンクを生成する。なお、本例においては、上記所定の日時は、任意に設定することができる。
なお、既述した第一の実施形態と同様、リンクの生成は、当該リンクを生成する対象のキーワードを検索キーワードとして、当該キーワードを含むコンテンツデータの一覧により構成されるWebページを要求するURLを生成することにより行なわれる。
本第二の実施形態において、リンクを生成するキーワードを特定する処理について図15により説明する。なお、本第二の実施形態は、既述した第一の実施形態におけるリンクを生成するキーワードを特定する処理の別の例である。
図8に示すように、第一の実施形態と同様にしてS211までの処理が行われた後、リンク生成処理部16は、計時部19に対して現在日時の取得を要求して、現在日時を取得する(S301)。
そして、現在日時から、予め設定された所定の日時を割り出す。例えば、現在日時によりも1ヶ月前の日時が所定の日時として設定されていた場合には、現在日時から1ヶ月前の日時を割り出す(S302)。
こうして割り出された日時に基づき、キーワード記憶部12を参照して、タイムスタンプ64が上記割り出された日時よりも新しいキーワードを特定する(S303)。そして、当該特定したキーワードを抽出する(S304)。
そして、上記抽出されたキーワードに基づき、S213以降の処理が行われ、要求されたWebページが外部端末2に対して送信される。
これにより、近時、ユーザが最も興味を持っているキーワードに対してリンクが貼られことになり、ユーザを、より興味のある情報へアクセスしやすくすることができる。
また、上述した第一及び第二の実施形態においては、キーワード記憶部12に記憶するキーワードは、解析処理部13がリンク元URLから抽出するものとしたが、例えば、コンテンツデータ記憶部11に記憶されているコンテンツを提供するWebサイト上に、コンテンツのキーワード検索を可能とするキーワード入力欄を設け、当該キーワード入力欄にキーワードが入力されて検索が実行された場合には、当該キーワードを解析処理部13により抽出し、キーワード記憶部12に記憶するようにしてもよい。これにより、当該Webサイトにおいて提供されるコンテンツに興味のあるユーザを母集団としてキーワードが抽出されるので、ユーザが興味をもつと共に、Webサイトの特徴に合ったキーワードに対してリンクを生成することができる。
本発明の実施の形態に係る検索最適化装置を用いたシステムの全体構成及び各機能ブロックを示した図である。 本実施形態に係るコンテンツデータ記憶部に記憶されるデータの一例を示した図である。 本実施形態に係るキーワード記憶部に記憶されるデータの一例を示した図である。 本実施形態に係る検索最適化装置における初期Webページを出力イメージの一例である。 ユーザ端末と検索エンジン間におけるキーワード検索の処理の一例を示したシーケンス図である。 検索エンジンによる検索結果をWebページとして出力したイメージの一例を示した図である。 本実施形態に係る検索最適化装置の初期状態において、Webページの取得要求を受信してからキーワード記憶部を更新するまでの処理フローを示した図である。 本実施形態に係る検索最適化装置の初期状態において、コンテンツデータを抽出してから、Webページを送信するまでの処理フローを示した図である。 本実施形態に係る検索化最適化装置の初期状態において、外部端末に送信されるWebページの一例である。 本実施形態に係る検索最適化装置において、Webページの取得要求を受信してからキーワード記憶部を更新するまでの処理フローを示した図である。 本実施形態に係る検索最適化装置において、コンテンツデータを抽出してからWebページを送信するまでの処理フローを示した図である。 本実施形態において、外部端末に送信されるWebページの一例である。 本実施形態において、外部端末に送信されるWebページの別の一例である。 本実施形態において、外部端末に送信されるWebページの別の一例である。 本発明の第二の実施形態に係る検索最適化装置を用いたシステムの全体構成及び各機能ブロックを示した図である。 本第二の実施形態に係るコンテンツデータ記憶部に記憶されるデータの一例を示した図である。 本第二の実施形態に係る検索最適化装置により処理フローを示した図である。
符号の説明
1 検索最適化装置
2 外部端末
3 ユーザ端末
4 検索エンジン
11 コンテンツデータ記憶部
12 キーワード記憶部
13 解析処理部
14 更新処理部
15 コンテンツデータ抽出部
16 変換処理部
17 リンク生成処理部
18 通信処理部
19 計時部
31 通信処理部
32 入出力部
40 クローラ
41 クローリング実行部
42 インデクサ
43 インデクス
44 通信処理部

Claims (9)

  1. 外部端末とネットワークを介して通信可能に構成され、上記外部端末からの要求に応じてWebページを送信する装置であって、
    Webページを構成するコンテンツデータを、当該コンテンツデータ毎の固有のURLと関連付けて記憶するコンテンツデータ記憶手段と、
    キーワードを記憶するキーワード記憶手段と、
    上記外部端末から、所定のURLと共に、当該URLに係るコンテンツデータにより構成されたWebページの取得要求を受信する取得要求受信手段と、
    上記コンテンツデータ記憶手段を参照して、上記受信したURLに基づき、当該URLと関連付けて記憶されているコンテンツデータを抽出するコンテンツデータ抽出手段と、
    上記キーワード記憶手段を参照して、上記キーワード記憶手段に記憶されているキーワードであって、上記抽出したコンテンツデータ中に含まれるキーワードに対し、当該キーワードを含むコンテンツデータの一覧により構成されるWebページの取得を要求するリンクを生成するリンク生成手段と、
    上記キーワードにリンクが生成されたコンテンツデータをインターネット上でアクセス可能なWebページに変換する変換処理手段と、
    上記変換されたWebページを上記外部端末に対して送信するWebページ送信手段と、を有する、
    ことを特徴とする検索最適化装置。
  2. 上記キーワード記憶手段は、更に、キーワード毎に当該キーワードに対する説明データを関連付けて記憶し、
    上記変換処理手段は、上記キーワード記憶手段を参照して、上記抽出したコンテンツデータ中のキーワードと関連付けて記憶されている説明データを抽出し、当該抽出した説明データを、上記キーワードにリンクが生成されたコンテンツデータと共に、インターネット上でアクセス可能なWebページに変換する、
    請求項1記載の検索最適化装置。
  3. 上記取得要求受信手段は、上記外部端末から、所定のキーワードを含むコンテンツデータの一覧から構成されるWebページの取得要求を受信し、
    上記コンテンツデータ抽出手段は、上記コンテンツデータ記憶手段を参照して、上記所定のキーワードに基づき、上記所定のキーワードを含むコンテンツデータを抽出する、
    請求項1又は2記載の検索最適化装置。
  4. 上記取得要求受信手段によりWebページの取得要求を受信する際に、リファラーを取得するリファラー取得手段と、
    上記取得したリファラーを解析して、リンク元ページのURLを特定した上、当該URLのパラメータからキーワードを抽出するキーワード抽出手段と、を有し、
    上記抽出したキーワードが上記キーワード記憶手段に記憶されていない場合に、当該キーワードを上記キーワード記憶手段に追加することにより、上記キーワード記憶手段を更新するキーワード更新手段、を有する、
    請求項1乃至3いずれかの項に記載の検索最適化装置。
  5. 上記キーワード記憶手段は、更に、上記キーワード抽出手段により抽出されたキーワードをカウントして当該カウント数を記憶し、
    上記キーワード更新手段は、更に、上記キーワード抽出段により、既に上記キーワード記憶手段に記憶されているキーワードと同一のキーワードが抽出された場合に、上記カウント数を上書きすることにより上記キーワード記憶手段を更新し、
    上記リンク生成手段は、上記キーワード記憶手段を参照して、カウント数が多い上位の所定の件数のキーワードであって、上記生成したWebページに含まれるキーワードに対し、当該キーワードを含むコンテンツデータの一覧により構成されるWebページの取得を要求するリンクを生成する、
    請求項4記載の検索最適化装置。
  6. 現在日時を計測する計時手段、を有し、
    上記キーワード記憶手段は、更に、キーワード毎に、当該キーワードを追加又は更新した日時からなる日時情報を記憶し、
    上記キーワード更新手段は、更に、上記キーワード抽出手段によりキーワードが抽出された際に、当該日時を上記計時手段により取得して上記日時情報に上書きすることにより上記キーワード記憶手段を更新し、
    上記リンク生成手段は、上記キーワード記憶手段を参照して、日時情報が所定の日時より新しいキーワードであって、上記生成したWebページに含まれるキーワードに対し、当該キーワードを含むコンテンツデータの一覧により構成されるWebページの取得を要求するリンクを生成する、
    請求項4記載の検索最適化装置。
  7. 上記キーワード更新手段は、更に、上記計時手段により現在日時を取得すると共に、上記キーワード記憶手段を参照して、上記日時情報から所定の期間が経過したキーワードを消去することによりキーワード記憶手段を更新する、
    請求項6記載の検索最適化装置。
  8. 外部端末とネットワークを介して通信可能に構成され、Webページを構成するコンテンツデータを、当該コンテンツデータ毎の固有のURLと関連付けて記憶するコンテンツデータ記憶手段と、キーワードを記憶するキーワード記憶手段とを有するコンピュータにより、上記外部端末からの要求に応じてWebページを送信する処理を実行する方法であって、
    上記コンピュータが、
    上記外部端末から、所定のURLと共に、当該URLに係るコンテンツデータにより構成されたWebページの取得要求を受信する処理と、
    上記コンテンツデータ記憶手段を参照して、上記受信したURLに基づき、当該URLと関連付けて記憶されているコンテンツデータを抽出する処理と、
    上記キーワード記憶手段を参照して、上記キーワード記憶手段に記憶されているキーワードであって、上記抽出したコンテンツデータ中に含まれるキーワードに対し、当該キーワードを含むコンテンツデータの一覧により構成されるWebページの取得を要求するリンクを生成する処理と、
    上記キーワードにリンクが生成されたコンテンツデータをインターネット上でアクセス可能なWebページに変換する処理と、
    上記変換されたWebページを上記外部端末に対して送信する処理と、
    を実行することを特徴とする検索最適化方法。
  9. 外部端末とネットワークを介して通信可能に構成され、Webページを構成するコンテンツデータを、当該コンテンツデータ毎の固有のURLと関連付けて記憶するコンテンツデータ記憶手段と、キーワードを記憶するキーワード記憶手段とを有するコンピュータを、上記外部端末からの要求に応じてWebページを送信する処理を実行する検索最適化装置として機能させるためのコンピュータプログラムであって、
    上記コンピュータに対して、
    上記外部端末から、所定のURLと共に、当該URLに係るコンテンツデータにより構成されたWebページの取得要求を受信する処理と、
    上記コンテンツデータ記憶手段を参照して、上記受信したURLに基づき、当該URLと関連付けて記憶されているコンテンツデータを抽出する処理と、
    上記キーワード記憶手段を参照して、上記キーワード記憶手段に記憶されているキーワードであって、上記抽出したコンテンツデータ中に含まれるキーワードに対し、当該キーワードを含むコンテンツデータの一覧により構成されるWebページの取得を要求するリンクを生成する処理と、
    上記キーワードにリンクが生成されたコンテンツデータをインターネット上でアクセス可能なWebページに変換する処理と、
    上記変換されたWebページを上記外部端末に対して送信する処理と、
    を実行させるコンピュータプログラム。
JP2007103863A 2007-04-11 2007-04-11 検索最適化装置、方法、及びコンピュータプログラム Expired - Fee Related JP4002943B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007103863A JP4002943B1 (ja) 2007-04-11 2007-04-11 検索最適化装置、方法、及びコンピュータプログラム
PCT/JP2007/071521 WO2008129710A1 (ja) 2007-04-11 2007-11-06 検索最適化装置、方法、及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007103863A JP4002943B1 (ja) 2007-04-11 2007-04-11 検索最適化装置、方法、及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP4002943B1 JP4002943B1 (ja) 2007-11-07
JP2008262339A true JP2008262339A (ja) 2008-10-30

Family

ID=38769811

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007103863A Expired - Fee Related JP4002943B1 (ja) 2007-04-11 2007-04-11 検索最適化装置、方法、及びコンピュータプログラム

Country Status (2)

Country Link
JP (1) JP4002943B1 (ja)
WO (1) WO2008129710A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010231525A (ja) * 2009-03-27 2010-10-14 Mitsubishi Space Software Kk 検索リスト提供サーバ及び検索リスト提供方法及びプログラム
WO2011118834A1 (ja) * 2010-03-26 2011-09-29 楽天株式会社 ウェブサーバ装置、ウェブサーバプログラム、コンピュータ読み取り可能な記録媒体、及びウェブサービス方法
CN105765573A (zh) * 2013-09-19 2016-07-13 隆泰尔Ux私人有限公司 网站通信量优化方面的改进
JP2022126781A (ja) * 2019-08-30 2022-08-30 データ・サイエンティスト株式会社 コンテンツ配置プログラム、コンテンツ配置装置およびコンテンツ配置方法、Webサイト構築支援プログラム、Webサイト構築支援装置およびWebサイト構築支援方法、ならびに、経済規模出力プログラム、経済規模出力装置および経済規模出力方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4286345B2 (ja) * 1998-05-08 2009-06-24 株式会社リコー 検索支援システム及びコンピュータ読み取り可能な記録媒体
JP3623939B2 (ja) * 2001-12-11 2005-02-23 株式会社エヌ・ティ・ティ・データ リクエストデータを基にした情報提供システム及び方法
JP4496033B2 (ja) * 2004-07-29 2010-07-07 ニフティ株式会社 検索支援プログラム
JP2006065395A (ja) * 2004-08-24 2006-03-09 Fujitsu Ltd ハイパーリンク生成装置、ハイパーリンク生成方法及びハイパーリンク生成プログラム
JP2007034424A (ja) * 2005-07-22 2007-02-08 Fuji Xerox Co Ltd 文書データ処理装置、文書データ処理方法及び文書データ処理プログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010231525A (ja) * 2009-03-27 2010-10-14 Mitsubishi Space Software Kk 検索リスト提供サーバ及び検索リスト提供方法及びプログラム
WO2011118834A1 (ja) * 2010-03-26 2011-09-29 楽天株式会社 ウェブサーバ装置、ウェブサーバプログラム、コンピュータ読み取り可能な記録媒体、及びウェブサービス方法
JP5073874B2 (ja) * 2010-03-26 2012-11-14 楽天株式会社 ウェブサーバ装置、ウェブサーバプログラム、コンピュータ読み取り可能な記録媒体、及びウェブサービス方法
US10534781B2 (en) 2013-09-13 2020-01-14 Longtail Ux Pty Ltd Website traffic optimization
CN105765573A (zh) * 2013-09-19 2016-07-13 隆泰尔Ux私人有限公司 网站通信量优化方面的改进
JP2016533598A (ja) * 2013-09-19 2016-10-27 ロングテイル ユーエックス ピーティワイ リミテッド ウェブサイト・トラフィック最適化の改善
CN105765573B (zh) * 2013-09-19 2020-08-04 隆泰尔Ux私人有限公司 网站通信量优化方面的改进
JP2022126781A (ja) * 2019-08-30 2022-08-30 データ・サイエンティスト株式会社 コンテンツ配置プログラム、コンテンツ配置装置およびコンテンツ配置方法、Webサイト構築支援プログラム、Webサイト構築支援装置およびWebサイト構築支援方法、ならびに、経済規模出力プログラム、経済規模出力装置および経済規模出力方法
JP7262154B2 (ja) 2019-08-30 2023-04-21 データ・サイエンティスト株式会社 コンテンツ配置プログラム、コンテンツ配置装置およびコンテンツ配置方法、Webサイト構築支援プログラム、Webサイト構築支援装置およびWebサイト構築支援方法、ならびに、経済規模出力プログラム、経済規模出力装置および経済規模出力方法
US11756082B2 (en) 2019-08-30 2023-09-12 Datascientist Inc. Content arrangement program, content arrangement device, and content arrangement method, website construction support program, website construction support device, and website construction support method, and economic scale output program, economic scale output device, and economic scale output method

Also Published As

Publication number Publication date
WO2008129710A1 (ja) 2008-10-30
JP4002943B1 (ja) 2007-11-07

Similar Documents

Publication Publication Date Title
JP5474038B2 (ja) モバイルサイトマップ
CN101452453B (zh) 一种输入法网址导航的方法和一种输入法系统
JP6906419B2 (ja) 情報提供装置、情報提供方法、およびプログラム
US8458207B2 (en) Using anchor text to provide context
US8315850B2 (en) Web translation provider
US20120151310A1 (en) Method and system for identifying and delivering contextually-relevant information to end users of a data network
JP2018097846A (ja) Api学習
NZ566291A (en) Methods and devices for post processing rendered web pages and handling requests of post processed web pages
KR20060017501A (ko) 소정의 검색 질의로부터의 검색 결과에 대한 액세스를제공하는 url들로 보완된 검색 엔진
US20110066624A1 (en) system and method of generating related words and word concepts
JP2007249322A (ja) 文書視覚化装置及び文書視覚化プログラム
JP4002943B1 (ja) 検索最適化装置、方法、及びコンピュータプログラム
JP2007072596A (ja) 情報共有システムおよび情報共有方法
US10558631B2 (en) Enhancing textual searches with executables
JPWO2005121982A1 (ja) 情報提供システム、方法、プログラム、情報通信端末、および情報表示切り替えプログラム
JPWO2003060764A1 (ja) 情報検索システム
JP2007128367A (ja) 情報検索ノウハウ管理システム
JP4505389B2 (ja) 広告コンテンツ送信システム、広告コンテンツ送信方法
JP2006155275A (ja) 情報抽出方法及び情報抽出装置
JP5144185B2 (ja) 情報検索システム及び情報検索方法
JP4035623B2 (ja) 情報処理装置およびプログラム
KR20020017966A (ko) 단어 기반 렌더 브라우저를 위한 데이터 처리 시스템에서웹 페이지를 대략 읽거나 속독하기 위한 방법 및 장치
Kowalczyk et al. Enhancing SEO in Single-Page Web Applications in Contrast with Multi-Page Applications
JP5084859B2 (ja) 情報処理装置、データ抽出方法、及びプログラム
JP2007102635A (ja) Blogコミュニティ推薦方法及びシステム及びプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070814

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070820

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100824

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110824

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120824

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees