JP4363868B2 - 検索キーワード分析プログラム及びシステム並びに方法 - Google Patents
検索キーワード分析プログラム及びシステム並びに方法 Download PDFInfo
- Publication number
- JP4363868B2 JP4363868B2 JP2003070281A JP2003070281A JP4363868B2 JP 4363868 B2 JP4363868 B2 JP 4363868B2 JP 2003070281 A JP2003070281 A JP 2003070281A JP 2003070281 A JP2003070281 A JP 2003070281A JP 4363868 B2 JP4363868 B2 JP 4363868B2
- Authority
- JP
- Japan
- Prior art keywords
- access
- search
- search keyword
- data
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
【発明の属する技術分野】
本発明は、WWW(World Wide Web)において、目的のWebページ又はWebサイトを探すために、Web閲覧者(以下、単に「閲覧者」という)からWWW検索システム(以下、「検索システム」という)に入力された検索キーワードの特徴を分析するためのプログラム及びシステム並びに方法に関する。
【0002】
【従来の技術】
インターネットにおけるアクセス先の例として、Webページ又はWebサイトがある。
【0003】
インターネット上のWebページ又はWebサイトは、宣伝広告、情報発信、受注受付などの様々な目的のために運営される。かかる目的を効果的に達成するために、Webページ又はWebサイトが分析、調査される。
【0004】
例えば、分析者は、分析対象のWebサイトに対し、どのような他のWebサイトからアクセスされたか知ることにより、バナー広告、ディレクトリサイトへの掲載、懸賞サイトへの出品などの戦略を決定できる。
【0005】
また、分析者は、検索エンジンでどのような検索が実行され、分析対象のWebサイトがアクセスされたかなどを知ることにより、コンテンツ改善の指針を決定できる。
【0006】
Webページ又はWebサイトの分析、調査の方法として、どのWebページが、いつ、どのようにアクセスされたかを記録するWebアクセスログを用いたWebアクセスログ分析がある。
【0007】
Webアクセスログには、主に2種類ある。
【0008】
第1のWebアクセスログは、単一又は複数のWebサーバに記録されたWebアクセスログ(狭義のWebアクセスログ)である。
【0009】
第2のWebアクセスログは、一人又は複数の閲覧者による様々なWebページ又はWebサイトへのアクセスを記録したWebアクセスログである。この第2のWebアクセスログには、例えば、WWW視聴率調査会社がパネル(モニター)から収集した、各パネルによるWebページ又はWebサイトへのアクセスログがある。
【0010】
以下において、Webアクセスログとは、第1のWebアクセスログを意味するとして説明する。
【0011】
例えば、Webアクセスログ分析では、Webページ又はWebサイトにアクセスした閲覧者数(ユーザ数、訪問者数)が、時間毎、曜日毎にどのように変化するか調査される。
【0012】
また、Webアクセスログ分析では、閲覧者が使用しているブラウザ又はコンピュータのOSの種類が調査される場合もある。
【0013】
また、Webアクセスログ分析では、一つのWebサイト内又は複数のWebサイト間をまたがって閲覧者がどのような閲覧行動をとるかについて調査される場合もある。例えば、閲覧者がWebページAを閲覧し、次にWebページBを閲覧したことを明らかにするなどのような経路分析もWebアクセスログ分析に含まれる。
【0014】
一方、インターネット上のWebページ又はWebサイトの閲覧を補助するために、閲覧者の入力した検索キーワード(例えば、「車」「ペット」など)に応じて、この検索キーワードに関係する内容のWebページ(以下、「キーワード関連ページ」という)又はWebサイト(以下、「キーワード関連サイト」という)についての情報(例えば、キーワード関連ページ又はキーワード関連サイトのURL(Uniform Resource Locators)、要約情報、リンク情報など)のリストを検索結果ページとして表示する検索システムが存在する。この検索システムは、広く利用されている。
【0015】
図45は、検索システムを用いた代表的なWebページの遷移の例を示す。
【0016】
検索キーワード入力画面1上で閲覧者のブラウザから検索キーワードが入力され、検索開始が指示されると、検索システムは、キーワード関連ページへのリンク2a〜2cを抽出し、抽出されたキーワード関連ページへのリンク2a〜2cを表示する検索結果ページ2を閲覧者に対して表示する。
【0017】
検索結果ページ2上のいずれかのリンクがクリックされると、このクリックされたリンクの先のキーワード関連ページが閲覧者のブラウザに表示される。例えば、リンク2aがクリックされると、キーワード関連ページ3が表示される。
【0018】
この検索システムを用いた場合、WebサーバのWebアクセスログには、検索キーワードとその入力日時などを含む付加情報が記録される。
【0019】
したがって、このWebアクセスログを用いて、検索キーワードに関する分析(以下、「検索キーワード分析」という)が可能となる。
【0020】
検索キーワード分析においては、例えば、ある検索キーワードが何回入力されたか調査される。
【0021】
また、例えば、検索結果ページにおいて検索結果が実際にクリックされたか調査される。
【0022】
また、例えば、ある検索キーワードに対して、キーワード関連ページが何件抽出されたか調査される。
【0023】
特開2002−123517号(特許文献1)には、検索キーワード分析技術、商用ツール、非商用ツール、サービスが記載されている。
【0024】
【特許文献1】
特開2002−123517号公報
【0025】
【発明が解決しようとする課題】
上述したように、Webアクセスログ分析では、レファラ情報などを用いて分析対象のWebサイトをアクセスする前のWebサイトの分析、検索キーワード単位での閲覧者数の分析などは行なわれている。
【0026】
しかしながら、従来のWebアクセスログ分析では、分析者は、分析対象のWebサイトに閲覧者が満足しているか、分析対象のWebサイトにとっての成功
(目的)がどの程度達成されているかまで理解することが困難である。
【0027】
例えば、分析対象のWebサイトは商品の販売数向上を目的としているとする。従来のWebアクセスログでは、検索エンジンの検索結果に基づいて分析対象のWebサイトがアクセスされた場合にこの検索エンジンに入力された検索キーワード毎の閲覧者数を求めることはできる。
【0028】
しかし、閲覧者が多くても分析対象のWebサイトで全く商品が購入されない場合もあり、閲覧者が少なくてもほとんどの閲覧者が商品を購入する場合もある。そのため、分析者は、従来のWebアクセスログ分析の結果から、その検索キーワードを入力した閲覧者が分析対象のWebサイトに満足したか、どの検索キーワードを入力した閲覧者に対してWebサイトの目的が達成されたか判断することが困難である。
【0029】
また、例えば、従来のWebアクセスログ分析により、ある検索キーワードに対して、キーワード関連ページが何件抽出されたか調査することができる。そして、分析者は、閲覧者の希望するWebページの抽出漏れを防止する観点から、キーワード関連ページの抽出数が多いほど検索結果に対する閲覧者の満足度が高く、少ないほど満足度が低いと判断する場合がある。
【0030】
しかしながら、キーワード関連ページの抽出数は、閲覧者の満足度などを直接表すわけではない。実際には、キーワード関連ページの抽出数が少ない方が閲覧者にとってはリンクを選択しやすく、閲覧者の希望に合致し、満足度が高い場合もある。すなわち、閲覧者の希望と合致するキーワード関連ページが検索結果として閲覧者に提示される場合、閲覧者は、冗長な検索結果が提示されるよりもキーワード関連ページの抽出数が少ない程、検索結果に対して満足する。
【0031】
したがって、分析者は、従来のWebアクセスログ分析から閲覧者が検索結果に満足しているか判断することが困難である。
【0032】
また、例えば、検索結果ページ上のキーワード関連ページへのリンクが実際にクリックされたか、クリックされている場合にはどのキーワード関連ページへのリンクがクリックされたか調査すると、閲覧者によって検索結果ページ上でどのキーワード関連ページが選択されたか知ることができる。
【0033】
しかしながら、従来のWebアクセスログ分析により、アクセスされたキーワード関連ページが本当に閲覧者の求めた内容を掲載しており閲覧者が満足したかについて、分析者が判断すること(検索結果に対して質的な評価をすること)は極めて困難である。
【0034】
本発明は、以上のような実情に鑑みてなされたもので、Webアクセスログ分析において分析者の求める分析結果を適切に提供する検索キーワード分析プログラム及びシステム並びに方法を提供することを目的とする。
【0035】
【課題を解決するための手段】
本発明を実現するにあたって講じた具体的手段について以下に説明する。
【0036】
第1の発明の検索キーワード分析プログラムは、コンピュータに、WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データとアクセス要求側にアクセスされたサイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けておりアクセス先識別データの示すアクセス先がサイト内の検索システムの場合にはアクセス先識別データと検索システムに入力された検索キーワードとを関連付けて記録するサイト内のWebアクセスログに基づいて、同一のアクセス要求側によるサイト内での連続的なアクセスを表すアクセスシーケンスを抽出し、この抽出されたアクセスシーケンスを示すアクセスシーケンス識別子とこの抽出されたアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すアクセスシーケンスデータを記録手段に記録するアクセスシーケンス抽出機能と、検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、Webアクセスログにおいて検索システムを示すアクセス先識別データとアクセス要求側から検索システムに入力された検索キーワードとが関連付けされている場合に、検索キーワードを抽出し、検索キーワードとこの検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを記録手段に記録するキーワード抽出機能と、記録手段に記録されているアクセスシーケンスデータと、記録手段に記録されているキーワードデータとに基づいて、アクセスシーケンスデータの示すアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、アクセスシーケンスにおいて入力された検索キーワードと質的評価値との対応関係を示す関係データを記録手段に記録する評価値算出機能とを実現させる。
【0037】
これにより、入力された検索キーワードに基づく検索システムの検索結果に対する質的評価値を容易に把握できる。この第1の発明では、アクセスシーケンス抽出機能とキーワード抽出機能とを並列に動作させることができる。
【0038】
なお、第1の発明において、評価値算出機能は、質的評価値に加えて、記録手段に記録されているキーワードデータの示す検索キーワードの入力数又は入力割合を含む量的評価値を求め、アクセスシーケンスにおいて入力された検索キーワードと質的評価値と量的評価値の対応関係を示す関係データを記録手段に記録するとしてもよい。
【0039】
これにより、入力された検索キーワードに基づく検索システムの検索結果に対する質的評価値、量的評価値、質的評価値と量的評価値との関係を容易に把握できる。
【0040】
第2の発明の検索キーワード分析プログラムは、コンピュータに、WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データとアクセス要求側にアクセスされたサイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けておりアクセス先識別データの示すアクセス先がサイト内の検索システムの場合にはアクセス先識別データと検索システムに入力された検索キーワードとを関連付けて記録するサイト内のWebアクセスログに基づいて、同一のアクセス要求側によるサイト内での連続的なアクセスを表すアクセスシーケンスを抽出し、この抽出されたアクセスシーケンスを示すアクセスシーケンス識別子とこの抽出されたアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを関連付け、検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、この抽出されたアクセスシーケンスに含まれるアクセスのアクセス先が検索システムの場合にはこのアクセス識別子に対して検索システムに入力された検索キーワードをさらに関連付けたアクセスシーケンスデータを記録手段に記録するアクセスシーケンス抽出機能と、記録手段に記録されたアクセスシーケンスデータに基づいて、アクセスシーケンスにおいて検索キーワードが入力されている場合に、検索キーワードを抽出し、検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを記録手段に記録するキーワード抽出機能と、前記記録手段に記録されているアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、アクセスシーケンスデータの示すアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、アクセスシーケンスにおいて入力された検索キーワードと質的評価値との対応関係を示す関係データを記録手段に記録する評価値算出機能とを実現させる。
【0041】
この第2の発明では、上記第1の発明と同様の効果を得ることができるが、アクセスシーケンス抽出機能とキーワード抽出機能とが直列に動作する特徴を持つ。
【0042】
なお、第2の発明において、評価値算出機能は、質的評価値に加えて、記録手段に記録されているキーワードデータの示す検索キーワードの入力数又は入力割合を含む量的評価値を求め、アクセスシーケンスにおいて入力された検索キーワードと質的評価値と量的評価値の対応関係を示す関係データを記録手段に記録するとしてもよい。
【0043】
また、上記第1又は第2の発明において、Webアクセスログは、レファラ情報とアクセス先識別データとを関連付けたデータを含み、アクセスシーケンス抽出機能は、パターン情報に基づいて、レファラ情報が検索システムを示す場合に、レファラ情報に関連付けされているアクセス先識別データの示すアクセス先へのアクセスを含むアクセスシーケンスを抽出し、キーワード抽出機能は、パターン情報に基づいて、レファラ情報が検索システムを示す場合に、レファラ情報に含まれている検索キーワードを抽出し、評価値算出機能は、アクセスシーケンスに対する検索キーワード入力後の質的評価値を算出するとしてもよい。
【0044】
このように、レファラ情報を用いることでにより、アクセス先で記録されたWebアクセスログのみからであってもサイト外の検索システムに入力された検索キーワードを分析することができる。
【0045】
第3の発明の検索キーワード分析プログラムは、コンピュータに、WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データとアクセス要求側にアクセスされたサイト内のアクセス先を示すアクセス先識別データとレファラ情報とアクセス時間データとを関連付けておりレファラ情報の示すアクセス先がWWWの検索システムの場合にはレファラ情報に検索システムに入力された検索キーワードが含まれているサイト内のWebアクセスログと、検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、レファラ情報がWWWの検索システムを示す場合にレファラ情報に関連付けされているアクセス先識別データの示すアクセス先へのアクセスを含み同一のアクセス要求側による連続的なサイト内のアクセスを表すアクセスシーケンスを抽出し、この抽出されたアクセスシーケンスを示すアクセスシーケンス識別子とこの抽出されたアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すアクセスシーケンスデータを記録手段に記録するアクセスシーケンス抽出機能と、パターン情報に基づいて、Webアクセスログにおいてレファラ情報が検索システムを示す場合に、レファラ情報に含まれている検索キーワードを抽出し、検索キーワードとこの検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを記録手段に記録するキーワード抽出機能と、記録手段に記録されているアクセスシーケンスデータと、記録手段に記録されているキーワードデータとに基づいて、アクセスシーケンスデータの示すアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、アクセスシーケンスにおいて入力された検索キーワードと質的評価値との対応関係を示す関係データを前記記録手段に記録する評価値算出機能とを実現させる。
【0046】
なお、第3の発明において、評価値算出機能は、質的評価値に加えて、記録手段に記録されているキーワードデータの示す検索キーワードの入力数又は入力割合を含む量的評価値を求め、アクセスシーケンスにおいて入力された検索キーワードと質的評価値と量的評価値の対応関係を示す関係データを記録手段に記録するとしてもよい。
【0047】
上記第1乃至第3の発明の検索キーワード分析プログラムにおいて、検索キーワードと質的評価値と量的評価値の対応関係を示す関係データが求められる場合、コンピュータに、記録手段に記録された関係データにしたがって、質的評価値と量的評価値とに基づくグラフを描画するグラフ化機能を実現させるためのプログラム、を付加してもよい。これにより、分析結果の把握が一層容易になる。
【0048】
上記第1乃至第3の発明の検索キーワード分析プログラムにおいて、検索キーワードと質的評価値と量的評価値とが求められる場合、量的評価値は、検索キーワードの入力数が多いほど値が大きくなる検索結果のニーズ値であり、量的評価規則は、検索キーワードの入力数が多いほどニーズ値が増加する規則であるとしてもよい。
【0049】
上記第1乃至第3の発明の検索キーワード分析プログラムにおいて、評価値算出機能は、さらに、分析候補の検索キーワードと分析候補の検索キーワードの入力後にアクセスされた場合に成功度を増加するアクセス先識別データとを関連付けたデータと記録手段に記録されたキーワードデータとに基づいて、アクセスシーケンスにおいて分析候補の検索キーワードが入力されておりその入力後分析候補の検索キーワードと関連付けされているアクセス先識別データの示すアクセス先がアクセスされている場合に、アクセスシーケンスに対する成功度を増加し、この成功度を含む質的評価値を記録手段に記録するとしてもよい。
【0050】
この場合において、評価値算出機能は、分析候補の検索キーワードが入力されてから分析候補の検索キーワードと関連付けされているアクセス先識別データの示すアクセス先がアクセスされるまでのアクセス数が少ないほど加えられる成功度を大きくするとしてもよい。
【0051】
上記第1乃至第3の発明の検索キーワード分析プログラムにおいて、評価値算出機能は、アクセスシーケンスにおける検索キーワード入力後のアクセスから最後のアクセスまでの時間間隔が長いほど増加するアクセス要求側の満足度を含む質的評価値を記録手段に記録する。
【0052】
第4の発明の検索キーワード分析プログラムは、コンピュータに、WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データとアクセス要求側にアクセスされたサイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けておりアクセス先識別データの示すアクセス先がサイト内の検索システムの場合にはアクセス先識別データと検索システムに入力された検索キーワードとを関連付けたサイト内のWebアクセスログに基づいて、同一のアクセス要求側によるサイト内での連続的なアクセスのうち検索結果ページへのアクセスから定まる始端と、始端と同一のアクセス要求側による連続的なアクセスのうち始端以降のアクセスから定まる終端とに基づくサブアクセスシーケンスを抽出し、この抽出されたサブアクセスシーケンスを示すサブアクセスシーケンス識別子とこの抽出されたサブアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すサブアクセスシーケンスデータを記録手段に記録するサブアクセスシーケンス抽出機能と、検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、Webアクセスログにおいてサイト内の検索システムを示すアクセス先識別データとアクセス要求側から検索システムに入力された検索キーワードとが関連付けされている場合に、検索キーワードを抽出し、検索キーワードとこの検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを記録手段に記録するキーワード抽出機能と、記録手段に記録されているサブアクセスシーケンスデータと、記録手段に記録されているキーワードデータとに基づいて、サブアクセスシーケンスデータの示すサブアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、サブアクセスシーケンスにおいて入力された検索キーワードと質的評価値との対応関係を示す関係データを記録手段に記録する評価値算出機能とを実現させる。
【0053】
第5の発明の検索キーワード分析プログラムは、コンピュータに、WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データとアクセス要求側にアクセスされたサイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けておりアクセス先識別データの示すアクセス先がサイト内の検索システムの場合にはアクセス先識別データと検索システムに入力される検索キーワードとを関連付けたサイト内のWebアクセスログに基づいて、同一のアクセス要求側によるサイト内での連続的なアクセスから、検索結果ページへのアクセスから定まる始端と次の始端とを求めるとともに次の始端の直前のアクセスに基づいて始端に対応する終端を求めてサブアクセスシーケンスを抽出し、この抽出されたサブアクセスシーケンスを示すサブアクセスシーケンス識別子とこの抽出されたサブアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すサブアクセスシーケンスデータを記録手段に記録するサブアクセスシーケンス抽出機能と、検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、Webアクセスログにおいて検索システムを示すアクセス先識別データとアクセス要求側から検索システムに入力された検索キーワードとが関連付けされている場合に、検索キーワードを抽出し、検索キーワードとこの検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを記録手段に記録するキーワード抽出機能と、記録手段に記録されているサブアクセスシーケンスデータと、記録手段に記録されているキーワードデータとに基づいて、サブアクセスシーケンスデータの示すサブアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、サブアクセスシーケンスにおいて入力された検索キーワードと質的評価値との対応関係を示す関係データを記録手段に記録する評価値算出機能とを実現させる。
【0054】
第6の発明の検索キーワード分析プログラムは、コンピュータに、コンピュータに、WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データとアクセス要求側にアクセスされたサイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けておりアクセス先識別データの示すアクセス先がサイト内の検索システムの場合にはアクセス先識別データと検索システムに入力された検索キーワードとを関連付けたサイト内のWebアクセスログに基づいて、同一のアクセス要求側によるサイト内での連続的なアクセスから検索結果ページへのアクセスから定まる始端と次の始端とが求められた場合、次の始端の直前のアクセスを始端に対応する終端とし、始端が求められ次の始端が求められなかった場合、連続的なアクセスの終端を始端に対応する終端とし、始端と終端とに基づいてサブアクセスシーケンスを抽出し、この抽出されたサブアクセスシーケンスを示すサブアクセスシーケンス識別子とこの抽出されたサブアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すサブアクセスシーケンスデータを記録手段に記録するサブアクセスシーケンス抽出機能と、検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、Webアクセスログにおいて検索システムを示すアクセス先識別データとアクセス要求側から検索システムに入力された検索キーワードとが関連付けされている場合に、検索キーワードを抽出し、検索キーワードとこの検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを記録手段に記録するキーワード抽出機能と、記録手段に記録されているサブアクセスシーケンスデータと、記録手段に記録されているキーワードデータとに基づいて、サブアクセスシーケンスデータの示すサブアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、サブアクセスシーケンスにおいて入力された検索キーワードと質的評価値との対応関係を示す関係データを記録手段に記録する評価値算出機能とを実現させる。
【0055】
上記第1乃至第3の発明の検索キーワード分析プログラムにおいて、評価値算出機能は、アクセス時間データに基づいて複数の期間毎の関係データを求め、コンピュータに、複数の期間毎の関係データに基づいて、検索キーワードについて質的評価値と量的評価値との遷移状況を表すトレンドデータを求め、記録手段に記録するトレンド分析機能を実現させるとしてもよい。
【0056】
これにより、WWWにおける分析対象の部分をアクセスするために検索システムに入力される検索キーワードの質的評価値及び量的評価値の変化が時系列に求められる。
【0057】
上記第1乃至第3の発明の検索キーワード分析プログラムにおいて、評価値算出機能は、アクセス時間データに基づいて複数の期間毎の前記関係データを求め、コンピュータに、検索キーワードと検索キーワードの属するカテゴリとを関係付けたカテゴリデータと複数の期間毎の関係データとに基づいて複数の期間毎にカテゴリについて質的評価値と量的評価値とを算出し、記録手段に記録するカテゴリ形成機能と、カテゴリについて質的評価値と量的評価値との遷移状況を表すトレンドデータを求め、記録手段に記録するトレンド分析機能とを実現させるとしてもよい。
【0058】
これにより、検索キーワードを統合して分析者の求めるカテゴリについて分析を行うことができる。
【0059】
上記の検索キーワード分析プログラム又はこのプログラムを記録した記録媒体を用いることによって、上記各機能を有していないコンピュータ、コンピュータシステム、サーバ、クライアントに対しても、簡単にこれらの機能を付加することができる。
【0060】
本発明で実現される機能と同様の動作を実現する手段を検索キーワード分析システムに具備することにより、同様の作用効果を得ることができる。
【0061】
本発明の検索キーワード分析プログラム又はこのプログラムを記録した記録媒体をコンピュータに適用することによって、入力された検索キーワードに基づく検索システムの検索結果に対する質的評価値を容易に把握するための検索キーワード分析方法がコンピュータ上で実施される。
【0062】
【発明の実施の形態】
以下、図面を参照しながら本発明の実施の形態について説明する。なお、Webサイトとは少なくとも1つのWebページを含むWebページのグループを指す。
【0063】
以下の各図において同一の部分については同一の符号を付してその説明を省略し、異なる部分についてのみ詳しく説明する。
【0064】
(第1の実施の形態)
本実施の形態においては、検索システムによる検索結果を表示する検索結果ページからの閲覧者の閲覧行動(2つ以上のページ遷移を含む)を分析することにより、閲覧者から入力された検索キーワードに基づく検索結果に対する質的評価値を高精度に求める検索キーワード分析システムについて説明する。
【0065】
上述したように、検索システムは、閲覧者が入力した検索キーワードに応じて、この検索キーワードと関連があると判断されたキーワード関連ページについての情報を抽出し、リスト化し、閲覧者に表示する。
【0066】
閲覧者は、検索システムに対して自己の意思に基づいて自由に検索キーワードを入力する。
【0067】
このため、各種の検索キーワードの入力頻度は、各種の検索キーワード間で一定の割合となることはなく、ある程度隔たりが発生する。
【0068】
したがって、顧客サイトをアクセスするために入力された検索キーワードによる検索結果を量的に評価する量的評価値は、検索キーワード毎に差が生じる。
【0069】
量的評価値の例としては、各検索キーワードについて検索結果のニーズの量、数、多さを表すニーズ値があり、例えば検索キーワードの入力回数をニーズ値とすることができる。
【0070】
その他にも、量的評価値の例としては、上述した検索キーワードについて抽出されたキーワード関連ページの件数、検索結果ページのクリック回数などがある。
【0071】
その一方で、検索キーワードに基づいて検索されたキーワード関連ページが必ずしも閲覧者の求めている内容とは限らない。
【0072】
したがって、顧客サイトをアクセスするために入力された検索キーワードによる検索結果を質的に評価する質的評価値を求める意義は大きい。
【0073】
質的評価値の例としては、検索キーワードによる検索結果がどの程度効果的に機能したかを表す度合いである効果度がある。さらに、この効果度の具体例としては、検索システムを利用した閲覧者が、その検索キーワードに対して検索システムが提示した情報サービスにどの程度満足したかを表す満足度がある。また、効果度の他の具体例として、Webサイト運営者がアクセスして欲しいと考えているWebページにどの程度自サイトの閲覧者がアクセスしているかを表す成功度がある。
【0074】
質的評価値として、例えば、閲覧者が検索キーワードによる検索結果をどの程度重視しているかを表す重視度もある。
【0075】
なお、質的評価値についても、検索システムの性能、リストとして表示されたキーワード関連ページの質、内容などに応じて、検索キーワード毎に差が生じる。
【0076】
質的評価値を調査することは、Webページ又はWebサイトの運営者にとって、自己の運営しているWebページ又はWebサイト、検索システムが閲覧者を例えばどの程度満足させているか把握するために有効であり、Webページ又はWebサイトのデザインやコンテンツ、検索システムの改善に有効である。
【0077】
なお、本実施の形態においては、質的評価値のうち満足度を求める場合について説明するが、満足度ではない他の質的評価値を求める場合も同様である。
【0078】
図1は、本実施の形態に係る検索キーワード分析システムの構成の一例を示すブロック図である。
【0079】
図2は、顧客サイトの構成の一例を示すブロック図である。
【0080】
記録装置4は、調査対象Webサイトの運営者である顧客5によって運営される顧客サイト6のWebアクセスログ7を記録する。
【0081】
顧客サイト6は、サイト内検索システム6aと、一以上のWebページP1〜Pnを持つ。
【0082】
サイト内検索システム6aは、ある特定のサイト内のWebページについての検索を行う。この図1の例では、サイト内検索システム6aは、顧客サイト6のWebページP1〜Pnについての検索を行う。
【0083】
一般的な閲覧者8のうち、顧客サイト6をアクセスした閲覧者を顧客サイト閲覧者8aとする。
【0084】
表1に、Webアクセスログ7に含まれる情報の一例を示す。
【0085】
【表1】
【0086】
Webアクセスログ7には、顧客サイト閲覧者8aによる顧客サイト6のアクセス毎に、ホスト名又はIPアドレス、顧客サイト閲覧者8aが顧客サイト6にアクセスした日付と時刻を示す情報、顧客サイト閲覧者8aの発信したリクエスト(URL)、レファラ情報、アクセスした顧客サイト閲覧者8aのID(UserID)、などから構成されるレコードが含まれる。
【0087】
なお、レファラ情報とは、ハイパーリンクを使ってあるWebページがアクセスされた場合に、このアクセスされたWebページがどのWebページからリンクを辿ってアクセスされたかを示す情報である。表1においては、顧客サイト閲覧者8aのIDとレファラ情報については、具体的な値の記述を省略している。
【0088】
本実施の形態に係る検索キーワード分析システム9は、記録媒体10に記録されている検索キーワード分析プログラム11を読み出して実行する。
【0089】
検索キーワード分析プログラム11は、システム9に読み込まれ、実行されると、ログ前処理機能12、アクセスシーケンス抽出機能13、キーワード抽出機能14、評価値算出機能37を実現する。
【0090】
また、評価値算出機能37は、満足度算出機能15、満足度・キーワード関連付け機能16を含む。
【0091】
上記各機能12〜16によって作成されたデータは、記録装置38に記録される。各機能12〜16は、記録装置38に記録されたデータを読み込み可能である。記録装置38としては、例えば内部メモリ等が適用される。すなわち、各機能12〜16間での各種データの受け渡しは、記録装置38を経由して行われてもよい。この場合、データの提供側は、提供するデータを記録装置38に記録し、データの受付側は、記録装置38からデータを読み出す。
【0092】
ログ前処理機能12は、記録装置4に記録されたWebアクセスログ7から、検索キーワード分析システム9に必要な情報を入力する。
【0093】
そして、ログ前処理機能12は、入力した情報に基づいて、各ページアクセスに対して重複のないアクセス識別子(ViewID)を付与する。
【0094】
表2に、ログ前処理機能12によって生成された前処理データの一例を示す。
【0095】
【表2】
【0096】
アクセスシーケンス抽出機能13は、前処理データに基づいて、顧客サイト閲覧者8aによってアクセスされた一連のWebページの列(以下、「アクセスシーケンス」という)を抽出し、各アクセスシーケンスに重複のないアクセスシーケンス識別子を付与し、アクセスシーケンス抽出データを生成する。
【0097】
アクセスシーケンスとは、同一又は同一として扱われる閲覧者、すなわち同一のアクセス要求側による連続的なアクセスをいう。
【0098】
アクセスシーケンス抽出機能13は、ホスト名又はIPアドレスとユーザエージェントとの組み合わせが一致する場合に同一のアクセス要求側として扱い、ホスト名又はIPアドレスとユーザエージェントの各組み合わせに対してアクセス要求側識別子を付与し、同一のアクセス要求側から連続的にアクセスされた一以上のWebページをアクセスシーケンスとして切り出す。
【0099】
アクセスシーケンス抽出機能13は、所定のアクセスシーケンス抽出規則にしたがって、一連のページアクセスからアクセスシーケンスを切り出し、アクセスシーケンスの抽出結果を示すアクセスシーケンスデータを作成する。
【0100】
例えば、アクセスシーケンス抽出規則として、一般的なWebアクセスログ分析で用いられているセッションを抽出する規則を適用可能である。具体的には、ある閲覧者によるWebページのアクセスから次のWebページへのアクセスの間に30分以上の時間が経過した場合(次のWebページへの遷移がなかった場合を含む)、その間をセッションの境界(もしくはセッションの終端)とし、境界と境界との間をセッションとして抽出する。そして、このセッションをアクセスシーケンスとして用いる。
【0101】
なお、アクセスシーケンスとアクセスシーケンスとの間の境界を判定するための経過時間は、上記の30分に限定されるものではなく、自由に設定可能である。すなわち、アクセスシーケンス抽出規則は、複数のアクセスが同一のアクセス要求側から所定の時間間隔内でアクセスされている場合に複数のアクセスが同一のアクセスシーケンスに含まれると判断する規則としてもよい。
【0102】
また、アクセスシーケンスを抽出する場合において、Webアクセスログ7に記録された閲覧者のID(UserID)又はCookie情報に基づいて、アクセス要求側の同一性を判断してもよい。
【0103】
表3に、アクセスシーケンスデータの一例を示す。
【0104】
【表3】
【0105】
表3のアクセスシーケンスデータには、各アクセスシーケンスを識別するためのアクセスシーケンス識別子(VisitID)、ホスト名とユーザエージェントの組み合わせを識別するアクセス要求側識別子(VisitorID)などから構成されるレコードが含まれる。
【0106】
キーワード抽出機能14は、ログ前処理機能12によって生成された前処理データの中から、顧客サイト閲覧者8aがサイト内検索システム6aにおいて入力した検索キーワードを抽出し、検索キーワードの抽出結果を示すキーワードデータを作成する。
【0107】
表4に、Webアクセスログ7における検索システムへのリクエストの例を示す。
【0108】
【表4】
【0109】
表4における例1は、検索キーワード「xxxx」を含んだ一番基本的な検索システムへのリクエストの例である。
【0110】
例2では、検索キーワード「yyyy」と検索結果の10ページ目とがリクエストされている。
【0111】
例3では、検索キーワード「りんご」を示すコードがリクエストに含まれている。
【0112】
Webアクセスログ7の中から検索キーワードを抽出するためには、検索システムの場所及び検索キーワードを示すパラメータを表すクエリーパターンに関する情報を用いる。
【0113】
表5に、検索システムの場所とクエリーパターンに関する情報の一例を示す。
【0114】
【表5】
【0115】
すなわち、キーワード抽出機能14は、前処理データから検索システムの場所に関する情報に基づいて、検索システムを利用したアクセスを抽出する。
【0116】
次に、キーワード抽出機能14は、クエリーパターンに関する情報に基づいて、検索キーワードを抽出する。
【0117】
表6に、上記表4、5の例に基づいて、キーワード抽出機能14によって抽出されたパラメータの例を示す。
【0118】
【表6】
【0119】
抽出されたパラメータの中には、この表6の例3に示すようにエンコードされたパラメータも存在する。
【0120】
キーワード抽出機能14は、エンコードされたパラメータについては判読可能な文字列へのデコードを行い、キーワードデータを生成する。
【0121】
表7に、キーワードデータの例を示す。
【0122】
【表7】
【0123】
表7のキーワードデータには、各アクセス識別子とそのアクセス識別子に対応するアクセスにおいて入力された検索キーワードとから構成されるレコードが含まれている。
【0124】
満足度算出機能15は、アクセスシーケンス抽出機能13によって生成されたアクセスシーケンスデータに基づいて、閲覧者の満足度を算出する。
【0125】
満足度を算出するために、満足度をどのように算出するかを表す質的評価規則が定義される。
【0126】
例えば、質的評価規則として、サイト内検索システム6aに検索キーワードを入力した後の顧客サイト閲覧者8aによる顧客サイト6の閲覧時間(以下、「検索後閲覧時間」という)が長いほど満足度が高くなる規則を定義する。
【0127】
表8に、検索後閲覧時間と満足度とを関係付けた例を示す。
【0128】
【表8】
【0129】
検索後閲覧時間は、満足度を求めるアクセスシーケンスについて最後のアクセス時刻から最初のキーワード関連ページへのアクセス時刻を引いて得られる時間間隔とする。ただし、検索結果ページからキーワード関連ページに遷移することなくアクセスシーケンスが終わっていた場合には検索後閲覧時間を「閲覧なし」とする。また、検索結果ページからキーワード関連ページに遷移して、その後他のサイト内のWebページを閲覧することなくアクセスシーケンスが終わっている場合には、検索後閲覧時間を「1ページのみの閲覧」とする。
【0130】
すなわち、満足度算出機能15は、アクセスシーケンスデータを読み込み、アクセスシーケンスごとに検索後閲覧時間を計算する。
【0131】
次に、満足度算出機能15は、上記表8のような検索後閲覧時間と満足度の対応データを読み込み、アクセスシーケンスごとの満足度を算出する。
【0132】
表9に、満足度算出機能15によって生成された満足度算出データの例を示す。
【0133】
【表9】
【0134】
表9の満足度算出データには、各アクセス識別子とそのアクセスの属するアクセスシーケンス識別子に対応する満足度とから構成されるレコードが含まれている。
【0135】
満足度・キーワード関連付け機能16は、満足度算出機能15で生成された満足度算出データと、キーワード抽出機能14で生成されたキーワードデータを統合し、検索キーワードごとの満足度を算出し、満足度と検索キーワードとを関係付け、関係データを作成する。
【0136】
満足度・キーワード関連付け機能16は、まず、満足度算出データとキーワードデータを読み込む。
【0137】
次に、満足度・キーワード関連付け機能16は、アクセス識別子に基づいて、満足度算出データとキーワードデータを統合する。
【0138】
表10に、満足度算出データとキーワードデータの統合結果を示す。
【0139】
【表10】
【0140】
そして、満足度・キーワード関連付け機能16は、検索キーワードごとに満足度の平均を求め、関係データを作成する。
【0141】
表11に、関係データの例を示す。
【0142】
【表11】
【0143】
図3は、本実施の形態に係る検索キーワード分析システム9の動作の一例を示すフローチャートである。
【0144】
ステップS1において、ログ前処理機能12は、Webアクセスログ7に含まれる情報から必要な情報を入力し、前処理データを作成する。
【0145】
ステップS2において、アクセスシーケンス抽出機能13は、前処理データとアクセスシーケンス抽出規則とに基づいて、アクセスシーケンスを抽出し、アクセスシーケンスデータを作成する。
【0146】
ステップS3において、満足度算出機能15は、アクセスシーケンスデータと満足度算出規則とに基づいて、アクセスシーケンス毎の満足度を算出し、満足度算出データを作成する。
【0147】
ステップS4において、キーワード抽出機能14は、前処理データに基づいて、サイト内検索システム6aに入力された検索キーワードを抽出し、キーワードデータを作成する。
【0148】
ステップS5において、満足度・キーワード関連付け機能16は、満足度算出データと、キーワードデータに基づいて、検索キーワードごとの満足度を算出し、関係データを作成する。
【0149】
なお、ステップS4は、ステップS2及びステップS3の前に実行されてもよく、後に実行されてもよく、並列に実行されてもよい。
【0150】
図4は、本実施の形態に係るキーワード抽出機能14の動作の一例を示すフローチャートである。
【0151】
ステップT1において、キーワード抽出機能14は、検索システムの場所とクエリーパターンに関する情報を読み込む。
【0152】
ステップT2において、キーワード抽出機能14は、ログ前処理機能12によって前処理されたWebアクセスログ7から一つのレコードを読み込む。
【0153】
ステップT3において、キーワード抽出機能14は、読み込んだレコードに含まれているリクエストが検索システムの場所を含むか判定する。
【0154】
リクエストが検索システムの場所を含むと判定された場合、ステップT4において、キーワード抽出機能14は、検索システムの場所に対応するクエリーパターンに基づいて、リクエストからパラメータを抽出する。
【0155】
リクエストが検索システムの場所を含むと判定されなかった場合、キーワード抽出機能14は、ステップT2以降の処理を繰り返す。
【0156】
ステップT5において、キーワード抽出機能14は、抽出したパラメータに対してデコードが必要か否か判定する。
【0157】
デコードが必要な場合、ステップT6において、キーワード抽出機能14は、抽出したパラメータをデコードする。
【0158】
ステップT7において、キーワード抽出機能14は、ログ前処理機能12によって前処理されたWebアクセスログ7から終端のレコードを読み込んだか否か判定する。
【0159】
終端のレコードが読み込まれていないと判定された場合、キーワード抽出機能14は、ステップT2以降の処理を繰り返す。
【0160】
終端のレコードが読み込まれたと判定された場合、ステップT8において、キーワード抽出機能14は、抽出されたパラメータを検索キーワードとし、キーワードデータを作成する。
【0161】
図5は、本実施の形態に係る満足度算出機能15の動作の一例を示すフローチャートである。
【0162】
ステップU1において、満足度算出機能15は、アクセスシーケンス抽出機能13によって生成されたアクセスシーケンスデータを読み込む。
【0163】
ステップU2において、満足度算出機能15は、アクセスシーケンス毎に、検索後閲覧時間を計算する。
【0164】
ステップU3において、満足度算出機能15は、検索後閲覧時間と満足度とを関係付けたデータを読み込む。
【0165】
ステップU4において、満足度算出機能15は、アクセスシーケンス毎に、検索後閲覧時間に対応する満足度を求める。
【0166】
ステップU5において、満足度算出機能15は、アクセスシーケンス毎の満足度を示す満足度算出データを作成する。
【0167】
なお、ステップU3は、ステップU1及びステップU2の前に実行されてもよく、並列に実行されてもよい。
【0168】
以上説明した本実施の形態においては、検索キーワードについての分析結果として、顧客サイト閲覧者8aがその検索キーワードによる検索結果についてどれほど満足したか求めることができ、検索キーワードに対する検索結果について量的評価値のみではなく、十分な精度で質的評価値を分析することができる。
【0169】
本実施の形態により、例えば、顧客5は、検索結果に対して顧客サイト閲覧者8aがどの程度満足しているかを定量的に知ることができる。例えば、上記表11の結果より、検索キーワード「りんご」による検索結果については顧客サイト閲覧者8aの満足度が高いのに対し、検索キーワード「砂糖」又は検索キーワード「肉野菜」による検索結果については顧客サイト閲覧者8aの満足度が低いことが分かる。
【0170】
なお、質的評価値としては、満足度等に代表される効果度の他に、例えば重視度や利便度も考えられる。
【0171】
重視度とは、Webサイトの閲覧者が検索キーワードに関連する事柄について、どの程度重視しているかを表す指標である。
【0172】
利便度とは、Webサイトの閲覧者が検索キーワードに関連する事柄について、どの程度容易に閲覧やWebサイトへの書き込み等の操作ができたかを表す指標である。
【0173】
重視度や利便度も、満足度と同様に検索後閲覧時間によって求めることが可能である。
【0174】
検索後閲覧時間を満足度、重視度、利便度のいずれを算出するのに利用するかは、分析対象となるWebサイトや閲覧者の性質、分析者の観点によって適宜選択できる。
【0175】
例えば、商品を販売しているECサイトにおいて、他にも類似の競合サイトが多く存在するケースでは、顧客は検索キーワードに関連したコンテンツが顧客の期待にそわなかった場合に、比較的短時間で閲覧をあきらめてサイトを去り、別のサイトを閲覧することが考えられる。このようなケースでは、検索後閲覧時間は満足度としての利用が適切である。例えば、「蜂蜜」という検索キーワードに対する検索後閲覧時間が短いために、「蜂蜜に関する満足度が低い」という分析結果が得られた場合、この結果は「蜂蜜」に関連するコンテンツを改良して、満足度を向上させるような対策を打つ必要性が高い、という判断をする根拠として有効である。
【0176】
一方、他に類似の競合サイトが少ない場合や、提供しているコンテンツが閲覧者の嗜好を満たすような内容というよりはむしろ合理的必要性に応じて閲覧している場合や、その検索キーワードに関する情報をできるだけ当該Webサイトから得たいと思っている閲覧者が多数であるような場合においては、閲覧者が検索キーワードに関連する内容を重視している度合いに応じて、長時間サイトに滞在して、その情報を閲覧すると考えられる。したがって、検索後閲覧時間を重視度の算出に利用することが適切な場合がある。この場合に、ある検索キーワードに対する検索後閲覧時間が短いために、それに関する重視度が低いという分析結果が得られた場合、この結果はそのコンテンツについては以後それほど改良のための対策を打つ必要性が低い、という判断をする根拠として有効である。
【0177】
さらに、利便度においては、例えば提供しているコンテンツをどれだけ閲覧者が容易に理解したか、情報の入力がどの程度容易であったかを評価する指標として有効である。
【0178】
例えば検索キーワードに応じてアンケート内容を変えているWebサイトにおいて、検索後閲覧時間が長いということは、アンケートの返答の入力に手間取っていると判断され、利便度が低いと判断される。
【0179】
このように利便度の低いコンテンツがあれば、利便度を向上させるべく、対策を打つ必要性が高い、という判断をする根拠として有効である。
【0180】
(第2の実施の形態)
本実施の形態においては、上記第1の実施の形態に係る検索キーワード分析システムの変形例について説明する。なお、本実施の形態においては、質的評価値のうち満足度を求め、量的評価値のうちニーズ値を求める場合について説明するが、他の質的評価値及び量的評価値を求める場合も同様である。
【0181】
図6は、本実施の形態に係る検索キーワード分析システムの構成の一例を示すブロック図である。
【0182】
本実施の形態に係る検索キーワード分析システム18は、記録媒体19に記録されている検索キーワード分析プログラム20を読み出して実行する。
【0183】
検索キーワード分析プログラム20は、システム18に読み込まれ、実行されると、ログ前処理機能12、アクセスシーケンス抽出機能13、キーワード抽出機能14、評価値算出機能39を実現する。
【0184】
また、評価値算出機能39は、満足度算出機能15、ニーズ値算出機能21、満足度・ニーズ値関連付け機能22を含む。
【0185】
ニーズ値算出機能21、満足度・ニーズ値関連付け機能22によって作成されたデータは、記録装置38に記録される。ニーズ値算出機能21、満足度・ニーズ値関連付け機能22は、記録装置38に記録されたデータを読み込み可能である。
【0186】
ニーズ値算出機能21は、キーワード抽出機能14によって生成されたキーワードデータに基づいて、検索キーワードごとのニーズ値を算出する。
【0187】
ニーズ値を算出するために、ニーズ値をどのように算出するかを表す量的評価規則が定義される。
【0188】
例えば、量的評価規則として、検索キーワードの入力総数に対する各検索キーワードの占める割合を百分率で表した値をニーズ値と定義する。
【0189】
ニーズ値算出機能21は、キーワード抽出機能14によって生成されたキーワードデータを読み込み、検索キーワードごとの入力個数をカウントする。
【0190】
次に、ニーズ値算出機能21は、検索キーワードごとの入力個数から全検索キーワードの入力個数の合計を算出する。
【0191】
次に、ニーズ値算出機能21は、全検索キーワードの入力個数と検索キーワードごとの入力個数とに基づいて、全検索キーワードの入力に対する各検索キーワードの占める割合を百分率で表す。
【0192】
そして、ニーズ値算出機能21は、検索キーワードごとのニーズ値を表すニーズ値算出データを作成する。
【0193】
表12に、ニーズ値算出データの一例を示す。
【0194】
【表12】
【0195】
満足度・ニーズ値関連付け機能22は、満足度算出機能15によって生成された満足度算出データとニーズ値算出機能21によって生成されたニーズ値算出データを読み込む。
【0196】
そして、満足度・ニーズ値関連付け機能22は、満足度算出データとニーズ値算出データを検索キーワード毎に統合し、検索キーワードごとのニーズ値、満足度を表す関係データを作成する。
【0197】
表13に、関係データの一例を示す。
【0198】
【表13】
【0199】
以上説明した本実施の形態において、顧客5は、質的評価値(例えば満足度)と量的評価値(例えばニーズ値)とを参照、比較しつつ、早急に対策を取る必要がある検索キーワードについて知ることができる。
【0200】
例えば、顧客5は、上記表13の例を参照した場合に、検索キーワード「砂糖」と「肉野菜」は同程度の満足度であり他の検索キーワードに比べて満足度が低いが、「肉野菜」は「砂糖」に比べてニーズ値が高いと解釈できる。
【0201】
この結果、顧客5は、検索キーワード「砂糖」について満足度が低いがあまり検索のニーズがなく(本実施形態の場合、検索キーワード「砂糖」による検索結果ページの閲覧者が少なく)、比較的影響力が低いと判断できる。
【0202】
これに対し、顧客5は、検索キーワード「肉野菜」は「砂糖」と同じ程度で満足度が低いが検索のニーズがあり(本実施形態の場合、検索キーワード「肉野菜」による検索結果ページの閲覧者が多く)、影響力が大きいと判断できる。
【0203】
このため、本実施の形態において、顧客5は、「肉野菜」関連のコンテンツを増やすなどの対策を優先的に講じる必要があると判断でき、迅速かつ正確に閲覧者の希望に合うようにサイト内検索システム6a、WebページP1〜Pnを変更することができる。
【0204】
なお、本実施の形態において、ニーズ値の算出方法は、キーワード抽出機能14、ニーズ値算出機能21の設定を変更することにより、自由に変更できる。例えば、検索キーワードが入力されて得られたキーワード関連ページをアクセスした顧客サイト閲覧者8aの人数又はキーワード関連ページのアクセス数に基づいてニーズ値を算出してもよい。また、例えば、アクセスシーケンスにしたがったアクセスを行った閲覧者の人数、アクセスシーケンスにしたがったアクセスの実行された回数(閲覧回数)に基づいてニーズ値を算出してもよい。
【0205】
なお、量的評価値の例として、ニーズ値の他に機会値もある。機会値とは、Webサイトがその目的を遂行するに当たって、検索キーワードに関連する観点で、どれだけの事業機会を得たかを示す指標である。
【0206】
例えば、食品を販売しているECサイトにおいて、「砂糖」という検索キーワードによって閲覧してきた閲覧者が多数いれば、それだけ多くの砂糖を販売する事業機会を得たことになる。
【0207】
また、検索キーワードごとの入力回数のような、ニーズ値の算出に用いられた数量に基づいて機会値を算出してもよい。
【0208】
検索キーワードごとの入力回数をニーズ値とするか機会値とするかについては、Webサイトや閲覧者の特性、分析者の観点に依存する。
【0209】
例えば、商品そのものを販売するというよりは、商品に関する情報を提供し、その反応を知るために運営されているWebサイトにおいては、検索キーワードごとの入力回数をニーズ値として取り扱うことが適切である。
【0210】
一方、商品そのものをオンラインで販売することを主たる目的としているWebサイトでは検索キーワードごとの入力回数を機会値として取り扱い、各検索キーワードに関連した商品の販売の機会の量を示す指標とすることが適切である。
【0211】
(第3の実施の形態)
本実施の形態においては、上記第2の実施の形態に係る検索キーワード分析システムの変形例について説明する。
【0212】
図7は、本実施の形態に係る検索キーワード分析システムの構成の一例を示すブロック図である。
【0213】
本実施の形態に係る検索キーワード分析システム24は、記録媒体25に記録されている検索キーワード分析プログラム26を読み出して実行する。
【0214】
検索キーワード分析プログラム26は、システム24に読み込まれ、実行されると、ログ前処理機能12、アクセスシーケンス抽出機能13、キーワード抽出機能14、評価値算出機能39に加えて、グラフ化機能27を実現する。
【0215】
グラフ化機能27は、満足度・ニーズ値関連付け機能22によって生成された関係データを読み込む。
【0216】
そして、グラフ化機能27は、検索キーワードごとのニーズ値・満足度の値をグラフで表現した出力データ28を作成する。
【0217】
グラフ化機能27は、所定のグラフ化規則とグラフ化に利用されるパラメータとにしたがって、検索キーワードごとに満足度とニーズ値とが関連付けされた関係データをグラフ化する。
【0218】
例えば、グラフ化機能27は、散布図を作成する。この場合、満足度とニーズ値とをパラメータとし、散布図の一方の軸(X軸)をニーズ値、他方の軸(Y軸)を満足度とし、関係データにおけるニーズ値・満足度の値に基づいて各検索キーワードを表す点をプロットする。
【0219】
図8は、検索キーワード毎の満足度とニーズ値とを表すグラフの一例である。
【0220】
本実施の形態においては、検索キーワードごとの満足度とニーズ値とがグラフ化されて表示されるため、顧客5に視覚的な分析結果が提供される。
【0221】
したがって、顧客5は、より人間が直感的に解釈・判断しやすい分析結果を得ることができる。
【0222】
例えば、顧客5は、上記図8のグラフから、検索キーワード「りんご」についてはニーズ値が高く満足度も高いのに対して、検索キーワード「スーパー」「肉野菜」についてはニーズ値が高いにもかかわらず満足度が低く、早急にサイト内検索システム6a、WebページP1〜Pnを変更し、対策を取る必要があると解釈される。
【0223】
なお、本実施の形態におけるグラフ化機能27の設定を変更することにより、グラフの軸の値を変換でき、グラフ表示効果を向上させることができる。例えば、グラフ化機能27は、ニーズ値、満足度を0から1の間に正規化するとしてもよい。また、ニーズ値、満足度に対数処理を施してグラフ表示してもよい。さらに、グラフ化機能27は、ニーズ値、満足度を棒グラフで表してもよい。さらに、グラフ化機能27は、グラフに適切な補助線を加えてもよい。
【0224】
(第4の実施の形態)
本実施の形態においては、上記第1乃至第3の実施の形態に係る検索キーワード分析システムの変形例について説明する。なお、以下においては、上記第1の実施の形態についての変形例を説明するが、他の第2、第3の実施の形態についても同様の変形が可能である。
【0225】
なお、本実施の形態においては、質的評価値のうち成功度を求める場合について説明するが、成功度ではない他の質的評価値を求める場合も同様である。
【0226】
図9は、本実施の形態に係る検索キーワード分析システムの一例を示すブロック図である。
【0227】
本実施の形態に係る検索キーワード分析システム29は、記録媒体30に記録されている検索キーワード分析プログラム31を読み出して実行する。
【0228】
検索キーワード分析プログラム31は、システム29に読み込まれ、実行されると、ログ前処理機能12、アクセスシーケンス抽出機能13、キーワード抽出機能14、評価値算出機能40を実現する。
【0229】
また、評価値算出機能40は、成功度算出機能32、成功度・キーワード関連付け機能41を含む。
【0230】
成功度算出機能32は、質的評価規則にしたがって、アクセスシーケンス抽出機能13によって算出されたアクセスシーケンスデータとキーワード抽出機能14によって算出されたキーワードデータとに基づいて、成功度を算出する。
【0231】
本実施の形態に係る質的評価規則として、例えば以下のような内容の規則が定義される。
【0232】
顧客5は、代表的な検索キーワード(分析候補の検索キーワード)に対して、閲覧者にアクセスして欲しいWebページ(以下、「アクセス希望ページ」という)の識別情報を関連付けたリスト(以下、「アクセス希望ページリスト」という)を作成する。
【0233】
そして、顧客サイト閲覧者8aが検索結果ページ上のリンクにしたがってアクセス希望ページをアクセスしたら成功度をカウントアップする。
【0234】
ただし、検索結果ページからアクセス希望ページまでのリンククリック数が増加するにつれて成功度を減少させる。
【0235】
なお、顧客5が指定しなかった検索キーワードは「(その他)」とし、成功度は一切加算せず評価対象外とする。
【0236】
以上述べた質的評価規則において利用されるアクセス希望ページリストの一例を、表14に示す。
【0237】
【表14】
【0238】
なお、一つの検索キーワードに対して複数のアクセス希望ページが対応付けされていてもよく、複数の検索キーワードが一つのアクセス希望ページに対応付けされていてもよい。
【0239】
また、表15に、検索結果ページからアクセス希望ページまでのリンククリック数が増加するにつれて成功度を減少させるための成功度重み付け表の一例を示す。
【0240】
【表15】
【0241】
成功度算出機能32は、アクセスシーケンス抽出機能13によって生成されたアクセスシーケンスデータと、キーワード抽出機能14によって生成されたキーワードデータと、アクセス希望ページリストと、成功度重み付け表とを読み込む。
【0242】
なお、成功度算出機能32は、キーワードデータの全てを読み込むのではなく、キーワードデータのうち検索キーワードとアクセス識別子の組み合わせのみを読み込むとしてもよい。
【0243】
次に、成功度算出機能32は、キーワードデータから、アクセス希望ページリストの検索キーワードに含まれている検索キーワードとそのアクセス識別子(ViewID)を取り出す。
【0244】
次に、成功度算出機能32は、アクセスシーケンスデータにおいて、上記作業によって取り出されたアクセス識別子と関連付けされているアクセスシーケンス識別子を取り出す。
【0245】
次に、成功度算出機能32は、取り出されたアクセスシーケンス識別子に関連するアクセス識別子とリクエストとをアクセスシーケンスデータから取り出し、リクエストに含まれている検索キーワードを取り出す。
【0246】
表16に、この段階における第1の中間生成データを示す。
【0247】
【表16】
【0248】
次に、成功度算出機能32は、各検索キーワードに対するアクセス希望ページがその検索キーワードが入力されたアクセスシーケンスにおいてアクセスされているかを調査する。
【0249】
アクセス希望ページがアクセスされている場合、成功度算出機能32は、検索キーワードの入力から何クリック後にアクセス希望ページがアクセスされたかを調査する。
【0250】
なお、検索キーワードの入力前にアクセス希望ページがアクセスされていても、そのアクセスは成功度の算出において考慮しない。
【0251】
上記表16の例において、アクセス識別子「View22」に関連する検索キーワード「りんご」に対するアクセス希望ページ識別子は、「/apple/index.html」である。このアクセス希望ページ識別子「/apple/index.html」は、アクセス識別子「View22」と同一のアクセスシーケンス識別子「Visit6」と関連するアクセス識別子「View28」に関連付けされている。
【0252】
そして、アクセス希望ページ識別子「/apple/index.html」は、検索キーワード「りんご」が入力された2クリック後に、入力されている。
【0253】
次に、成功度算出機能32は、成功度と検索結果ページからのクリック数との関係に基づいて、成功度を算出する。
【0254】
上記の例及び上記表15を適用した場合、アクセスシーケンス識別子「Visit6」で表されるアクセスシーケンスでは、検索キーワード「りんご」に対して満足度「80」が与えられる。
【0255】
表17に、この段階における第2の中間生成データを示す。
【0256】
【表17】
【0257】
そして、成功度算出機能32は、検索キーワードごとに、成功度の平均値を求めた成功度算出データを作成する。
【0258】
成功度・キーワード関連付け機能41は、成功度算出機能32で生成された成功度算出データと、キーワード抽出機能14で生成されたキーワードデータを統合し、検索キーワードごとの成功度を算出し、成功度と検索キーワードとを関係付け、関係データを作成する。
【0259】
関係データは、例えば、項目「満足度」が項目「成功度」に変化する点を除いて上記表11と同様の形式となる。
【0260】
以上説明した本実施の形態における成功度算出方法を用いることで、ある検索キーワードに対し顧客にアクセスしてもらいたいとと考えているWebページへ適切に誘導がなされているかを知ることができる。
【0261】
(第5の実施の形態)
本実施の形態においては、上記第1から第4の実施の形態に係る検索キーワード分析システムの変形例について説明する。
【0262】
本実施の形態においては、検索システムが顧客サイト6外にある場合の検索キーワード分析システムについて説明する。
【0263】
なお、以下においては、上記第1の実施の形態についての変形例を説明するが、他の第2から第4の実施の形態についても同様の変形が可能である。
【0264】
図10は、本実施の形態に係る顧客サイトの構成の一例を示す図である。
【0265】
顧客サイト61は一以上のWebページP1〜Pnを持つ。また、顧客サイト61におけるいくつかのWebページは、顧客5以外の第3の運営主体によって運営されている複数のサイト外の検索システム(以下、「サイト外検索システム」という)341〜34nの検索対象となっている。
【0266】
サイト外検索システム341〜34nは、検索キーワードを入力すると、キーワード関連ページへのリンクを含む検索結果ページを表示する。
【0267】
本実施の形態においては、顧客サイト61と検索システム341〜34nの運営主体が異なるため、上記第1から第4の実施形態の場合と異なり検索システム341〜34nのWebアクセスログを取得することは困難である。
【0268】
したがって、本実施の形態においては、検索システム341〜34nのWebアクセスログではなく、顧客サイト61のWebアクセスログに含まれるレファラ情報を利用して検索キーワード分析を行う。
【0269】
表18に、顧客サイト61のWebアクセスログの一例を示す。
【0270】
【表18】
【0271】
図11は、サイト外検索システム341から顧客サイト61への閲覧遷移の一例を示すブロック図である。
【0272】
閲覧者によって検索キーワード入力画面35に検索キーワードが入力されると、検索結果ページ36が作成される。この検索結果ページ36を示すURLには、検索キーワード入力画面35に入力された検索キーワードが含まれる場合がある。
【0273】
閲覧者によって検索結果ページ36のリンクがクリックされ、顧客サイト61のキーワード関連ページが閲覧された場合、検索キーワードを含む検索結果ページのURLであるレファラ情報とアクセスされた顧客サイト61のキーワード関連ページのURLであるリクエストとが関連付けされて顧客サイト61のWebアクセスログに記録される。
【0274】
本実施の形態に係る検索キーワード分析システムは、上記図1に示す構成と同様の構成を持つため、ここでは図1を参照して本実施の形態の特徴的な部分について説明する。
【0275】
本実施の形態に係る顧客サイト61のWebアクセスログには、レファラ情報が含まれる。
【0276】
本実施の形態に係る検索キーワード分析システムにおいては、アクセスシーケンス抽出機能、キーワード抽出機能、満足度抽出機能の動作が、上記第1の実施の形態に係る検索キーワード分析システム9と異なる。
【0277】
本実施の形態に係るアクセスシーケンス抽出機能は、アクセスシーケンス識別子の付与、アクセスシーケンスの区切りの判定などについては、上記第1の実施の形態に係るアクセスシーケンス抽出機能13と同様の処理を実行する。
【0278】
また、本実施の形態に係るアクセスシーケンス抽出機能は、各アクセスについてのレファラ情報に基づいて、レファラ情報がサイト外検索システムを示すか否か判定する。
【0279】
表19に、サイト外検索システムを表すURLパターンと検索キーワードを抽出するためのクエリーパターンとを関係付けたデータを示す。
【0280】
【表19】
【0281】
本実施の形態に係るアクセスシーケンス抽出機能は、サイト外検索システムからのアクセスか否かを判定する場合に、各アクセスのレファラ情報が検索システムのURLパターンを含むか調査する。
【0282】
そして、本実施の形態に係るアクセスシーケンス抽出機能は、レファラ情報がサイト外検索システムを示すアクセスに対してレファラフラグを付与したアクセスシーケンスデータを作成する。
【0283】
表20に、本実施の形態に係るアクセスシーケンスデータの一例を示す。
【0284】
【表20】
【0285】
表20において、レファラフラグ「0」は、サイト外検索システムからのアクセスでない旨を示す。
【0286】
一方、レファラフラグ「1」は、サイト外検索システムからのアクセスである旨を示す。
【0287】
このレファラフラグを記録することにより、アクセスシーケンスの途中で検索が行われた場合であっても、検索後のアクセス状況を調査し、満足度を算出できる。
【0288】
本実施の形態に係るキーワード抽出機能は、ログ前処理機能12によって生成された前処理データに基づいて、レファラ情報が検索システムのURLパターンを含むアクセスを求める。
【0289】
そして、本実施の形態に係るキーワード抽出機能は、URLパターンが含まれているレファラ情報の中から、その検索システムのURLパターンに対応付けられたクエリーパターンに基づいて、閲覧者がサイト外検索システムにおいて入力した検索キーワードを抽出する。
【0290】
表21に、本実施の形態に係るキーワード抽出機能によって生成されたキーワードデータの一例を示す。
【0291】
【表21】
【0292】
本実施の形態に係る満足度算出機能は、アクセスシーケンス抽出機能によって生成されたアクセスシーケンスデータから満足度を算出する。
【0293】
満足度の算出方法としては、例えば上記第1の実施の形態で説明した規則を適用する。
【0294】
すなわち、本実施の形態に係る満足度算出機能は、本実施の形態に係るアクセスシーケンス抽出機能によって生成されたアクセスシーケンスデータを読み込んだ後、Webページのアクセスごとに検索後閲覧時間を計算する。
【0295】
検索後閲覧時間は、同一のアクセスシーケンス識別子で表されるアクセスの中で、検索システムを利用したレファラ情報を持つアクセス(上記表20においてフラグ「1」のアクセス)から最後に閲覧されたアクセスまでの時刻の差分を求めることで計算できる。
【0296】
なお、検索システムをレファラ情報として持つアクセスがないアクセスシーケンスに関しては検索後閲覧時間を記録しない。
【0297】
また、本実施の形態に係る満足度算出機能は、上記表8のような検索後閲覧時間と満足度とを関連付けたデータを読み込み、アクセスごとの満足度を算出する。
【0298】
ただし、検索後閲覧時間の記録がない場合は満足度を記録しない。
【0299】
そして、本実施の形態に係る満足度算出機能は、アクセス識別子毎にアクセスシーケンス識別子と満足度とを関連付け、上記表9と同様な満足度算出データを作成する。
【0300】
以上説明した本実施の形態においては、顧客サイト61が検索システムを具備していない場合であっても、検索キーワードの満足度を算出することができる。
【0301】
したがって、検索キーワードの分析結果を得ることができる顧客サイトを大幅に増加することができる。
【0302】
なお、本実施の形態においては検索キーワード入力画面35がサイト外検索システム341にある場合について説明を行ったが、顧客サイト61内に検索キーワード入力画面があるとしてもよい。顧客が、検索業務をASP(Application Service Provider)サービスとして行っている業者に顧客サイト61内を検索するシステムを委託している場合などがこのようなケースに当てはまる。
【0303】
図12は、顧客サイト61内の検索キーワード入力画面96からサイト外検索システム341の検索結果ページ97へ移り、上記検索結果ページ97から顧客サイト61内のキーワード関連ページ98に遷移する一例を示すブロック図である。
【0304】
この図12において、閲覧者によって検索キーワード入力画面96に検索キーワードが入力されると、サイト外検索システム341により検索結果ページ97が作成される。この検索結果ページ97を示すURLには、顧客サイト61内の検索キーワード入力画面96に入力された検索キーワードが含まれる場合がある。
【0305】
閲覧者によってサイト外検索システム341の検索結果ページ97のリンクがクリックされ、顧客サイト61のキーワード関連ページ98が閲覧された場合、検索キーワードを含む検索結果ページ97のURLであるレファラ情報とアクセスされた顧客サイト61のキーワード関連ページ98のURLであるリクエストとが関連付けされて顧客サイト61のWebアクセスログに記録される。
【0306】
(第6の実施の形態)
本実施の形態においては、第1の実施の形態に係る検索キーワード分析システムの変形例について説明する。
【0307】
第1から第5の実施の形態においては、アクセスシーケンスの抽出や質的評価値の算出と、検索キーワードの抽出を並列に実行し、最終的に関連付け機能によって統合する方法を用いていた。
【0308】
これに対し、本実施の形態では、検索キーワードの抽出処理と質的評価値の算出処理を直列に行う。
【0309】
なお、本実施の形態では、サイト内検索について分析を行う場合について記述しているが、本実施の形態と第5の実施形態とを組み合わせることでサイト外検索についての分析にも適用可能である。
【0310】
図13は、本実施の形態に係る検索キーワード分析システムの構成の一例を示すブロック図である。
【0311】
本実施の形態に係る検索キーワード分析システム42は、記録媒体43に記録されている検索キーワード分析プログラム44を読み出して実行する。
【0312】
検索キーワード分析プログラム44は、システム42に読み込まれ、実行されると、ログ前処理機能12、アクセスシーケンス抽出機能13、キーワード抽出機能45、評価値算出機能46を実現する。
【0313】
キーワード抽出機能45、評価値算出機能46によって作成されたデータは、記録装置38に記録される。キーワード抽出機能45、評価値算出機能46は、記録装置38に記録されたデータを読み込み可能である。
【0314】
キーワード抽出機能45は、アクセスシーケンス抽出機能13によって生成されたデータから、顧客サイト閲覧者8aがサイト内検索システム6aにおいて入力した検索キーワードを抽出する。検索キーワードの抽出には上記第1の実施の形態と同等の方法を用いる。
【0315】
すなわち、キーワード抽出機能45は、前処理データから検索システムの場所に関する情報に基づいて、検索システムに対するアクセスを抽出する。
【0316】
次に、キーワード抽出機能45は、クエリーパターンに関する情報に基づいて、検索キーワードを抽出する。なお、エンコードされたパラメータについては判読可能な文字列へのデコードを行う。
【0317】
そして、キーワード抽出機能45は、アクセスシーケンス・キーワードデータを生成する。この際、検索システムを利用していないアクセスに関してはキーワード項目に何も記録しない。
【0318】
表22に、アクセスシーケンス・キーワードデータの具体例を示す。
【0319】
【表22】
【0320】
評価値算出機能46は、アクセスシーケンス・キーワードデータに基づいて、質的評価値、例えば満足度を算出する。質的評価規則は第1の実施の形態と同様の規則を用いる。
【0321】
すなわち、評価値算出機能46は、アクセスシーケンス・キーワードデータを読み込み、アクセスシーケンスごとに検索後閲覧時間を計算する。検索後閲覧時間は、同一のアクセスシーケンス識別子によるアクセスの中で、キーワード関連ページへのアクセスと一番新しいアクセスの時刻の差分から計算される。
【0322】
次に、評価値算出機能46は、上記表8のような検索後閲覧時間と満足度の対応データを読み込み、アクセスシーケンスごとの満足度を算出する。
【0323】
表23に、この段階における中間生成データを示す。
【0324】
【表23】
【0325】
次に、評価値算出機能46は、アクセスシーケンスについて満足度と検索キーワードを求める。この際、検索キーワードの記録のないアクセスシーケンスは処理対象としない。
【0326】
そして、評価値算出機能46は、検索キーワードごとに、満足度の平均を求め、関係データを生成する。
【0327】
関係データの具体的な内容は、上記表11と同様である。
【0328】
なお、本実施の形態において、評価値算出機能46は、量的評価値、例えばニーズ値を算出するとしてもよい。このニーズ値の算出方法は、上記第2の実施の形態で説明した方法が適用できる。また、評価値算出機能46によって質的評価値と量的評価値とを算出した場合、上記第3の実施の形態と同様にグラフ化機能27によって関係データに基づくグラフを表示するとしてもよい。
【0329】
以上説明した本実施の形態においては、アクセスシーケンス抽出、検索キーワード抽出、質的評価値算出及び量的評価値算出算出に関する各処理が並列ではなく直列に実行されており、上記各実施の形態と同様の効果を得ることができる。また、本実施の形態においては、ログを一括ではなく1アクセスシーケンスごとに処理することも可能になる。
【0330】
なお、上記各実施の形態においては、一つのアクセスシーケンスに対して検索キーワードが一回入力された場合を想定して説明しているが、一つのアクセスシーケンスに対して検索キーワードが複数回入力された場合であっても検索キーワードの質的評価値、量的評価値を求めることができる。
【0331】
例えば、一つのアクセスシーケンスに対して検索キーワードが複数回入力されている場合、そのアクセスシーケンスを検索キーワードの入力を境界として複数のアクセスシーケンスを抽出し、この抽出されたアクセスシーケンスを用いて質的評価値、量的評価値を求めるとしてもよい。
【0332】
この場合、一つのアクセスシーケンスに対して検索キーワードが一回入力された場合における上記各実施の形態の処理方法を、細分化後の一つのアクセスシーケンスに対して適用することができる。
【0333】
(第7の実施の形態)
本実施の形態においては、分析対象のWebサイトのWebアクセスログ分析を実行し、分析対象ではない他のWeサイトに存在する外部コンテンツから分析対象のWebサイトが閲覧される傾向を分析するための検索キーワード分析システムについて説明する。
【0334】
本実施の形態では、外部コンテンツが検索システムであり、検索システムで入力された検索キーワードに基づいて閲覧の傾向を調査する。
【0335】
図14は、本実施の形態に係る検索キーワード分析システムの構成の一例を示すブロック図である。
【0336】
検索キーワード分析システム47は、記録媒体48に記録された検索キーワード分析プログラム49を読み込み、実行することにより、ログ前処理機能12a、アクセスシーケンス抽出機能13a、キーワード抽出機能14a、評価値算出機能39a、カテゴリ形成機能52、トレンド分析機能53、出力処理機能54を実現する。また、検索キーワード分析システム47は、出力装置55、記録装置38、58〜60を具備する。
【0337】
なお、ログ前処理機能12a、アクセスシーケンス抽出機能13a、キーワード抽出機能14a、評価値算出機能39a、カテゴリ形成機能52、トレンド分析機能53、出力処理機能54は、ハードウェアにより実現されてもよい。
【0338】
本実施の形態において、例えば、記録装置38への記録、読み出しを経由して各機能12a〜14a、39a、52〜54の間でデータの提供、受け付けが行われるとしてもよい。
【0339】
記録装置38、58〜60としては、例えば内部メモリ、ハードディスクなどが適用される。各記録装置38、58〜60は、データベースを構成する要素であり、各データはデータベースに管理されるとしてもよい。また、各記録装置38、58〜60は、自由に統合可能である。
【0340】
記録装置4に記録されているWebアクセスログ7は、閲覧者によってアクセスされた部分を示すアクセス先識別データ、アクセスされた時間を示す時間データ(例えば日付、時刻)、閲覧者が検索システムによる検索結果に基づいてアクセスした場合の検索キーワードとを関連付けたデータを含む。
【0341】
ログ前処理機能12a、アクセスシーケンス抽出機能13a、キーワード抽出機能14a、評価値算出機能39aは、上述したログ前処理機能12、アクセスシーケンス抽出機能13、キーワード抽出機能14、評価値算出機能39と同様の処理を実行するが、Webアクセスログ7の時間データに基づいて、所定の期間毎のデータに対して処理を実行し、所定の期間毎に、分析対象のWebサイトをアクセスするために入力された各検索キーワードと質的評価値である満足度と量的評価値であるニーズ値とを対応付けた関係データを作成する点が異なる。
【0342】
なお、上記各機能12a〜14a、39aによって、所定の期間毎に、関係データを求める処理を実行するためには、例えばログ前処理機能12aが、Webアクセスログ7のうち所定の期間毎のデータを受け付けることで可能となる。
【0343】
評価値算出機能39aは、所定の期間毎に、分析対象のWebサイトをアクセスするために入力された各検索キーワードの満足度とニーズ値とを求め、カテゴリ形成機能52とトレンド分析機能53に提供する。なお、例えば、同一期間内に、同一の検索キーワードの質的評価値又は量的評価値が複数算出された場合には、評価値算出機能39aは、その期間について、同一の検索キーワードの質的評価値又は量的評価値の平均を求めるとしてもよい。
【0344】
カテゴリ形成機能52は、記録装置58に記録されているカテゴリデータ72、所定の期間毎の各検索キーワードの満足度及びニーズ値に基づいて、各検索キーワードの属するカテゴリ単位で満足度及びニーズ値を求め、求めた各カテゴリの満足度及びニーズ値をトレンド分析機能53に提供する。
【0345】
カテゴリデータ72は、例えば、検索キーワードとこの検索キーワードの属するカテゴリとを関連付けたデータである。
【0346】
カテゴリ形成機能52は、例えば、期間毎に、カテゴリに属する検索キーワードのニーズ値の総和又は平均値を求め、期間毎のカテゴリのニーズ値とする。
【0347】
カテゴリ形成機能52は、例えば、期間毎に、カテゴリに属する各検索キーワードの満足度をニーズ値で重み付けした重み満足度の総和を、カテゴリに属する各検索キーワードのニーズ値の総和で割った値を求め、期間毎のカテゴリの満足度とする。
【0348】
トレンド分析機能53は、期間経過にそって、各検索キーワード及び各カテゴリのニーズ値と満足度の遷移状況を表すトレンドデータ73を求め、記録装置59に記録する。
【0349】
トレンド分析機能53は、領域計算機能53a、領域判断機能53b、メッセージ付加機能53cを具備する。
【0350】
領域計算機能53aは、記録装置60に記録されているニーズ境界値74、満足度境界値75、評価値算出機能39aによって求められた期間毎の検索キーワードの満足度及びニーズ値、カテゴリ形成機能52によって求められた期間毎のカテゴリの満足度及びニーズ値に基づいて、期間毎に、検索キーワード及びカテゴリがニーズ境界値74、満足度境界値75によって決定されるどの領域に位置するか判断する。
【0351】
ニーズ境界値74、満足度境界値75は、ニーズ値、満足度の意味が切り換わる境界を表す値である。このニーズ境界値74、満足度境界値75によって、分析対象のWebサイトをアクセスするために入力された検索キーワード及びカテゴリの位置する領域が決定される。
【0352】
領域判断機能53bは、期間の切り換わりに応じて、すなわち期間の経過にそって検索キーワードが領域を移動したか、カテゴリが領域を移動したか判断する。
【0353】
メッセージ付加機能53cは、記録装置60に記録されているメッセージデータ76に基づいて、期間経過にそって領域を移動した検索キーワード又はカテゴリに、その移動した領域に対応するメッセージ(例えばコメント文、注釈など)を付する。
【0354】
メッセージデータ76は、例えば分析対象のWebサイトをアクセスするために入力された検索キーワードの移動前の領域と移動後の領域とメッセージとを関連付けたデータである。なお、メッセージデータ76には、領域が変化した場合に、期間経過後の領域に移動したことを意味するメッセージを付するための規則が定義されていればよい。
【0355】
トレンド分析機能53は、期間毎の検索キーワード及びカテゴリのニーズ値及び満足度、期間毎の検索キーワード及びカテゴリの位置する領域、領域移動の有無を示す判断結果、領域を移動した検索キーワードに付されたメッセージ、領域を移動したカテゴリに付されたメッセージを含むトレンドデータ73を記録装置59に記録する。
【0356】
出力処理機能54は、記録装置59に記録されているトレンドデータ73を、出力装置55を用いて出力するための処理を実行する。出力処理機能54は、トレンドデータ73を例えばテーブル、グラフ、各種の図などの形式で出力する。
【0357】
図15は、本実施の形態に係る検索キーワード分析システム47の動作の一例を示すフローチャートである。
【0358】
ステップV1において、ログ前処理機能12a、アクセスシーケンス抽出機能13a、キーワード抽出機能14a、評価値算出機能39aは、Webアクセスログ7の時間データに基づいて、所定の期間毎に、分析対象のWebサイトをアクセスするために入力された各検索キーワードと満足度とニーズ値とを対応付けた関係データを作成する。
【0359】
ステップV2において、カテゴリ形成機能52cは、期間毎に、各検索キーワードの属するカテゴリのニーズ値、満足度を求める。
【0360】
ステップV3において、トレンド分析機能53の領域計算機能53aは、ニーズ境界値74、満足度境界値75に基づいて、期間毎に、検索キーワード及びカテゴリの位置する領域を求め、検索キーワード及びカテゴリのニーズ値及び満足度、検索キーワード及びカテゴリの位置する領域をトレンドデータ73に含める。
【0361】
ステップV4において、トレンド分析機能53の領域判断機能53bは、期間経過にそって、検索キーワードの位置する領域が変化したか、カテゴリの位置する領域が変化したか判断し、判断結果をトレンドデータ73に含める。
【0362】
検索キーワード又はカテゴリの位置する領域が変化したと判断された場合、ステップV5において、トレンド分析機能53のメッセージ付加機能53cは、メッセージデータ76に基づいて、領域が変化した検索キーワード、領域が変化したカテゴリに、領域の変換に応じたメッセージを付し、結果をトレンドデータ73に含める。
【0363】
ステップV6において、出力処理機能54は、分析者の操作に応じて、トレンドデータ73に基づいて、検索キーワード、カテゴリのニーズ値、満足度の遷移状況とメッセージとを表示する。
【0364】
以下、評価値算出機能39aによって求められる関係データについて説明する。
【0365】
評価値算出機能39aは、期間毎に、図16に示すような、分析対象のWebサイトをアクセスするために入力された検索キーワードのニーズ値と満足度を計算した結果を示す関係データを、トレンド分析機能53の領域計算機能53a及びカテゴリ形成機能52に提供する。
【0366】
カテゴリ形成機能52は、期間毎に、図17に示すように、カテゴリデータ72と検索キーワードのニーズ値及び満足度とに基づいて、検索キーワード単位のニーズ値、満足度からカテゴリ単位のニーズ値、満足度を求め、カテゴリのニーズ値、満足度をトレンド分析機能53の領域計算機能53aに提供する。
【0367】
トレンド分析機能53は、図18に示すような検索キーワードの遷移状況にメッセージを付したデータ、及び図19に示すようなカテゴリの遷移状況にメッセージを付したデータをトレンドデータ73に含め、トレンドデータ73を記録装置59に記録する。
【0368】
以下に、カテゴリ形成機能52について詳細に説明する。
【0369】
図20は、カテゴリ形成機能52の動作の一例を示すフローチャートである。
【0370】
ステップW1において、カテゴリ形成機能52は、カテゴリデータ72に基づいて、期間毎に、あるカテゴリに属する検索キーワードを識別する。
【0371】
ステップW2において、カテゴリ形成機能52は、期間毎に、(1)式に示すようにカテゴリに属する各検索キーワードのニーズ値の総和を求め、カテゴリのニーズ値とする。
【0372】
【数1】
【0373】
ステップW3において、カテゴリ形成機能52は、期間毎に、(2)式に示すように、カテゴリに属する各検索キーワードの満足度の加重平均を求め、カテゴリの満足度とする。
【0374】
【数2】
【0375】
この数式(2)では、カテゴリの満足度は、そのカテゴリに属する各検索キーワードの満足度とニーズ値との積の総和を、そのカテゴリに属する検索キーワードのニーズ値の総和で割って求められる。
【0376】
ステップW4において、カテゴリ形成機能52は、期間毎に、全てのカテゴリについてニーズ値及び満足度を求めたか判断し、全てのカテゴリについてニーズ値及び満足度を求めていない場合、上記ステップW1以下の処理を繰り返す。
【0377】
以下に、カテゴリの満足度を、そのカテゴリに属する各検索キーワードの満足度をそれぞれのニーズ値で重み付けした値の総和を、そのカテゴリに属する各検索キーワードのニーズ値の総和で割って求める理由について説明する。
【0378】
例えば、あるカテゴリCにおいて、検索キーワードC1のニーズ値は極めて小さいが、検索キーワードC1の満足度は極めて大きいとする。この場合、検索キーワードC1を用いて分析対象のWebサイトにアクセスした閲覧者数は極めて少ないが、この小人数の閲覧者だけは満足していると判断される。
【0379】
一方、同一カテゴリCにおいて、検索キーワードC2のニーズ値は極めて大きいが、検索キーワードC2の満足度は極めて小さいとする。この場合、検索キーワードC2を用いて分析対象のWebサイトにアクセスした閲覧者数は極めて多いが、この多人数の閲覧者は満足していないと判断される。
【0380】
このような場合に、単にカテゴリCの満足度を、このカテゴリCに属する検索キーワードC1、C2の満足度の平均とすると、閲覧者数の少なかった検索キーワードC1の満足度と閲覧者の多かった検索キーワードC2の満足度とが同レベルに扱われる。したがって、満足していない閲覧者が大多数であるにもかかわらず、カテゴリは中程度の満足度と判断される。
【0381】
しかしながら、カテゴリCの満足度は、閲覧者数の少なかった検索キーワードC1の満足度よりも閲覧者の数が多い検索キーワードC2の満足度から影響を受けるようにすべきである。
【0382】
そこで、カテゴリCに属する各検索キーワードC1、C2の満足度をニーズ値で重み付けし、合計を求める。
【0383】
そして、このカテゴリCと他のカテゴリとの間で、それぞれの閲覧者数に関係なく等しい基準で満足度を評価するために、カテゴリCについて、重み付けした満足度の合計を、そのカテゴリCの全ての閲覧者数すなわちそのカテゴリCに属する検索キーワードのニーズ値の合計で割る。
【0384】
図21は、カテゴリ形成機能52によるデータの変換結果の一例を示す図である。
【0385】
カテゴリ形成機能52は、検索キーワードとその検索キーワードの属するカテゴリとを関連付けたカテゴリデータ72と、期間毎の検索キーワードのニーズ値と満足度を示す関係データ77を受け付ける。
【0386】
そして、カテゴリ形成機能52は、期間毎に、カテゴリのニーズ値と満足度とを求めたカテゴライズデータ78を求める。この図21の例では、5種類の検索キーワードが2種類のカテゴリに集約されている。各カテゴリについては、個々の検索キーワードに対する分析と同様の分析を行うことができる。
【0387】
以下に、トレンド分析機能53について詳細に説明する。
【0388】
図22は、トレンド分析機能53の動作の一例を示すフローチャートである。
【0389】
ステップX1において、トレンド分析機能53の領域計算機能53aは、期間毎の全ての検索キーワード及びカテゴリについてそれぞれのニーズ値及び満足度と、ニーズ境界値74及び満足度境界値75とに基づいて、期間毎の全ての検索キーワード及びカテゴリの位置する領域を求め、検索キーワード及びカテゴリのニーズ値及び満足度、領域をトレンドデータ73に含める。
【0390】
ステップX2において、トレンド分析機能53の領域判断機能53bは、期間経過の前後で、検索キーワード及びカテゴリの位置する領域を比較し、検索キーワード及びカテゴリの領域が変化するか判断し、領域の変化する検索キーワード又はカテゴリを求め、結果をトレンドデータ73に含める。
【0391】
検索キーワード又はカテゴリの位置する領域が変化する場合、ステップX3において、トレンド分析機能53のメッセージ付加機能53cは、メッセージデータ76に基づいて、領域の変化する検索キーワード又はカテゴリに対して、期間経過前と後の領域に対応するメッセージを関連付け、トレンドデータ73に含める。
【0392】
図23は、ニーズ境界値74と満足度境界値75とによって決定される領域の名称の一例を示す図である。
【0393】
ニーズ値についてニーズ境界値74、満足度について満足度境界値75が設定されており、平面が4分割され、4つの領域に名称が付されている。
【0394】
この例では、ニーズ境界値74及び満足度境界値75をともに100としている。そして、ニーズ値と満足度の小さい領域を「失敗領域」、ニーズ値は小さいが満足度は大きい領域を「隠れ成功領域」、ニーズ値は大きいが満足度は小さい領域を「チャンスロス領域」、ニーズ値と満足度の大きい領域を「成功領域」としている。
【0395】
図24は、トレンド分析機能53によって作成されるトレンドデータ73の一例を示す図である。
【0396】
例えば、期間経過の切り換わり前と後で領域が変化した検索キーワード又はカテゴリには、移動先の領域に遷移したことを意味するメッセージが付される。この23のトレンドデータでは、領域変動のあった検索キーワード「食べ放題」「ランチ」にそれぞれメッセージ「成功領域へ遷移」「失敗領域へ遷移」というメッセージが付されている。
【0397】
このようなメッセージの付与は、期間経過後の領域とその領域に対応したメッセージとを関連付けたメッセージデータ76を用意し、トレンド分析機能53の領域判断機能53bによって期間経過前後で領域の変化した検索キーワード又はカテゴリを検出し、トレンド分析機能53のメッセージ付加機能53cによって、メッセージデータ76に基づいて、領域が変化した検索キーワード又はカテゴリに期間経過後に位置する領域に対応するメッセージを付することで可能である。
【0398】
図25は、領域が移動した場合に付与されるメッセージの他の例を示す図である。
【0399】
期間経過前後で境界を超えて変化する検索キーワード又はカテゴリに、どの境界をどの方向に超えたのか表すメッセージが付される。例えば、「隠れ成功領域」から「成功領域」に移動した検索キーワード又はカテゴリには、「ニーズ上昇」というメッセージを付する。他の場合も同様である。
【0400】
このようなメッセージの付与は、期間経過前の領域、期間経過後の領域、メッセージとを関連付けたメッセージデータ76を用意し、トレンド分析機能53の領域判断機能53bによって期間経過前後に領域の変化した検索キーワード又はカテゴリを検出し、トレンド分析機能53のメッセージ付加機能53cによって、メッセージデータ76に基づいて、領域の変化した検索キーワード又はカテゴリの期間経過前の領域と期間経過後に位置する領域に関連付けされたメッセージを求めることで可能である。
【0401】
以下に、出力処理機能54について詳細に説明する。
【0402】
出力処理機能54は、例えば図26に示すようなグラフを表示する。
【0403】
このグラフは、ニーズ値と満足度を表す座標軸を持ち、ニーズ境界値と満足度境界値とを表示し、各領域に領域名称を記述し、期間毎の検索キーワード又はカテゴリを示す指標をニーズ値と満足度に基づいてプロットし、プロットされた指標が線で結ばれて描かれている。なお、この図26では、期間経過毎の遷移状況を示す軌跡が矢印で表されている。
【0404】
その他にも、出力処理機能54は、例えば上記図18、19に示すようなニーズ値及び満足度に基づく期間毎の検索キーワード又はカテゴリのグラフ、上記図21に示すような期間毎のカテゴライズデータ78、上記図24に示すような検索キーワードの遷移状況とメッセージとを表すテーブル形式のトレンドデータ73を出力装置55に表示する。
【0405】
以上説明した本実施の形態においては、分析者は、分析対象のWebサイトについて集客戦略、コンテンツ改善の指針を得ることができる。
【0406】
例えば分析者は以下のような効果を得ることができる。
【0407】
第1に、分析者は、閲覧者数は多いが閲覧者がすぐに分析対象のWebサイトの閲覧を終了するような検索キーワード及びカテゴリを調査でき、検索キーワード及びカテゴリに基づいて検索された分析対象のWebサイトが閲覧者の要求を満たすか否か判断できる。また、分析者は、閲覧者の要求を満たすことができないという一種のチャンスロスの状態を検出し、調査できる。したがって、分析者は、分析対象のWebサイトにおけるチャンスロスを改善し、分析対象のWebサイトの質を向上させることができる。
【0408】
第2に、分析者は、分析対象のWebサイトをアクセスする閲覧者の数を増加させ、かつアクセスした閲覧者を満足させる良好な検索キーワード及びカテゴリが存在するか判断できる。さらに、分析者は、このような検索キーワード及びカテゴリの良好な状態が一時的又は減少傾向にあるか判断でき、新たな検索キーワード及びカテゴリを検討すべきか判断できる。
【0409】
第3に、分析者は、個別の検索キーワード単位のみではなく、各検索キーワードの属するカテゴリ単位で静的又は動的な分析を行うことができる。このため、分析者は、自己の検討したい内容、検討したい事項に合わせて分析結果を得ることができ、分析対象のWebサイトについての閲覧傾向を適切かつ容易に把握でき、分析の精度を向上させることができる。
【0410】
第4に、分析者は、検索キーワード及びカテゴリの分析結果の時間的推移をグラフにより得ることができ、閲覧の傾向の時間的変化を容易に把握でき、分析作業を効率化できる。
【0411】
第5に、分析者は、検索キーワード及びカテゴリのトレンド分析の結果を用いて、膨大なデータから有用なデータを迅速に得ることができ、分析の精度を向上させることができ、分析に必要な労力を削減できる。
【0412】
第6に、分析者は、従来のWebアクセスログによる単純な集計ではなく、閲覧者の流行を容易かつ高精度に調査することができる。
【0413】
第7に、分析者は、検索キーワードを個別に分析しても把握できないようなカテゴリ全体のトレンドを把握できる。
【0414】
第8に、分析者は、閲覧者の意思で様々な形式で入力されつ検索キーワードについて容易かつ適切に自らの意思にそった分析結果を得ることができる。以下に、この第8の効果について具体例を挙げて説明する。
【0415】
検索キーワードは、閲覧者の意思で様々な形式で入力されるため、Webアクセスログ分析により検索キーワードについて分析しても、分析者は自らの意思にそった分析結果を得ることが困難な場合がある。
【0416】
例えば、分析者は、料理関係の検索キーワード入力後に分析対象のWebサイトがどのようなアクセス状態か調べたいとする。この場合、従来のWebアクセスログ分析では、検索キーワード「料理」について閲覧者数を分析結果として求めることはできるが、料理と関係する他の検索キーワード「グルメ」「ファーストフード」などについての閲覧者数まで分析結果に含めることはできない。
【0417】
しかしながら、本実施の形態のようにカテゴリ単位で分析することによって、分析者は、自己の求める分析結果を適切に取得することができる。
【0418】
(第8の実施の形態)
本実施の形態においては、上記第7の実施の形態の変形例について説明する。本実施の形態に係る検索キーワード分析システムは、上記第7の実施の形態とトレンド分析機能が主に相違し、他の部分は同様であるとする。
【0419】
本実施の形態に係るトレンド分析機能は、ニーズ値境界値と満足度境界値とを用いることなく、ニーズ値と満足度を座標軸とする平面上における期間経過前後の検索キーワード及びカテゴリの移動距離と移動方向を求める。
【0420】
図27は、本実施の形態に係るトレンド分析機能の構成の一例を示すブロック図である。
【0421】
本実施の形態に係るトレンド分析機能79は、期間毎の検索キーワード及びカテゴリのニーズ値、満足度を座標値とし、期間経過前後における全ての検索キーワード及びカテゴリの移動距離を求め、移動距離の大きい検索キーワード及びカテゴリについて、その方向に応じたメッセージを付す。
【0422】
このトレンド分析機能79は、移動距離計算機能79a、移動距離判断機能79b、移動方向計算機能79c、メッセージ付加機能79dとを具備する。なお、トレンド分析機能79は、上記第7の実施の形態で説明したトレンド分析機能53と同じ機能も具備するとする。
【0423】
移動距離計算機能79aは、評価値算出機能39aによって求められた期間毎の検索キーワード、カテゴリ形成機能52によって求められた期間毎のカテゴリのニーズ値、満足度に基づいて、式(3)にしたがって、期間経過前後における全ての検索キーワード及びカテゴリの移動距離を求め、結果を移動距離判断機能79bに提供すると共にトレンドデータ81に含める。
【0424】
【数3】
【0425】
移動距離判断機能79bは、記録装置60に記録されている移動距離しきい値80を超えて期間毎の検索キーワード又はカテゴリが移動したか判断すると共に、結果をトレンドデータ81に含める。
【0426】
表24に、移動距離しきい値の具体例とトレンド分析機能79の動作の関係を示す。この表24の例では、移動距離しきい値が120と設定されており、移動距離が120以上の場合に、移動方向の計算及びメッセージ付与が行われることを示している。
【0427】
【表24】
【0428】
移動方向計算機能79cは、移動距離が移動距離しきい値を超えた検索キーワード又はカテゴリのニーズ値、満足度に基づいて、式(4)にしたがって、期間経過前後の移動方向を計算し、結果をメッセージ付加機能79dに提供すると共にトレンドデータ81に含める。
【0429】
【数4】
【0430】
メッセージ付加機能79dは、記録装置60に記録されているメッセージデータ82に基づいて、移動距離しきい値を超えた検索キーワード又はカテゴリに対して移動方向に応じたメッセージを付する。
【0431】
表25に、メッセージデータ82の一例を示す。移動方向を表す角度と、ニーズ及び満足の上昇、下降の意味するメッセージが対応付けされている。
【0432】
【表25】
【0433】
図28は、メッセージと移動方向の関係の具体例を示す。この図28において、移動方向0°以上〜30°未満の場合にはメッセージ「ニーズ上昇」と表示すると定義され、移動方向30°以上〜60°未満の場合にはメッセージ「ニーズ・満足度とも上昇」と表示すると定義され、移動方向60°以上〜90°未満の場合には「満足度上昇」と表示すると定義されている。
【0434】
なお、ニーズ値と満足度の双方が増加する移動方向0°以上〜90°未満の範囲のみではなく、ニーズ値と満足度の少なくとも一方が減少する90°以上〜360°未満範囲のメッセージも同様に定義できる。
【0435】
図29は、トレンド分析機能79によって作成されたトレンドデータ81の一例を示す図である。
【0436】
移動距離の大きい検索キーワード「食べ放題」「ランチ」に、移動方向に対応するメッセージが付されている。
【0437】
図30は、本実施の形態に係る検索キーワード分析システムの動作の一例を示すフローチャートである。
【0438】
ステップY1、Y2は、上記図15のステップV1、V2と同様であるため、説明を省略する。
【0439】
ステップY3において、トレンド分析機能79の移動距離計算機能79aは、期間経過前後における検索キーワード及びカテゴリの移動距離を求め、トレンドデータ81に含めるとともに移動距離判断機能79bに提供する。
【0440】
ステップY4において、トレンド分析機能79の移動距離判断機能79bは、記録装置60に記録されている移動距離しきい値80に基づいて、期間経過前後で検索キーワード及びカテゴリが移動距離しきい値80を超えるか判断し、結果をトレンドデータ81に含めるとともに移動方向計算機能79cに提供する。
【0441】
ステップY5において、トレンド分析機能79の移動方向計算機能79cは、移動距離が移動距離しきい値を超えたと判断された検索キーワード又はカテゴリの移動方向を計算し、結果をトレンドデータ81に含めるとともにメッセージ付加機能79dに提供する。
【0442】
ステップY6において、トレンド分析機能79のメッセージ付加機能79dは、記録装置60に記録されているメッセージデータ82に基づいて、移動方向の計算された検索キーワード又はカテゴリについてその移動方向に対応するメッセージを付加し、結果をトレンドデータ81に含める。
【0443】
ステップY7において、出力処理機能54は、分析者の操作に応じて、トレンドデータ81に基づいて、検索キーワード又はカテゴリのニーズ値及び満足度の遷移状況とメッセージとを表示する。
【0444】
図31は、本実施の形態に係る出力処理機能54によって出力されたトレンドデータ81の一例を示す図である。
【0445】
この図31では、3期間以上でトレンド分析を行った結果得られたトレンドデータ81が表示されている。出力処理機能54は、連続する2期間毎に、トレンド分析機能79によって作成されたトレンドデータ81を同一平面上に表示する。この図31では、上記第1の実施の形態で説明したトレンドデータ73と本実施の形態で説明したトレンドデータ81とが組み合わされている。
【0446】
すなわち、この図31に示すグラフは、ニーズ値と満足度を表す座標軸を持ち、ニーズ境界値と満足度境界値とを表示し、各領域に領域名称を記述し、複数の期間毎の検索キーワード「宴会」を示す指標をそれぞれのニーズ値と満足度に基づいてプロットし、プロットされた指標が線で結ばれて描かれている。なお、この図31では、期間経過毎の遷移状況を示す軌跡が矢印で表されている。そして、図31では、領域の境界を超えた場合、及び移動距離の大きい場合のいずれかが成立した変化に対してメッセージが表示されている。
【0447】
以上説明した本実施の形態では、期間経過毎に、分析対象のWebサイトをアクセスするために入力される検索キーワードを分析でき、その変化量を移動距離、変化内容を移動方向として分析者に提供することができる。
【0448】
なお、上記第7及び本実施の形態においては、分析対象のWebサイトをアクセスするために入力される検索キーワードについて分析を行う場合について説明している。しかしながら、分析対象のWebサイトをアクセスする前にアクセスしていた外部コンテンツの存在する参照元のWebサイト又はドメインについて分析を行う場合にも同様に適用できる。
【0449】
その他にも、分析対象のWebサイトがキャンペーンメールに基づいてアクセスされた場合にこのキャンペーンメールについて分析を行い、キャンペーンの種別を表すIDについて分析結果を求めてもよい。
【0450】
これにより、分析者は、検索キーワード、参照元のWebサイト、キャンペーンについてニーズの程度及び満足の程度を分析し、例えば空間上に表して結果を把握できる。
【0451】
また、上記第7及び本実施の形態の発明において、期間毎の関係データを求めるまでの処理は、上述した他の処理と変更可能である。すなわち、期間毎の関係データを求めるまでの処理として、上記各実施の形態で説明した各種手法を所定期間毎に実行することにより、同様の効果が得られる。
【0452】
また、上記第7及び本実施の形態の発明においては、カテゴリのニーズ値及び満足度を上記式(1)、式(2)で求めるとしているが、他の定義により他の手法でカテゴリのニーズ値及び満足度を求めるとしてもよい。
【0453】
また、本実施の実施の形態においては、検索キーワード及びカテゴリの移動距離及び移動方向を上記式(3)、式(4)で求めるとしているが、他の定義により他の手法で検索キーワード及びカテゴリの移動距離及び移動方向を求めるとしてもよい。
【0454】
また、上記第7及び本実施の形態においては、分析の対象はWebサイト単位でなくてもよく、Webページ単位、複数のWebページから構成される任意のWebページグループ単位であってもよい。
【0455】
また、本実施の形態においては、移動距離が移動距離しきい値を超えた検索キーワード又はカテゴリのみ移動方向を算出するとしているが、全ての検索キーワード又はカテゴリについて移動距離と移動方向を算出するとしてもよく、他の条件を満たす検索キーワード又はカテゴリについて移動距離と移動方向を算出するとしてもよい。
【0456】
また、上記第7及び本実施の形態発明においては、分析対象の閲覧される傾向の分析視点を、閲覧者が分析対象のWebサイトに期待する度合いを表すニーズ値と、分析対象のWebサイトが閲覧者に対して与える満足の度合いを表す満足度としている。しかしながら、閲覧の傾向の分析視点は、自由に変更できる。例えば、分析対象のWebサイトの目的が達成される機会の数と、目的が達成された数を表す達成度とを分析視点としてもよい。例えば、注文受付を目的とするWebサイトにおいて閲覧者の数を目標達成の機会数とし、注文を受け付けた数を達成度とし、この機会数と達成度を分析視点としてもよい。
【0457】
(第9の実施の形態)
本実施の形態においては、上記第1から第8までの実施の形態に係る検索キーワード分析システムの変形例について説明する。
【0458】
上記第1から第8までの実施の形態においては、抽出された一つのアクセスシーケンスに対して入力された検索キーワードが一つの場合について説明している。
【0459】
この上記第1から第8までの実施の形態のように、抽出されたあるアクセスシーケンスに対して一つの検索キーワードが入力されている場合のアクセスシーケンス、検索結果ページ2、顧客サイト61、顧客サイト61内のアクセスシーケンス、検索後閲覧時間の関係について、以下の図32から図34を用いて説明する。
【0460】
図32は、顧客サイト61内に検索システムが具備される場合のアクセスシーケンスの例を示す図である。このようなケースは、第1から第4の実施の形態及び第6から第8の実施の形態において処理できる。
【0461】
この例では、閲覧者はWebページPa1、Pa2、検索結果ページSpa、WebページPa3〜Pa5と順に閲覧を行い最後にWebページPa6を閲覧している。なお、WebページPa2、検索結果ページSpa、WebページPa3〜Pa5は、顧客サイト61に属するページである。また、WebページPa2は検索キーワードが入力可能な画面である。
【0462】
この際、顧客サイト61内のアクセスシーケンスは、Pa2→SPa→Pa3→Pa4→Pa5となる。また、検索後閲覧時間は、上記第1の実施の形態の定義により、満足度を求めるアクセスシーケンス(すなわち顧客サイト61内のアクセスシーケンス)について最後のアクセス時刻から最初のキーワード関連ページ(すなわち検索結果ページSPaの次のページ)へのアクセス時刻を引いて得られる時間間隔であるため、WebページPa3からWebページPa5までのアクセス時間の間隔となる。
【0463】
図33は、検索システムが顧客サイト61外に存在する場合のアクセスシーケンスの例を示す図である。このようなケースは、上記第5の実施の形態において処理できる。
【0464】
この例では、閲覧者は、WebページPb1、検索結果ページSPb、WebページPb2〜Pb6と順に閲覧を行い、最後にWebページPb7を閲覧している。なお、WebページPb2〜Pb6は、顧客サイト61に属するWebページである。また、サイト外検索システム341において、閲覧者によって検索キーワードを入力可能な画面Pb1に検索キーワードが入力されると、検索結果ページSPbが作成される。検索結果ページSPbには、顧客サイト61のWebページPb2へのリンクが含まれている。
【0465】
この際、顧客サイト61内のアクセスシーケンスはPb2→Pb3→Pb4→Pb5→Pb6となる。また、検索後閲覧時間は、上記第5の実施の形態の定義により、同一のアクセスシーケンス識別子で表されるアクセスの中で検索システムを利用したレファラ情報を持つアクセスから最後に閲覧されたアクセスまでの時刻の差分であるため、WebページPb2からWebページPb6までのアクセス時間の間隔となる。
【0466】
図34は、この図33と同様に、検索システムが顧客サイト61外にあり、さらに顧客サイト61内のアクセスシーケンスの途中に検索結果ページが存在する場合のアクセスシーケンスの例を示す図である。このようなケースは、上記第5の実施の形態において処理できる。
【0467】
この例では、閲覧者はWebページPc1〜Pc3、検索結果ページSPc、WebページPc4〜Pc6と順にアクセスを行い、最後にWebページPc7を閲覧している。なお、WebページPc2〜Pc6は、顧客サイト61に属するWebページである。また、WebページPc3は、検索キーワードを入力可能な画面であり、その入力の結果に応じてサイト外検索システム341は、検索結果ページSPcを出力する。
【0468】
この際、顧客サイト61内のアクセスシーケンスはPc2→Pc3→Pc4→Pc5→Pc6となる。また、検索後閲覧時間は、上記第5の実施の形態の定義により、同一のアクセスシーケンス識別子で表されるアクセスの中で検索システムを利用したレファラ情報を持つアクセスから最後に閲覧されたアクセスまでの時刻の差分であるため、WebページPc4からWebページPc6までのアクセス時間の間隔となる。
【0469】
上記第1から第3、第5から第8の実施の形態では、上記図32から図34までに示すように、抽出されたアクセスシーケンスにおいて検索キーワードの入力が一回であり、検索結果ページから後のWebページの閲覧時間である検索後閲覧時間が満足度として処理が行われる。
【0470】
上記第4の実施の形態では、抽出されたアクセスシーケンスにおいて検索キーワードの入力が一回であり、この検索キーワードについての検索結果に対する成功度が求められる。
【0471】
本実施の形態においては、このような上記第1から第8の実施の形態をさらに発展させ、抽出されたあるアクセスシーケンスにおいて、検索キーワードが複数回入力されている場合について説明する。
【0472】
本実施の形態においては、顧客サイト内のアクセスシーケンスをさらに1つ以上のアクセスシーケンス(以下、「サブアクセスシーケンス」という)に細分化したものについて説明する。なお、状況によっては顧客サイト内のアクセスシーケンスにおいて、サブアクセスシーケンスが存在しない場合もある。
【0473】
そして、上記各実施の形態と同様の処理方法をサブアクセスシーケンスに対して適用する。
【0474】
サブアクセスシーケンスは、検索結果ページへのアクセスに基づいて定められる始端を抽出し、この抽出された始端と同一のアクセス要求側による連続的なアクセスのうち、始端以降のアクセスである終端によって定められる。顧客サイト内のアクセスシーケンスからサブアクセスシーケンスを抽出するサブアクセスシーケンス抽出規則の一例を以下に説明する。
【0475】
サブアクセスシーケンスの始端は、検索システムが顧客サイト内にある場合、第1規則を用いて抽出し、顧客サイト外にある場合、第2規則を用いて抽出する。
【0476】
第1規則として、抽出されたアクセスシーケンスにおいて顧客サイト内の検索システムが検索結果ページを出力している場合、サブアクセスシーケンスの始端は、この顧客サイト内の検索システムによって出力された検索結果ページへのアクセスとする。
【0477】
第2規則として、抽出されたアクセスシーケンスにおいて顧客サイト外の検索システムが検索結果ページを出力し、しかも検索結果ページへアクセスの一つ後のアクセスが顧客サイト内のWebページへのアクセスである場合、サブアクセスシーケンスの始端は、顧客サイト外の検索システムが出力した検索結果ページをレファラ情報として持つ顧客サイト内のWebページへのアクセスとする。
【0478】
すなわち、顧客サイト外の検索システムによって検索が行われている場合、サブアクセスシーケンスの始端は、顧客サイト外の検索システムによる検索結果ページ上で選択された顧客サイト内のWebページへのアクセスとする。
【0479】
なお、「あるWebページAへのアクセスの一つ後のアクセス」とは、同一のアクセス要求側による連続的なアクセスのうち、あるWebページAへのアクセス以降に行われたアクセスで、しかもあるWebページAへのアクセスに時間的に最も近いアクセスを指し、例えば上記図33において、あるWebページを検索結果ページSPbとすると、WebページPb2へのアクセスが該当する。
【0480】
サブアクセスシーケンスの終端は、第3規則を用いて抽出する。
【0481】
第3規則として、サブアクセスシーケンスの終端は、サブアクセスシーケンスの始端からみて次のサブアクセスシーケンスの始端の一つ前の顧客サイト内のアクセスとする。ただし、サブアクセスシーケンスの始端からみて次のサブアクセスシーケンスの始端が存在しない場合は、顧客サイト内のアクセスシーケンスの終端を、そのサブアクセスシーケンスの終端とする。
【0482】
なお、「あるWebページAへのアクセスの一つ前のアクセス」とは、同一のアクセス要求側による連続的なアクセスのうち、あるWebページAへのアクセス以前に行われたアクセスで、しかもあるWebページAへのアクセスに時間的に最も近いものを指す。また「あるWebページAへのアクセスの一つ前の顧客サイト内のアクセス」とは、同一のアクセス要求側による連続的なアクセスのうち、あるWebページAへのアクセス以前に行われたアクセスで、しかもあるWebページAへのアクセスに時間的に最も近い顧客サイト内のアクセスを指し、例えば上記図34において、あるWebページAをWebページPc4とするとWebページPc3が該当する。
【0483】
また、顧客サイト内の検索システムが出力した検索結果ページへのアクセスが、顧客サイト外の検索システムが出力した検索結果ページをレファラ情報に持つWebページへのアクセスにも該当する場合に第4規則を用いる。
【0484】
第4規則として、顧客サイト内の検索システムが出力した検索結果ページへのアクセスが、顧客サイト外の検索システムが出力した検索結果ページをレファラ情報に持つWebページへのアクセスにも該当する場合、顧客サイト内の検索システムが出力した検索結果ページへのアクセスをサブアクセスシーケンスの始端とする。
【0485】
あるアクセスシーケンスに対して複数の検索キーワードが入力されている場合のアクセスシーケンス、検索結果ページ、顧客サイト、顧客サイト内のアクセスシーケンス、サブアクセスシーケンスの関係について、以下の図35から図37を用いて説明する。
【0486】
図35は、顧客サイト61内に検索システムが具備されている場合のアクセスシーケンスにおいて複数の検索が行われた例を示す図である。この図35はサイト内検索システムにおいて検索が1回だけ行われた上記図32に対応付けられるものである。
【0487】
この例では、閲覧者はWebページPd1、Pd2、検索結果ページSPd、WebページPd3〜Pd5、検索結果ページSPe、SPf、WebページPd6、Pd7と順に閲覧を行い、最後にWebページPd8を閲覧している。なお、WebページPd2〜Pd7及び検索結果ページSPd〜SPfは、顧客サイト61に属するページである。また、WebページPd2、Pd5、及び各検索結果ページSPd〜SPfは検索キーワードを入力可能な画面である。
【0488】
この際、上記サブアクセスシーケンス抽出規則により、検索結果ページSPdへのアクセスから次の検索結果ページSPeへのアクセスの一つ手前の顧客サイト内のページへのアクセス(すなわちWebページPd5へのアクセス)までのSpd→Pd3→Pd4→Pd5がサブアクセスシーケンス100となる。
【0489】
同様に、検索結果ページSPeへのアクセスから次の検索結果ページSPfの一つ手前の顧客サイト61内のページへのアクセスまで(すなわち検索結果ページSPeへのアクセス)がサブアクセスシーケンス101となる。
【0490】
同様に、検索結果ページSPfへのアクセスから顧客サイト61内のアクセスシーケンスの終端のアクセス(すなわちWebページPd7へのアクセス)までのSPf→Pd6→Pd7がサブアクセスシーケンス102となる。
【0491】
なお、この例のように検索結果ページにおいて検索キーワードが入力可能な場合や、キーワード関連ページが検索結果ページである場合がある。このような場合、上記図45で示した画面遷移とは多少異なることとなる。
【0492】
図36は、検索システムが顧客サイト外に存在する場合のアクセスシーケンスにおいて複数の検索が行われた状態例を示す図である。この図36は、顧客サイト61外の検索システム341において検索が1回だけ行われた上記図34に対応付けられるものである。
【0493】
この例では、閲覧者はWebページPe1〜Pe4、検索結果ページSPg、WebページPe5〜Pe7、検索結果ページSPh、WebページPe8〜Pe10と順にアクセスを行い、最後にWebページPe11を閲覧している。なお、WebページPe2〜Pe10は、顧客サイト61に属するWebページである。またWebページPe4、Pe7は、検索キーワード可能な画面であり、その入力の結果に応じてサイト外検索システム341は、検索結果ページSPg、SPhを出力する。
【0494】
この際、上記サブアクセスシーケンス抽出規則により、検索結果ページSPgをレファラとして持つページへのアクセス(すなわちWebページPe5へのアクセス)から次の検索結果ページSPhをレファラとして持つページへのアクセス(すなわちWebページPe8へのアクセス)の一つ手前の顧客サイト61内のページへのアクセス(すなわちWebページPe7へのアクセス)までのPe5→Pe6→Pe7が第1のサブアクセスシーケンスとなる。
【0495】
同様に、検索結果ページSPhをレファラとして持つページへのアクセス(すなわちWebページPe8へのアクセス)から顧客サイト61内のアクセスシーケンスの終端のアクセス(すなわちWebページPe10へのアクセス)までのPe8→Pe9→Pe10が第2のサブアクセスシーケンスとなる。
【0496】
図37は、顧客サイト内の検索システムと顧客サイト外の検索システムの双方を用いてアクセスシーケンスの途中で検索が行われた例を示す図である。この図37は、上記図32〜34を組み合わせたものに対応付けられるものである。
【0497】
この例では、閲覧者はWebページPf1、検索結果ページSPi、WebページPf2、検索結果ページSPj、WebページPf3〜Pf5、検索結果ページSPk、検索結果ページSPl、WebページPf6、検索結果ページSPm、SPn、WebページPf7、Pf8と順に閲覧を行い、最後にWebページPf9を閲覧している。なお、WebページPf2〜Pf8及び検索結果ページSPj、SPl〜SPnは、顧客サイト61に属するページである。また、WebページPf1、Pf2、Pf5、Pf6及び各検索結果ページSPi〜SPnは、検索キーワードを入力可能な画面である。WebページPf1での検索キーワードの入力の結果に応じてサイト外検索システム341は検索結果ページSPiを出力し、WebページPf5での入力に応じてサイト外検索システム342は検索結果ページSPkを出力する。
【0498】
この際、上記サブアクセスシーケンス抽出規則により、検索結果ページSPiをレファラとして持つページへのアクセス(すなわちWebページPf2へのアクセス)から検索結果ページSPjへのアクセスの一つ手前の顧客サイト61内のページへのアクセスまで(すなわちWebページPf2のアクセス)がサブアクセスシーケンス103となる。
【0499】
同様に、検索結果ページSPjへのアクセスから検索結果ページSPkへのアクセスの一つ手前の顧客サイト61内のページへのアクセス(すなわちWebページPf5へのアクセス)までのSPj→Pf3→Pf4→Pf5がサブアクセスシーケンス104となる。このとき、顧客サイト61内の検索システムによる検索結果ページSPlへのアクセスが顧客サイト61外の検索システム342による検索結果ページSPkをレファラとして持つページへのアクセスにも該当しているため、上記サブアクセスシーケンス抽出規則により、顧客サイト61内の検索システムによる検索結果ページSPlへのアクセスをサブアクセスシーケンス105の始端としている。
【0500】
また同様に、検索結果ページSPlへのアクセスから検索結果ページSPmへのアクセスの一つ手前の顧客サイト61内のページへのアクセス(すなわちWebページPf6へのアクセス)までのSPl→Pf6がサブアクセスシーケンス105となる。
【0501】
以下同様に、検索結果ページSPmがサブアクセスシーケンス106、そしてSPn→Pf7→Pf8がサブアクセスシーケンス107となる。
【0502】
上記のようなサブアクセスシーケンス抽出規則に基づいて、顧客サイト61内のアクセスシーケンスから抽出されたサブアクセスシーケンスと検索後閲覧時間との関係について以下に説明する。
【0503】
顧客サイト61内のアクセスシーケンスにおける検索後閲覧時間は、検索システムが顧客サイト61内にある場合は「満足度を求めるアクセスシーケンス(すなわち顧客サイト61内のアクセスシーケンス)について最後のアクセス時刻から最初のキーワード関連ページ(すなわち検索結果ページの次のページ)へのアクセス時刻を引いて得られる時間間隔」であり、検索システムが顧客サイト61外にある場合は「検索システムを利用したレファラ情報を持つアクセスから最後に閲覧されたアクセスまでの時刻の差分」であった。これをサブアクセスシーケンスに当てはめてみると以下のようになる。
【0504】
図38は、顧客サイト61内の検索システムが検索結果ページを出力している場合において、検索結果ページへのアクセスが始端のサブアクセスシーケンスと検索後閲覧時間との関係の一例を示す図である。このサブアクセスシーケンスにおいて閲覧者は、検索結果ページSPo、WebページPg1〜Pg3の順に閲覧している。このようなケースは、上記第1から第4の実施の形態及び第6から第8の実施の形態において処理できる。
【0505】
このような場合、検索結果ページSPoへのアクセスの次のアクセスであるWebページPg1へのアクセスからサブアクセスシーケンスの最後のアクセスであるWebページPg3へのアクセスまでの時間間隔を検索後閲覧時間とする。ただし、サブアクセスシーケンスが検索結果ページSPoからのみ構成されている場合、検索後閲覧時間は0とする。
【0506】
図39は、顧客サイト61外の検索システムが検索結果ページを出力する場合において、顧客サイト61外の検索システムによる検索結果ページをレファラに持つページへのアクセスが始端のサブアクセスシーケンスと検索後閲覧時間との関係の一例を示す図である。このサブアクセスシーケンスにおいて閲覧者は、WebページPh1〜Ph4の順に閲覧している。このようなケースは、上記第5の実施の形態において処理できる。
【0507】
このような場合、検索結果ページの次のアクセス(すなわち検索結果ページをレファラに持つページへのアクセス)であるWebページPh1へのアクセスからサブアクセスシーケンスの最後のアクセスであるWebページPh4へのアクセスまでの時間間隔を検索後閲覧時間とする。
【0508】
サブアクセスシーケンスの始端が顧客サイト61外の検索システムが出力した検索結果ページをレファラ情報に持つWebページへのアクセスである場合、サブアクセスシーケンスの始端のアクセスからサブアクセスシーケンスの終端までの閲覧時間を、検索後閲覧時間とする。ただし、サブアクセスシーケンスの始端とサブアクセスシーケンスの終端が同一の場合、検索後閲覧時間はサブアクセスシーケンスの始端のアクセス時間とする。
【0509】
本実施の形態において、顧客サイト61内の検索システムを用いて抽出されたサブアクセスシーケンスには、検索結果ページが含まれるが、顧客サイト61外の検索システムを用いて抽出されたサブアクセスシーケンスには、検索結果ページが含まれない。しかしながら、上記図38及び図39で示す関係に基づいて検索後閲覧時間を計算することにより、検索システムが顧客サイト61内であっても顧客サイト61外であっても、顧客サイト61内でのアクセスの状態についての質的評価値を公平に算出することができる。
【0510】
以下、本実施の形態の概念を、上記第1の実施の形態に適用した場合について説明する。しかしながら、本発明の概念は、上記第2から第8までのいずれの実施の形態に対しても同様に適用可能である。
【0511】
図40は、本実施の形態に係る検索キーワード分析システムの構成の一例を示すブロック図である。
【0512】
本実施の形態に係る検索キーワード分析システム83は、記録媒体84に記録されている検索キーワード分析プログラム85を読み出して実行する。
【0513】
検索キーワード分析プログラム85は、システム83に読み込まれ、実行されると、ログ前処理機能12、サブアクセスシーケンス抽出機能86、キーワード抽出機能87、評価値算出機能88を実現する。
【0514】
また、評価値算出機能88は、満足度算出機能89と満足度・キーワード関連付け機能16を含む。
【0515】
上記各機能12,86〜88によって作成されたデータは、記録装置38に記録される。各機能12,86〜88は記録装置38に記録されたデータを読み込み可能である。すなわち、各機能12,86〜88間での各種データの受け渡しは、記録装置38を経由して行われてもよい。この場合、データの提供側は、提供するデータを記録装置38に記録し、データの受付側は、記録装置38からデータを読み出す。
【0516】
図41は、サブアクセスシーケンス抽出機能86の具体例を示すブロック図である。
【0517】
サブアクセスシーケンス抽出機能86は、アクセスシーケンス抽出機能90とサブアクセスシーケンス判定機能91を含む。
【0518】
アクセスシーケンス抽出機能90は、アクセスシーケンス抽出機能13と同等の機能を含むが、出力結果であるアクセスシーケンスデータにサブアクセスシーケンスを判定するために必要な情報を付加する特徴がある。
【0519】
アクセスシーケンス抽出機能90は、所定のアクセスシーケンス抽出規則にしたがって一連のページアクセスからアクセスシーケンスを取り出し、アクセスシーケンスの抽出結果を示すアクセスシーケンスデータを作成する。
【0520】
この際、例えばアクセスシーケンス抽出規則として上記第1の実施の形態で述べた規則を利用できる。
【0521】
表26に、アクセスシーケンス抽出機能90によって作成されたアクセスシーケンスデータの一例を示す。
【0522】
【表26】
【0523】
この表26に示すように、上記表3のアクセスシーケンスデータにレファラ情報を付加したデータが、本実施の形態に係るアクセスシーケンス抽出機能90によって作成されたアクセスシーケンスデータとなる。なお、この表26において、レファラ情報が存在しない場合は「−」で表している。
【0524】
サブアクセスシーケンス判定機能91は、抽出されたアクセスシーケンスからサブアクセスシーケンスを切り出す機能である。このサブアクセスシーケンス判定機能91は、上記表26に示すアクセスシーケンスデータに基づいてサブアクセスシーケンスを抽出する。
【0525】
図42は、サブアクセスシーケンス判定機能91の具体例を示すブロック図である。
【0526】
サブアクセスシーケンス判定機能91は、始端を判定するサブアクセスシーケンス始端判定機能92と、終端を判定するサブアクセスシーケンス終端判定機能93とを含む。
【0527】
サブアクセスシーケンス始端判定機能92は、上述したサブアクセスシーケンス抽出規則と上記表26に示すアクセスシーケンスデータとに基づき、サブアクセスシーケンスの始端を判定する。
【0528】
サブアクセスシーケンス始端判定機能92は、あるアクセスが顧客サイト61内の検索システムが出力した検索結果ページ2へのアクセスであることを判定するために、例えば上記表5のような顧客サイト61内の検索システムを特定するための情報94を用い、始端を求める。
【0529】
また、サブアクセスシーケンス始端判定機能92は、あるアクセスが顧客サイト61外の検索システムが出力した検索結果ページをレファラ情報に持つWebページへのアクセスであることを判定するために、例えば上記表19のような顧客サイト61外の検索システムを特定するための情報95を用い、始端を求める。
【0530】
次に、サブアクセスシーケンス終端判定機能93は、上述したサブアクセスシーケンス抽出規則、サブアクセスシーケンス始端判定機能92によって判定された始端データ、上記表26に示すアクセスシーケンスデータに基づいて、サブアクセスシーケンスの終端を判定する。
【0531】
そして、サブアクセスシーケンス終端判定機能93は、判定された始端と終端とに基づくサブアクセスシーケンスの抽出結果を示すサブアクセスシーケンスデータを満足度算出機能88に提供する。
【0532】
具体的には以下のような動作をする。まず、サブアクセスシーケンス始端判定機能92は上記表26のアクセスシーケンスデータを同一のVisitIDを持つものごとにまとめ、日付・時刻の古い順に並び替える。表27に処理の結果生成された一時的な第1の表を示す。
【0533】
【表27】
【0534】
この例において、顧客サイト61のURLは、「http://www.○○○.co.jp/」から始まるとする。なお、この表27におけるアクセスシーケンスVisit1の画面遷移の状況を図32〜37と同様の形式で表現したものを図43に示す。アクセスシーケンスVisit1では、顧客サイト61外の検索システムが出力した検索結果ページ「http://www.□□□.ne.jp/search.cgi?kw=vegitable」→顧客サイト61内のWebページ「AAA..html」→「CCC.html」→「EEE.html」→顧客サイト61内の検索システムが出力した検索結果ページ「search.cgi?q=food」→顧客サイト61内のWebページ「FFF.html」→「GGG.html」という順にアクセスが行われている。そして、上記サブアクセスシーケンス抽出規則により、「AAA..html」→「CCC.html」→「EEE.html」が第1のサブアクセスシーケンス108、「search.cgi?q=food」→「FFF.html」→「GGG.html」が第2のサブアクセスシーケンス109となる。以下具体的に、これらのサブアクセスシーケンスをどのように抽出するかについて説明を行う。
【0535】
上記並び替えが行われた後、上記サブアクセスシーケンス抽出規則をもとに、上記表27から始端となるアクセスを判定する。始端とされたものには始端フラグをつける。表28に処理の結果生成された一時的な第2の表を示す。
【0536】
【表28】
【0537】
始端フラグは「1」がサブアクセスシーケンスの始端を「0」がそれ以外を示す。この際、顧客サイト内検索システム特定情報94と、顧客サイト外検索システム特定情報95を用いる。顧客サイト内検索システム特定情報94の例として上記表5を、顧客サイト外検索システム特定情報95の例として表29を示す。
【0538】
【表29】
【0539】
例えば上記表28においてView1は、レファラに表29で示した「検索システムのURL」「クエリーパターン」に合致する「http://www.□□□.ne.jp/search.cgi?kw=vegitable」を持っている。このため、「顧客サイト61外の検索システムが出力した検索結果ページをレファラ情報として持つ顧客サイト61内のWebページへのアクセス」すなわちサブアクセスシーケンスの始端となり、表28の始端フラグに「1」が記録される。また、表28においてView6は、リクエストに上記表5で示した「検索システムの場所」「クエリーパターン」に合致する「/search.cgi?q=banana」を持っている。このため、「顧客サイト61内の検索システムによって出力された検索結果ページへのアクセス」すなわちサブアクセスシーケンスの始端となり、表28の始端フラグに「1」が記録される。
【0540】
次に、上記サブアクセスシーケンス抽出規則をもとに、サブアクセスシーケンス終端判定機能93は、表28から終端となるアクセスを判定する。終端とされたものには終端フラグをつける。表30に処理の結果生成された一時的な第3の表を示す。
【0541】
【表30】
【0542】
始端・終端フラグは「2」がサブアクセスシーケンスの終端を、「1」がサブアクセスシーケンスの始端を「0」がそれ以外を示す。なお、サブアクセスシーケンスの始端と終端が重なっている場合には「3」とする。例えば上記表28において、View5は「サブアクセスシーケンスの始端からみて次のサブアクセスシーケンスの始端の一つ前の顧客サイト内のアクセス」である。このため、サブアクセスシーケンスの終端となり、表30の始端・終端フラグに「2」が記録される。また表28において、View13は「サブアクセスシーケンスの始端からみて次のサブアクセスシーケンスの始端が存在せず、かつ顧客サイト61内のアクセスシーケンスの終端のアクセス」である。このため、サブアクセスシーケンスの終端となり、表30の始端・終端フラグに「2」が記録される。
【0543】
そして、この始端と終端からサブアクセスシーケンスを抽出する。始端・終端フラグが「1」からはじまり「2」で終わる区間、もしくは「3」のものに、重複のないアクセス識別子(SubVisitID)(以下、サブアクセスシーケンス識別子という)を付与する。ただし、同一の区間内には同一のアクセス識別子を付与する。また、「2」からはじまり「1」で終わる区間、すなわち「SubVisitID」に値が存在しない場合は「−」で表される。そして、ViewIDで再び並び替える。
【0544】
表31に、抽出されたサブアクセスシーケンスデータの例を示す。
【0545】
【表31】
【0546】
ここで改めて、上記図43を見てみる。図43におけるサブアクセスシーケンス108が上記表31のSubVisit1に、サブアクセスシーケンス109が上記表31のSubVisit2に対応している。表31において、SubVisit1は「AAA.html」→「CCC.html」→「EEE.html」、SubVisit2は「search.cgi?q=food」→「FFF.html」→「GGG.html」となっており、図43のサブアクセスシーケンス108、サブアクセスシーケンス109の画面遷移と合致している。これより、サブアクセスシーケンス判定機能91が、サブアクセスシーケンス抽出規則どおりに機能していることがわかる。
【0547】
上記表31に示すように、サブアクセスシーケンスデータには、サイト外検索システムフラグが設定される。
【0548】
サイト外検索システムフラグは、顧客サイト61外の検索システムによる検索結果ページに基づいて定まるサブアクセスシーケンスであれば「1」、顧客サイト61内の検索システムによる検索結果ページに基づいて定まるサブアクセスシーケンスであれば「0」、それ以外のものに関しては「−」となる。このサイト外検索システムフラグは、上記図38及び図39の説明で述べたように、検索システムが顧客サイト61の内外のいずれにあるかで検索後閲覧時間の算出方法を切り替えるために用いられる。
【0549】
キーワード抽出機能87は、エンコードされた検索キーワードについて判読可能な文字列へのデコードを行い、キーワードデータを生成する。
【0550】
本実施の形態に係るキーワード抽出機能87は、以下の第1及び第2の特徴を持つが、他の点については上記図1で説明したキーワード抽出機能14と同様である。
【0551】
第1に、キーワード抽出機能87は、顧客サイト61外の検索システムについても検索キーワードを抽出する。顧客サイト61外の検索システムに入力された検索キーワードの抽出は、上記第5の実施の形態で説明したキーワード抽出機能と同様の手法で行うことができる。
【0552】
第2に、キーワード抽出機能87は、顧客サイト61内の検索システムが出力した検索結果ページ2へのアクセスが、顧客サイト61外の検索システムが出力した検索結果ページ2をレファラ情報に持つWebページへのアクセスにも該当する場合に、顧客サイト61内の検索システムが出力した検索結果ページ2へのアクセスに対する検索キーワードを抽出する。
【0553】
キーワード抽出機能87によるキーワードデータの出力形式は、上記表7と同様となる。
【0554】
満足度算出機能89は、サブアクセスシーケンス抽出機能86によって生成されたサブアクセスシーケンスデータに基づいて、検索後閲覧時間を計算し、閲覧者の満足度を算出する。
【0555】
満足度算出機能89は、以下の第1及び第2の特徴を持つが、他の点については上記図1で説明した満足度算出機能15と同様である。
【0556】
第1に、満足度算出機能89は、質的評価規則における検索後閲覧時間を、アクセスシーケンスごとではなく、サブアクセスシーケンスごとに求め、満足度を算出する。
【0557】
第2に、満足度算出機能89は、上記図38及び図39の説明で述べたように、検索システムが顧客サイト61の内外のいずれにあるかで検索後閲覧時間の算出方法を切り替え、検索後閲覧時間を求める。サブアクセスシーケンスが、顧客サイト61内外のいずれの検索システムによるかの判断は、上記表27のサイト外検索システムフラグに基づいて判断する。
【0558】
表32に、抽出された満足度算出データの例を示す。
【0559】
【表32】
【0560】
表32には、各アクセス識別子と、そのアクセスの属するサブアクセスシーケンスを示すサブアクセスシーケンス識別子と、そのサブアクセスシーケンス識別子に対応する満足度とを関係付けたレコードが含まれている。項目「SubVisitID」においてサブアクセスシーケンス識別子が存在しない部分には、満足度も存在しないため「−」が表記される。
【0561】
満足度・キーワード関連付け機能16は、キーワード抽出機能87によって生成されたキーワードデータと、表28に示す満足度算出データとに基づいて、検索キーワードとその検索キーワードに対応するサブアクセスシーケンスの満足度との関係付けを行い、上記表11のような形式の関係データを算出する。
【0562】
図44は、本実施の形態に係る検索キーワード分析システム83の動作の一例を示すフローチャートである。
【0563】
ステップZ1において、ログ前処理機能12は、Webアクセスログ7に含まれる情報から必要な情報を入力し、前処理データを作成する。
【0564】
ステップZ2において、サブアクセスシーケンス抽出機能86は、前処理データとアクセスシーケンス抽出規則とに基づいて、アクセスシーケンスを抽出し、アクセスシーケンスデータを作成する。
【0565】
ステップZ3において、サブアクセスシーケンス抽出機能86は、アクセスシーケンスデータとサブアクセスシーケンス抽出規則とに基づいて、サブアクセスシーケンスを抽出し、サブアクセスシーケンスデータを作成する。
【0566】
ステップZ4において、満足度算出機能15は、サブアクセスシーケンスデータと満足度算出規則とに基づいて、サブアクセスシーケンス毎の満足度を算出し、満足度算出データを作成する。
【0567】
ステップZ5において、キーワード抽出機能14は、前処理データに基づいて、顧客サイト6内の検索システム及び顧客サイト6外の検索システムに入力された検索キーワードを抽出し、キーワードデータを作成する。
【0568】
ステップZ6において、満足度・キーワード関連付け機能16は、満足度算出データと、キーワードデータに基づいて、検索キーワードごとの満足度を算出し、関係データを作成する。
【0569】
なお、ステップZ5は、ステップZ2〜Z4の前に実行されてもよく、後に実行されてもよく、並列に実行されてもよい。
【0570】
以上説明した本実施の形態においては、一連のアクセスシーケンスにおいて複数の検索キーワードが入力された場合(複数の検索行為がなされた場合)であっても、複数の検索キーワード毎に質的評価値が求められ、さらに複数の検索キーワード毎に質的評価値と量的評価値を算出できる。
【0571】
一般に、サイト閲覧者による検索システムの利用機会は多く、同じサイト閲覧者による一連のアクセスにおいても複数回検索キーワードが入力されることが多い。本実施の形態では、このような場合であっても、検索キーワード毎に質的評価値を求めることができ、検索キーワード及びその検索キーワードに基づく検索を実行した検索システムについて十分な精度で分析を行うことができる。
【0572】
なお、本実施の形態においては、質的評価値を示す指標が満足度の場合について説明しているが、質的評価値として成功度などの別の指標を用いてもよい。
【0573】
また、検索後閲覧時間には、本実施の形態で定義した方式以外の方式を適用できる。例えば検索後閲覧時間を、Webページのコンテンツの内容と関連付けて決定するとしてもよい。
【0574】
また、本実施の形態においては、サブアクセスシーケンス抽出機能86において、アクセスシーケンスの抽出後サブアクセスシーケンスを抽出したが、アクセスシーケンスを抽出することなく直接的にサブアクセスシーケンスを抽出してもよい。
【0575】
上記各実施の形態に係る検索キーワード分析システムの各構成要素は、同様の作用を実現可能であれば配置を変更させてもよく、また各構成要素を自由に組み合わせてもよい。
【0576】
また、上記各実施の形態において、検索キーワード分析システムは複数の計算機により構成され、検索キーワード分析プログラムは複数の計算機に分散して配置され、互いに連携を取りつつ処理を実行するとしてもよい。
【0577】
上記各実施の形態に係る検索キーワード分析プログラムは、例えば磁気ディスク(フレキシブルディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリなどの記録媒体に書き込んでコンピュータに適用可能である。また検索キーワード分析プログラムは、通信媒体により伝送してコンピュータに適用することも可能である。コンピュータは、記録媒体に記録された検索キーワード分析プログラムを読み込み、検索キーワード分析プログラムによって動作が制御されることにより、上記の機能を実現する。
【0578】
【発明の効果】
以上詳記したように本発明においては、閲覧者の検索結果に対する質的評価値を迅速かつ高精度に求めることができ、この質的評価値に基づいてWebページ又はWebサイトのデザインやコンテンツ、検索システムを改善することができる。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態に係る検索キーワード分析システムの構成の一例を示すブロック図。
【図2】 同実施の形態に係る顧客サイトの構成の一例を示すブロック図。
【図3】 同実施の形態に係る検索キーワード分析システムの動作の一例を示すフローチャート。
【図4】 同実施の形態に係るキーワード抽出機能の動作の一例を示すフローチャート。
【図5】 同実施の形態に係る満足度算出機能の動作の一例を示すフローチャート。
【図6】 本発明の第2の実施の形態に係る検索キーワード分析システムの構成の一例を示すブロック図。
【図7】 本発明の第3の実施の形態に係る検索キーワード分析システムの構成の一例を示すブロック図。
【図8】 同実施の形態において表示されるグラフの一例を示す図。
【図9】 本発明の第4の実施の形態に係る検索キーワード分析システムの構成の一例を示すブロック図。
【図10】 本発明の第5の実施の形態に係る顧客サイトの構成の一例を示す図。
【図11】 サイト外検索システムから顧客サイトへの閲覧遷移の一例を示すブロック図。
【図12】 顧客サイト内の検索キーワード入力画面からサイト外検索システムの検索結果ページへ移り、上記検索結果ページから顧客サイト内のキーワード関連ページに遷移する一例を示すブロック図。
【図13】 本発明の第6の実施の形態に係る顧客サイトの構成の一例を示す図。
【図14】 本発明の第7の実施の形態に係る検索キーワード分析システムの構成の一例を示すブロック図。
【図15】 同実施の形態に係る検索キーワード分析システムの動作の一例を示すフローチャート。
【図16】 分析対象のWebサイトをアクセスするために入力された検索キーワードのニーズ値と満足度を計算した結果の一例を示す図。
【図17】 検索キーワード単位のニーズ値と満足度とカテゴリ単位のニーズ値と満足度の関係の一例を示す図。
【図18】 検索キーワードの遷移状況にメッセージを付した状態の一例を示す図。
【図19】 カテゴリの遷移状況にメッセージを付した状態の一例を示す図。
【図20】 カテゴリ形成機能の動作の一例を示すフローチャート。
【図21】 カテゴリ形成機能によるデータの変換結果の一例を示す図
【図22】 同実施の形態に係るトレンド分析機能の動作の一例を示すフローチャート。
【図23】 ニーズ境界値と満足度境界値とによって決定される領域の名称の一例を示す図。
【図24】 同実施の形態に係るトレンド分析機能によって作成されるトレンドデータの一例を示す図
【図25】 同実施の形態において領域が移動した場合に付与されるメッセージの他の例を示す図。
【図26】 同実施の形態に係る出力処理機能によって表示されるグラフの一例を示す図。
【図27】 本発明の第8の実施の形態に係るトレンド分析機能の構成の一例を示すブロック図。
【図28】 メッセージと移動方向の関係の具体例を示す図。
【図29】 同実施の形態に係るトレンド分析機能によって作成されたトレンドデータの一例を示す図。
【図30】 同実施の形態に係る検索キーワード分析システムの動作の一例を示すフローチャート。
【図31】 同実施の形態に係る出力処理機能によって出力されたトレンドデータの一例を示す図。
【図32】 顧客サイトに検索システムが具備される場合のアクセスシーケンスの状態例を示す図。
【図33】 検索システムが顧客サイト外に存在する場合のアクセスシーケンスの状態例を示す図。
【図34】 検索システムが顧客サイト外にあり、顧客サイト内のアクセスシーケンスの途中に検索結果ページが存在する場合のアクセスシーケンスの状態例を示す図。
【図35】 顧客サイト内に検索システムが具備される場合のアクセスシーケンスにおいて複数の検索が行われた状態例を示す図。
【図36】 検索システムが顧客サイト外に存在する場合のアクセスシーケンスにおいて複数の検索が行われた状態例を示す図。
【図37】 顧客サイト内の検索システムと顧客サイト外の検索システムの双方を用いてアクセスシーケンスの途中で検索が行われた状態例を示す図。
【図38】 顧客サイト内の検索システムによる検索結果ページに基づいて抽出されたサブアクセスシーケンスと検索後閲覧時間との関係の一例を示す図。
【図39】 顧客サイト外の検索システムによる検索結果ページに基づいて抽出されたサブアクセスシーケンスと検索後閲覧時間との関係の一例を示す図。
【図40】 本発明の第9の実施の形態に係る検索キーワード分析システムの構成の一例を示すブロック図。
【図41】 同実施の形態に係るサブアクセスシーケンス抽出機能の具体例を示すブロック図。
【図42】 同実施の形態に係るサブアクセスシーケンス判定機能の具体例を示すブロック図。
【図43】 アクセスシーケンスの画面遷移の一例を示す図。
【図44】 同実施の形態に係る検索キーワード分析システムの動作の一例を示すフローチャート。
【図45】 検索システムを用いた代表的なWebページの遷移の例を示す図。
【符号の説明】
4、38…記録装置、5…顧客、6…顧客サイト、6a…サイト内検索システム、7…Webアクセスログ、8…一般的な閲覧者、8a…顧客サイト閲覧者、9,18,24,29,42…検索キーワード分析システム、10,19,25,30,43…記録媒体、11,20,26,31,44,85…検索キーワード分析プログラム、12,12a…ログ前処理機能、13,13a…アクセスシーケンス抽出機能、14,14a,45,87…キーワード抽出機能、15,15a,89…満足度算出機能、16…満足度・キーワード関連付け機能、17,23,28,33…出力データ、21,21a…ニーズ値算出機能、22,22a…満足度・ニーズ値関連付け機能、27…グラフ化機能、32…成功度算出機能、341〜34n…サイト外検索システム、37,39,39a,40,46,88…評価値算出機能、41…成功度・キーワード関連付け機能、52…カテゴリ形成機能、53,79…トレンド分析機能、54…出力処理機能、86…サブアクセスシーケンス抽出機能
Claims (41)
- コンピュータに、
WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされた前記サイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けており前記アクセス先識別データの示す前記アクセス先が前記サイト内の検索システムの場合には前記アクセス先識別データと前記検索システムに入力された検索キーワードとを関連付けて記録する前記サイト内のWebアクセスログに基づいて、同一のアクセス要求側による前記サイト内での連続的なアクセスを表すアクセスシーケンスを抽出し、この抽出されたアクセスシーケンスを示すアクセスシーケンス識別子とこの抽出されたアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すアクセスシーケンスデータを記録手段に記録するアクセスシーケンス抽出機能と、
前記検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、前記Webアクセスログにおいて前記検索システムを示すアクセス先識別データと前記アクセス要求側から前記検索システムに入力された検索キーワードとが関連付けされている場合に、前記検索キーワードを抽出し、前記検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを前記記録手段に記録するキーワード抽出機能と、
前記記録手段に記録されているアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、前記アクセスシーケンスデータの示すアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値との対応関係を示す関係データを前記記録手段に記録する評価値算出機能と
を実現させるための検索キーワード分析プログラム。 - 請求項1記載の検索キーワード分析プログラムにおいて、
前記評価値算出機能は、前記質的評価値に加えて、前記記録手段に記録されているキーワードデータの示す検索キーワードの入力数又は入力割合を含む量的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値と前記量的評価値との対応関係を示す関係データを前記記録手段に記録する
ことを特徴とする検索キーワード分析プログラム。 - コンピュータに、
WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされた前記サイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けており前記アクセス先識別データの示す前記アクセス先が前記サイト内の検索システムの場合には前記アクセス先識別データと前記検索システムに入力された検索キーワードとを関連付けて記録する前記サイト内のWebアクセスログに基づいて、同一のアクセス要求側による前記サイト内での連続的なアクセスを表すアクセスシーケンスを抽出し、この抽出されたアクセスシーケンスを示すアクセスシーケンス識別子とこの抽出されたアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを関連付け、前記検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、この抽出されたアクセスシーケンスに含まれるアクセスのアクセス先が前記検索システムの場合にはこのアクセス識別子に対して前記検索システムに入力された検索キーワードをさらに関連付けたアクセスシーケンスデータを記録手段に記録するアクセスシーケンス抽出機能と、
前記記録手段に記録されたアクセスシーケンスデータに基づいて、前記アクセスシーケンスにおいて前記検索キーワードが入力されている場合に、前記検索キーワードを抽出し、前記検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを前記記録手段に記録するキーワード抽出機能と、
前記記録手段に記録されているアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、前記アクセスシーケンスデータの示すアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値との対応関係を示す関係データを前記記録手段に記録する評価値算出機能と
を実現させるための検索キーワード分析プログラム。 - 請求項3記載の検索キーワード分析プログラムにおいて、
前記評価値算出機能は、前記質的評価値に加えて、前記記録手段に記録されているキーワードデータの示す検索キーワードの入力数又は入力割合を含む量的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値と前記量的評価値との対応関係を示す関係データを前記記録手段に記録する
ことを特徴とする検索キーワード分析プログラム。 - 請求項1又は請求項3記載の検索キーワード分析プログラムにおいて、
前記Webアクセスログは、レファラ情報と前記アクセス先識別データとを関連付けたデータを含み、
前記アクセスシーケンス抽出機能は、前記パターン情報に基づいて、前記レファラ情報が前記検索システムを示す場合に、前記レファラ情報に関連付けされている前記アクセス先識別データの示すアクセス先へのアクセスを含むアクセスシーケンスを抽出し、
前記キーワード抽出機能は、前記パターン情報に基づいて、前記レファラ情報が前記検索システムを示す場合に、前記レファラ情報に含まれている検索キーワードを抽出し、
前記評価値算出機能は、前記アクセスシーケンスに対する前記検索キーワード入力後の質的評価値を算出する
ことを特徴とする検索キーワード分析プログラム。 - コンピュータに、
WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされた前記サイト内のアクセス先を示すアクセス先識別データとレファラ情報とアクセス時間データとを関連付けており前記レファラ情報の示すアクセス先がWWWの検索システムの場合には前記レファラ情報に前記検索システムに入力された検索キーワードが含まれている前記サイト内のWebアクセスログと、前記検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、前記レファラ情報が前記検索システムを示す場合に前記レファラ情報に関連付けされている前記アクセス先識別データの示すアクセス先へのアクセスを含み同一のアクセス要求側による連続的な前記サイト内のアクセスを表すアクセスシーケンスを抽出し、この抽出されたアクセスシーケンスを示すアクセスシーケンス識別子とこの抽出されたアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すアクセスシーケンスデータを記録手段に記録するアクセスシーケンス抽出機能と、
前記パターン情報に基づいて、前記Webアクセスログにおいて前記レファラ情報が前記検索システムを示す場合に、前記レファラ情報に含まれている検索キーワードを抽出し、前記検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを前記記録手段に記録するキーワード抽出機能と、
前記記録手段に記録されているアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、前記アクセスシーケンスデータの示すアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値との対応関係を示す関係データを前記記録手段に記録する評価値算出機能と
を実現させるための検索キーワード分析プログラム。 - 請求項5又は請求項6記載の検索キーワード分析プログラムにおいて、
前記評価値算出機能は、前記質的評価値に加えて、前記記録手段に記録されているキーワードデータの示す検索キーワードの入力数又は入力割合を含む量的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値と前記量的評価値との対応関係を示す関係データを前記記録手段に記録する
ことを特徴とする検索キーワード分析プログラム。 - 請求項2と請求項4と請求項7記載のいずれか1項記載の検索キーワード分析プログラムにおいて、
コンピュータに、前記記録手段に記録された関係データにしたがって、前記質的評価値と前記量的評価値とに基づくグラフを描画するグラフ化機能を実現させるためのプログラムを付加したことを特徴とする検索キーワード分析プログラム。 - 請求項2と請求項4と請求項7と請求項8のいずれか1項記載の検索キーワード分析プログラムにおいて、
前記量的評価値は、前記検索キーワードの入力数が多いほど値が大きくなる検索結果のニーズ値である
ことを特徴とする検索キーワード分析プログラム。 - 請求項1乃至請求項9のいずれか1項記載の検索キーワード分析プログラムにおいて、
前記評価値算出機能は、さらに、分析候補の検索キーワードと前記分析候補の検索キーワードの入力後にアクセスされた場合に成功度を増加するアクセス先識別データとを関連付けたデータと前記記録手段に記録されたキーワードデータとに基づいて、前記アクセスシーケンスにおいて前記分析候補の検索キーワードが入力されておりその入力後前記分析候補の検索キーワードと関連付けされているアクセス先識別データの示すアクセス先がアクセスされている場合に、前記アクセスシーケンスに対する成功度を増加し、この成功度を含む質的評価値を前記記録手段に記録する
ことを特徴とする検索キーワード分析プログラム。 - 請求項10記載の検索キーワード分析プログラムにおいて、
前記評価値算出機能は、前記分析候補の検索キーワードが入力されてから前記分析候補の検索キーワードと関連付けされているアクセス先識別データの示すアクセス先がアクセスされるまでのアクセス数が少ないほど加えられる成功度を大きくすることを特徴とする検索キーワード分析プログラム。 - 請求項1乃至請求項9のいずれか1項記載の検索キーワード分析プログラムにおいて、
前記評価値算出機能は、前記アクセスシーケンスにおける前記検索キーワード入力後のアクセスから最後のアクセスまでの時間間隔が長いほど増加する前記アクセス要求側の満足度を含む質的評価値を前記記録手段に記録する
ことを特徴とする検索キーワード分析プログラム。 - コンピュータに、
WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされた前記サイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けており前記アクセス先識別データの示す前記アクセス先が前記サイト内の検索システムの場合には前記アクセス先識別データと前記検索システムに入力された検索キーワードとを関連付けて記録する前記サイト内のWebアクセスログに基づいて、同一のアクセス要求側による前記サイト内での連続的なアクセスのうち検索結果ページへのアクセスから定まる始端と、前記始端と同一のアクセス要求側による連続的なアクセスのうち前記始端以降のアクセスから定まる終端とに基づくサブアクセスシーケンスを抽出し、この抽出されたサブアクセスシーケンスを示すサブアクセスシーケンス識別子とこの抽出されたサブアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すサブアクセスシーケンスデータを記録手段に記録するサブアクセスシーケンス抽出機能と、
前記検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、前記Webアクセスログにおいて前記検索システムを示すアクセス先識別データと前記アクセス要求側から前記検索システムに入力された検索キーワードとが関連付けされている場合に、前記検索キーワードを抽出し、前記検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを前記記録手段に記録するキーワード抽出機能と、
前記記録手段に記録されているサブアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、前記サブアクセスシーケンスデータの示すサブアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、前記サブアクセスシーケンスにおいて入力された検索キーワードと前記質的評価値との対応関係を示す関係データを前記記録手段に記録する評価値算出機能と
を実現させるための検索キーワード分析プログラム。 - コンピュータに、
WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされた前記サイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けており前記アクセス先識別データの示す前記アクセス先が前記サイト内の検索システムの場合には前記アクセス先識別データと前記検索システムに入力される検索キーワードとを関連付けて記録する前記サイト内のWebアクセスログに基づいて、同一のアクセス要求側による前記サイト内での連続的なアクセスから、検索結果ページへのアクセスから定まる始端と次の始端とを求めるとともに前記次の始端の直前のアクセスに基づいて前記始端に対応する終端を求めてサブアクセスシーケンスを抽出し、この抽出されたサブアクセスシーケンスを示すサブアクセスシーケンス識別子とこの抽出されたサブアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すサブアクセスシーケンスデータを記録手段に記録するサブアクセスシーケンス抽出機能と、
前記検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、前記Webアクセスログにおいて前記検索システムを示すアクセス先識別データと前記アクセス要求側から前記検索システムに入力された検索キーワードとが関連付けされている場合に、前記検索キーワードを抽出し、前記検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを前記記録手段に記録するキーワード抽出機能と、
前記記録手段に記録されているサブアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、前記サブアクセスシーケンスデータの示すサブアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、前記サブアクセスシーケンスにおいて入力された検索キーワードと前記質的評価値との対応関係を示す関係データを前記記録手段に記録する評価値算出機能と
を実現させるための検索キーワード分析プログラム。 - コンピュータに、
WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされた前記サイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けており前記アクセス先識別データの示す前記アクセス先が前記サイト内の検索システムの場合には前記アクセス先識別データと前記検索システムに入力された検索キーワードとを関連付けて記録する前記サイト内のWebアクセスログに基づいて、同一のアクセス要求側による前記サイト内での連続的なアクセスから検索結果ページへのアクセスから定まる始端と次の始端とが求められた場合、前記次の始端の直前のアクセスを前記始端に対応する終端とし、前記始端が求められ前記次の始端が求められなかった場合、前記連続的なアクセスの終端を前記始端に対応する終端とし、前記始端と前記終端とに基づいてサブアクセスシーケンスを抽出し、この抽出されたサブアクセスシーケンスを示すサブアクセスシーケンス識別子とこの抽出されたサブアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すサブアクセスシーケンスデータを記録手段に記録するサブアクセスシーケンス抽出機能と、
前記検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、前記Webアクセスログにおいて前記検索システムを示すアクセス先識別データと前記アクセス要求側から前記検索システムに入力された検索キーワードとが関連付けされている場合に、前記検索キーワードを抽出し、前記検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを前記記録手段に記録するキーワード抽出機能と、
前記記録手段に記録されているサブアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、前記サブアクセスシーケンスデータの示すサブアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、前記サブアクセスシーケンスにおいて入力された検索キーワードと前記質的評価値との対応関係を示す関係データを前記記録手段に記録する評価値算出機能と
を実現させるための検索キーワード分析プログラム。 - 請求項2と請求項4と請求項7のいずれか1項記載の検索キーワード分析プログラムにおいて、
前記評価値算出機能は、前記アクセス時間データに基づいて、複数の期間毎の前記関係データを求め、
コンピュータに、
前記複数の期間毎の関係データに基づいて、前記検索キーワードについて前記質的評価値と前記量的評価値との遷移状況を表すトレンドデータを求め、前記記録手段に記録するトレンド分析機能を実現させる
ことを特徴とする検索キーワード分析プログラム。 - 請求項16記載の検索キーワード分析プログラムにおいて、
前記トレンド分析機能は、前記複数の期間の切り換わりに応じて、前記検索キーワードの前記質的評価値と前記量的評価値とのうち少なくとも一方が、前記質的評価値と前記量的評価値のそれぞれについて設定された境界値を超えて変化するか判断し、
前記トレンドデータは、前記トレンド分析機能による判断結果を示すデータを含むことを特徴とする検索キーワード分析プログラム。 - 請求項17記載の検索キーワード分析プログラムにおいて、
前記トレンド分析機能は、
前記複数の期間毎に、前記複数の境界値から定まる複数の領域のうち、前記検索キーワードの属する領域を求める領域計算機能と、
前記複数の期間の切り換わりに応じて前記検索キーワードの領域が変化するか判断する領域判断機能と、
前記領域が変化する検索キーワードに対して前記領域の変化に応じたメッセージを付す領域メッセージ付加機能と
を具備し、
前記トレンドデータは、前記領域が変化する検索キーワードに前記メッセージを付した結果を示すデータを含む
ことを特徴とする検索キーワード分析プログラム。 - 請求項16乃至請求項18のいずれか1項記載の検索キーワード分析プログラムにおいて、
前記トレンド分析機能は、前記複数の期間毎の前記検索キーワードの前記質的評価値と前記量的評価値とに基づいて、前記複数の期間の切り換わり前後における前記検索キーワードの移動距離と移動方向とを求め、
前記トレンドデータは、前記複数の期間の切り換わり前後における前記検索キーワードの移動距離と移動方向を示すデータを含む
ことを特徴とする検索キーワード分析プログラム。 - 請求項16乃至請求項19のいずれか1項記載の検索キーワード分析プログラムにおいて、
前記トレンド分析機能は、
前記複数の期間毎の前記検索キーワードの前記質的評価値と前記量的評価値とに基づいて、前記複数の期間の切り換わり前後における前記検索キーワードの移動距離を求める移動距離計算機能と、
前記移動距離が移動距離しきい値を超えているか判断する移動距離判断機能と、
前記移動距離が前記移動距離しきい値を超えている場合に、前記検索キーワードの移動方向を求める移動方向計算機能と、
前記移動距離が前記移動距離しきい値を超える検索キーワードに対して前記移動方向に応じたメッセージを付すベクトルメッセージ付加機能と
を具備し、
前記トレンドデータは、前記移動距離が前記移動距離しきい値を超える検索キーワードに前記メッセージを付した結果を示すデータを含む
ことを特徴とする検索キーワード分析プログラム。 - 請求項16乃至請求項20のいずれか1項記載の検索キーワード分析プログラムにおいて、
コンピュータに、
前記トレンドデータに基づいて、前記質的評価値と前記量的評価値とを複数の座標軸とする空間上に、前記複数の期間毎の前記検索キーワードを示す指標を前記質的評価値と前記量的評価値とに応じて配置し、配置された前記指標を前記複数の期間の経過順序に応じて線で結んだグラフを表示するための処理を実行する出力処理機能を実現させる
ことを特徴とする検索キーワード分析プログラム。 - 請求項2と請求項4と請求項7のいずれか1項記載の検索キーワード分析プログラムにおいて、
前記評価値算出機能は、前記アクセス時間データに基づいて、複数の期間毎の前記関係データを求め、
コンピュータに、
前記検索キーワードと前記検索キーワードの属するカテゴリとを関係付けたカテゴリデータと前記複数の期間毎の関係データとに基づいて、前記複数の期間毎に前記カテゴリについて前記質的評価値と前記量的評価値とを算出し、前記記録手段に記録するカテゴリ形成機能と、
前記カテゴリについて前記質的評価値と前記量的評価値との遷移状況を表すトレンドデータを求め、前記記録手段に記録するトレンド分析機能とを実現させる
ことを特徴とする検索キーワード分析プログラム。 - 請求項22記載の検索キーワード分析プログラムにおいて、
コンピュータに、
前記トレンドデータに基づいて、前記質的評価値と前記量的評価値とを複数の座標軸とする空間上に、前記複数の期間毎の前記カテゴリを示す指標を前記質的評価値と前記量的評価値とに応じて配置し、配置された前記指標を前記複数の期間の経過順序に応じて線で結んだグラフを表示するための処理を実行する出力処理機能を実現させる
ことを特徴とする検索キーワード分析プログラム。 - WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされた前記サイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けており前記アクセス先識別データの示す前記アクセス先が前記サイト内の検索システムの場合には前記アクセス先識別データと前記検索システムに入力された検索キーワードとを関連付けて記録する前記サイト内のWebアクセスログに基づいて、同一のアクセス要求側による前記サイト内への連続的なアクセスを表すアクセスシーケンスを抽出し、この抽出されたアクセスシーケンスを示すアクセスシーケンス識別子とこの抽出されたアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すアクセスシーケンスデータを記録手段に記録するアクセスシーケンス抽出手段と、
前記検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、前記Webアクセスログにおいて前記検索システムを示すアクセス先識別データと前記アクセス要求側から前記検索システムに入力された検索キーワードとが関連付けされている場合に、前記検索キーワードを抽出し、前記検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを前記記録手段に記録するキーワード抽出手段と、
前記記録手段に記録されているアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、前記アクセスシーケンスデータの示すアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値との対応関係を示す関係データを前記記録手段に記録する評価値算出手段と
を具備する検索キーワード分析システム。 - 請求項24記載の検索キーワード分析システムにおいて、
前記評価値算出手段は、前記質的評価値に加えて、前記記録手段に記録されているキーワードデータの示す検索キーワードの入力数又は入力割合を含む量的評価値を算出し、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値と前記量的評価値との対応関係を示す関係データを前記記録手段に記録することを特徴とする検索キーワード分析システム。 - WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされた前記サイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けており前記アクセス先識別データの示す前記アクセス先が前記サイト内の検索システムの場合には前記アクセス先識別データと前記検索システムに入力された検索キーワードとを関連付けて記録する前記サイト内のWebアクセスログに基づいて、同一のアクセス要求側による前記サイト内での連続的なアクセスを表すアクセスシーケンスを抽出し、この抽出されたアクセスシーケンスを示すアクセスシーケンス識別子とこの抽出されたアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを関連付け、前記検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、この抽出されたアクセスシーケンスに含まれるアクセスのアクセス先が前記検索システムの場合にはこのアクセス識別子に対して前記検索システムに入力された検索キーワードをさらに関連付けたアクセスシーケンスデータを記録手段に記録するアクセスシーケンス抽出手段と、
前記記録手段に記録されたアクセスシーケンスデータに基づいて、前記アクセスシーケンスにおいて前記検索キーワードが入力されている場合に、前記検索キーワードを抽出し、前記検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを前記記録手段に記録するキーワード抽出手段と、
前記記録手段に記録されているアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、前記アクセスシーケンスデータの示すアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値との対応関係を示す関係データを前記記録手段に記録する評価値算出手段と
を具備する検索キーワード分析システム。 - 請求項26記載の検索キーワード分析システムにおいて、
前記評価値算出手段は、前記質的評価値に加えて、前記記録手段に記録されているキーワードデータの示す検索キーワードの入力数又は入力割合を含む量的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値と前記量的評価値との対応関係を示す関係データを前記記録手段に記録する
ことを特徴とする検索キーワード分析システム。 - WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされた前記サイト内のアクセス先を示すアクセス先識別データとレファラ情報とアクセス時間データとを関連付けており前記レファラ情報の示すアクセス先がWWWの検索システムの場合には前記レファラ情報に前記検索システムに入力された検索キーワードが含まれている前記サイト内のWebアクセスログと、前記検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、前記レファラ情報が前記検索システムを示す場合に前記レファラ情報に関連付けされている前記アクセス先識別データの示すアクセス先へのアクセスを含み同一のアクセス要求側による連続的な前記サイト内のアクセスを表すアクセスシーケンスを抽出し、この抽出されたアクセスシーケンスを示すアクセスシーケンス識別子とこの抽出されたアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すアクセスシーケンスデータを記録手段に記録するアクセスシーケンス抽出手段と、
前記パターン情報に基づいて、前記Webアクセスログにおいて前記レファラ情報が前記検索システムを示す場合に、前記レファラ情報に含まれている検索キーワードを抽出し、前記検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを前記記録手段に記録するキーワード抽出手段と、
前記記録手段に記録されているアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、前記アクセスシーケンスデータの示すアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値との対応関係を示す関係データを前記記録手段に記録する評価値算出手段と
を具備する検索キーワード分析システム。 - 請求項28記載の検索キーワード分析システムにおいて、
前記評価値算出手段は、前記質的評価値に加えて、前記記録手段に記録されているキーワードデータの示す検索キーワードの入力数又は入力割合を含む量的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値と前記量的評価値との対応関係を示す関係データを前記記録手段に記録する
ことを特徴とする検索キーワード分析システム。 - WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされた前記サイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けており前記アクセス先識別データの示す前記アクセス先が前記サイト内の検索システムの場合には前記アクセス先識別データと前記検索システムに入力された検索キーワードとを関連付けて記録する前記サイト内のWebアクセスログに基づいて、同一のアクセス要求側による前記サイト内での連続的なアクセスのうち検索結果ページへのアクセスから定まる始端と、前記始端と同一のアクセス要求側による連続的なアクセスのうち前記始端以降のアクセスから定まる終端とに基づくサブアクセスシーケンスを抽出し、この抽出されたサブアクセスシーケンスを示すサブアクセスシーケンス識別子とこの抽出されたサブアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すサブアクセスシーケンスデータを記録手段に記録するサブアクセスシーケンス抽出手段と、
前記検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、前記Webアクセスログにおいて前記検索システムを示すアクセス先識別データと前記アクセス要求側から前記検索システムに入力された検索キーワードとが関連付けされている場合に、前記検索キーワードを抽出し、前記検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを前記記録手段に記録するキーワード抽出手段と、
前記記録手段に記録されているサブアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、前記サブアクセスシーケンスデータの示すサブアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、前記サブアクセスシーケンスにおいて入力された検索キーワードと前記質的評価値との対応関係を示す関係データを前記記録手段に記録する評価値算出手段と
を具備する検索キーワード分析システム。 - 請求項25と請求項27と請求項29のいずれか1項記載の検索キーワード分析システムにおいて、
前記評価値算出手段は、前記アクセス時間データに基づいて、複数の期間毎の前記関係データを求め、
前記複数の期間毎の関係データに基づいて、前記検索キーワードについて前記質的評価値と前記量的評価値との遷移状況を表すトレンドデータを求めるトレンド分析手段を具備する
ことを特徴とする検索キーワード分析システム。 - 請求項25と請求項27と請求項29のいずれか1項記載の検索キーワード分析システムにおいて、
前記評価値算出手段は、前記アクセス時間データに基づいて、複数の期間毎の前記関係データを求め、
前記検索キーワードと前記検索キーワードの属するカテゴリとを関係付けたカテゴリデータと前記複数の期間毎の関係データとに基づいて、前記複数の期間毎に前記カテゴリについて前記質的評価値と前記量的評価値とを算出し、前記記録手段に記録するカテゴリ形成手段と、
前記カテゴリについて前記質的評価値と前記量的評価値との遷移状況を表すトレンドデータを求めるトレンド分析手段と
を具備する検索キーワード分析システム。 - WWWにおける検索システムに入力された検索キーワードについて分析するためにコンピュータにより実施される検索キーワード分析方法において、
WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされた前記サイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けており前記アクセス先識別データの示す前記アクセス先が前記サイト内の検索システムの場合には前記アクセス先識別データと前記検索システムに入力された検索キーワードとを関連付けて記録する前記サイト内のWebアクセスログに基づいて、同一のアクセス要求側による前記サイト内での連続的なアクセスを表すアクセスシーケンスを抽出し、この抽出されたアクセスシーケンスを示すアクセスシーケンス識別子とこの抽出されたアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すアクセスシーケンスデータを記録手段に記録するとともに、前記検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、前記Webアクセスログにおいて前記検索システムを示すアクセス先識別データと前記アクセス要求側から前記検索システムに入力された検索キーワードとが関連付けされている場合に、前記検索キーワードを抽出し、前記検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを前記記録手段に記録し、
前記記録手段に記録されているアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、前記アクセスシーケンスデータの示すアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値との対応関係を示す関係データを前記記録手段に記録する
ことを特徴とする検索キーワード分析方法。 - 請求項33記載の検索キーワード分析方法において、
前記質的評価値とともに、前記記録手段に記録されているキーワードデータの示す検索キーワードの入力数又は入力割合を含む量的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値と前記量的評価値との対応関係を示す関係データを前記記録手段に記録する
ことを特徴とする検索キーワード分析方法。 - WWWにおける検索システムに入力された検索キーワードについて分析するためにコンピュータにより実施される検索キーワード分析方法において、
WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされた前記サイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けており前記アクセス先識別データの示す前記アクセス先が前記サイト内の検索システムの場合には前記アクセス先識別データと前記検索システムに入力される検索キーワードとを関連付けて記録する前記サイト内のWebアクセスログに基づいて、同一のアクセス要求側による前記サイト内での連続的なアクセスを表すアクセスシーケンスを抽出し、この抽出されたアクセスシーケンスを示すアクセスシーケンス識別子とこの抽出されたアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを関連付け、前記検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、この抽出されたアクセスシーケンスに含まれるアクセスのアクセス先が前記検索システムの場合にはこのアクセス識別子に対して前記検索システムに入力された検索キーワードをさらに関連付けたアクセスシーケンスデータを記録手段に記録し、
前記記録手段に記録されたアクセスシーケンスデータに基づいて、前記アクセスシーケンスにおいて前記検索キーワードが入力されている場合に、前記検索キーワードを抽出し、前記検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを前記記録手段に記録し、
前記記録手段に記録されているアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、前記アクセスシーケンスデータの示すアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値との対応関係を示す関係データを前記記録手段に記録する
ことを特徴とする検索キーワード分析方法。 - 請求項35記載の検索キーワード分析方法において、
前記質的評価値に加えて、前記記録手段に記録されているキーワードデータの示す検索キーワードの入力数又は入力割合を含む量的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値と前記量的評価値との対応関係を示す関係データを前記記録手段に記録する
ことを特徴とする検索キーワード分析方法。 - WWWにおける検索システムに入力された検索キーワードについて分析するためにコンピュータにより実施される検索キーワード分析方法において、
WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされた前記サイト内のアクセス先を示すアクセス先識別データとレファラ情報とアクセス時間データとを関連付けており前記レファラ情報の示すアクセス先がWWWの検索システムの場合には前記レファラ情報に前記検索システムに入力された検索キーワードが含まれている前記サイト内のWebアクセスログと、前記検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、前記レファラ情報が前記検索システムを示す場合に前記レファラ情報に関連付けされている前記アクセス先識別データの示すアクセス先へのアクセスを含み同一のアクセス要求側による連続的な前記サイト内のアクセスを表すアクセスシーケンスを抽出し、この抽出されたアクセスシーケンスを示すアクセスシーケンス識別子とこの抽出されたアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すアクセスシーケンスデータを記録手段に記録するとともに、前記パターン情報に基づいて、前記Webアクセスログにおいて前記レファラ情報が前記検索システムを示す場合に、前記レファラ情報に含まれている検索キーワードを抽出し、前記検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを前記記録手段に記録し、
前記記録手段に記録されているアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、前記アクセスシーケンスデータの示すアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値との対応関係を示す関係データを前記記録手段に記録する
ことを特徴とする検索キーワード分析方法。 - 請求項37記載の検索キーワード分析方法において、
前記質的評価値とともに、前記記録手段に記録されているキーワードデータの示す検索キーワードの入力数又は入力割合を含む量的評価値を求め、前記アクセスシーケンスにおいて入力された検索キーワードと前記質的評価値と前記量的評価値の対応関係を示す関係データを前記記録手段に記録することを特徴とする検索キーワード分析方法。 - WWWにおける検索システムに入力された検索キーワードについて分析するためにコンピュータにより実施される検索キーワード分析方法において、
WWWにおけるサイト内へのアクセス要求側を示すアクセス要求側識別データと前記アクセス要求側にアクセスされた前記サイト内のアクセス先を示すアクセス先識別データとアクセス時間データとを関連付けており前記アクセス先識別データの示す前記アクセス先が前記サイト内の検索システムの場合には前記アクセス先識別データと前記検索システムに入力された検索キーワードとを関連付けて記録する前記サイト内のWebアクセスログに基づいて、同一のアクセス要求側による前記サイト内での連続的なアクセスのうち検索結果ページへのアクセスから定まる始端と、前記始端と同一のアクセス要求側による連続的なアクセスのうち前記始端以降のアクセスから定まる終端とに基づくサブアクセスシーケンスを抽出し、この抽出されたサブアクセスシーケンスを示すサブアクセスシーケンス識別子とこの抽出されたサブアクセスシーケンスに含まれる各アクセスに対して重複なく付与されたアクセス識別子とアクセス時間データとを示すサブアクセスシーケンスデータを記録手段に記録するとともに、前記検索システムの場所と検索キーワードパターンを示すパターン情報に基づいて、前記Webアクセスログにおいて前記検索システムを示すアクセス先識別データと前記アクセス要求側から前記検索システムに入力された検索キーワードとが関連付けされている場合に、前記検索キーワードを抽出し、前記検索キーワードとこの前記検索キーワードの入力されたアクセスを示すアクセス識別子とを含むキーワードデータを前記記録手段に記録し、
前記記録手段に記録されているサブアクセスシーケンスデータと、前記記録手段に記録されているキーワードデータとに基づいて、前記サブアクセスシーケンスデータの示すサブアクセスシーケンスにおいて入力された検索キーワードに対する検索後閲覧時間を含む質的評価値を求め、前記サブアクセスシーケンスにおいて入力された検索キーワードと前記質的評価値との対応関係を示す関係データを前記記録手段に記録する
ことを特徴とする検索キーワード分析方法。 - 請求項34と請求項36と請求項38のいずれか1項記載の検索キーワード分析方法において、
前記関係データは、前記アクセス時間データに基づいて、複数の期間毎に求められ、
前記複数の期間毎の関係データに基づいて、前記検索キーワードについて前記質的評価値と前記量的評価値との遷移状況を表すトレンドデータを求め、前記記録手段に記録する
ことを特徴とする検索キーワード分析方法。 - 請求項34と請求項36と請求項38のいずれか1項記載の検索キーワード分析方法において、
前記関係データは、前記アクセス時間データに基づいて、複数の期間毎に求められ、
前記検索キーワードと前記検索キーワードの属するカテゴリとを関係付けたカテゴリデータと前記複数の期間毎の関係データとに基づいて、前記複数の期間毎に前記カテゴリについて前記質的評価値と前記量的評価値とを算出し、前記記録手段に記録し、
前記カテゴリについて前記質的評価値と前記量的評価値との遷移状況を表すトレンドデータを求め、前記記録手段に記録する
ことを特徴とする検索キーワード分析方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003070281A JP4363868B2 (ja) | 2002-08-23 | 2003-03-14 | 検索キーワード分析プログラム及びシステム並びに方法 |
CNB031551270A CN1279477C (zh) | 2002-08-23 | 2003-08-22 | 检索关键字分析系统和方法 |
US10/645,623 US7809737B2 (en) | 2002-08-23 | 2003-08-22 | Program, system and method for analyzing retrieval keyword |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002243466 | 2002-08-23 | ||
JP2002382396 | 2002-12-27 | ||
JP2003070281A JP4363868B2 (ja) | 2002-08-23 | 2003-03-14 | 検索キーワード分析プログラム及びシステム並びに方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004252911A JP2004252911A (ja) | 2004-09-09 |
JP4363868B2 true JP4363868B2 (ja) | 2009-11-11 |
Family
ID=32912804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003070281A Expired - Fee Related JP4363868B2 (ja) | 2002-08-23 | 2003-03-14 | 検索キーワード分析プログラム及びシステム並びに方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7809737B2 (ja) |
JP (1) | JP4363868B2 (ja) |
CN (1) | CN1279477C (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1666205A (zh) * | 2001-10-17 | 2005-09-07 | Npx科技有限公司 | 在线接收的个人标识的验证 |
US8046350B1 (en) * | 2003-09-24 | 2011-10-25 | Google Inc. | Systems and methods for detecting commercial queries |
US7657519B2 (en) | 2004-09-30 | 2010-02-02 | Microsoft Corporation | Forming intent-based clusters and employing same by search |
US20060085401A1 (en) * | 2004-10-20 | 2006-04-20 | Microsoft Corporation | Analyzing operational and other data from search system or the like |
JP4820147B2 (ja) * | 2004-11-12 | 2011-11-24 | ヤフー株式会社 | 属性評価プログラム、属性評価システムおよび属性評価方法 |
JP2007183838A (ja) * | 2006-01-06 | 2007-07-19 | Fujitsu Ltd | クエリーパラメーター出力ページ発見プログラム、クエリーパラメーター出力ページ発見方法およびクエリーパラメーター出力ページ発見装置 |
CN100416569C (zh) * | 2006-01-10 | 2008-09-03 | 西安交通大学 | 一种基于Web页面元数据的用户访问行为形式化描述方法 |
US8595703B2 (en) * | 2006-01-30 | 2013-11-26 | Microsoft Corporation | Context based code analysis |
CN100452055C (zh) * | 2007-04-13 | 2009-01-14 | 清华大学 | 一种用于文本或网络内容分析的大规模多关键词匹配方法 |
JP5260969B2 (ja) * | 2008-01-10 | 2013-08-14 | 日本電信電話株式会社 | 集中度監視によるWebサイト推奨装置、集中度監視によるWebサイト推奨方法、集中度監視によるWebサイト推奨プログラムおよびそのプログラムを記録した記録媒体 |
US8171033B2 (en) * | 2008-09-30 | 2012-05-01 | Vmware, Inc. | Methods and systems for the determination of thresholds via weighted quantile analysis |
JP4729089B2 (ja) * | 2008-10-06 | 2011-07-20 | 三菱電機インフォメーションシステムズ株式会社 | ウェブサイト集計装置及びウェブサイト集計プログラム |
JP5155130B2 (ja) * | 2008-12-15 | 2013-02-27 | ヤフー株式会社 | カテゴリ提示装置 |
US8347021B1 (en) | 2010-04-09 | 2013-01-01 | Google Inc. | Storing application messages |
US8768861B2 (en) * | 2010-05-31 | 2014-07-01 | Yahoo! Inc. | Research mission identification |
CN101917456B (zh) * | 2010-07-06 | 2012-10-03 | 杭州热点信息技术有限公司 | 一种内容聚合无线发布系统 |
JP5682480B2 (ja) * | 2011-06-30 | 2015-03-11 | 富士通株式会社 | 情報処理装置、情報処理方法、および情報処理プログラム |
US9521205B1 (en) * | 2011-08-01 | 2016-12-13 | Google Inc. | Analyzing changes in web analytics metrics |
US11202958B2 (en) * | 2012-04-11 | 2021-12-21 | Microsoft Technology Licensing, Llc | Developing implicit metadata for data stores |
CN102902755A (zh) * | 2012-09-21 | 2013-01-30 | 北京百度网讯科技有限公司 | 一种对检索结果项的排序进行调整的方法及装置 |
CN103713987A (zh) * | 2012-10-08 | 2014-04-09 | 尤尼西斯公司 | 基于关键词的日志处理 |
JP6042541B2 (ja) | 2013-06-24 | 2016-12-14 | 日本電信電話株式会社 | セキュリティ情報管理システム、セキュリティ情報管理方法及びセキュリティ情報管理プログラム |
WO2015016133A1 (ja) * | 2013-07-30 | 2015-02-05 | 日本電信電話株式会社 | 情報管理装置及び情報管理方法 |
JP6504757B2 (ja) * | 2014-07-01 | 2019-04-24 | 株式会社リクルート | ウェブ評価装置、ウェブ評価方法およびウェブ評価プログラム |
CN104579754B (zh) * | 2014-12-18 | 2018-01-26 | 国云科技股份有限公司 | 一种统计Web应用用户访问时间特性的方法 |
US10157240B2 (en) * | 2015-10-01 | 2018-12-18 | Ebay Inc. | Systems and methods to generate a concept graph |
WO2017158798A1 (ja) * | 2016-03-17 | 2017-09-21 | 富士通株式会社 | 情報処理装置、情報配信システム、情報処理方法、および情報処理プログラム |
JP6723650B2 (ja) * | 2016-08-09 | 2020-07-15 | ヤフー株式会社 | 抽出装置、抽出方法、及び抽出プログラム |
CN106560808A (zh) * | 2016-08-16 | 2017-04-12 | 武汉斗鱼网络科技有限公司 | 一种计算互联网关键词的检索精度的方法及系统 |
US11244013B2 (en) * | 2018-06-01 | 2022-02-08 | International Business Machines Corporation | Tracking the evolution of topic rankings from contextual data |
JP7127080B2 (ja) * | 2020-03-19 | 2022-08-29 | ヤフー株式会社 | 判定装置、判定方法及び判定プログラム |
CN115118582B (zh) * | 2022-06-15 | 2024-04-16 | 合肥移瑞通信技术有限公司 | 日志分析的方法和装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09506629A (ja) * | 1993-12-17 | 1997-06-30 | キュビッチョッティ,ロジャー・エス | ヌクレオチドに支配された生体分子および多分子薬物の集合並びに装置 |
JP2001222538A (ja) | 2000-02-07 | 2001-08-17 | Net Beesu:Kk | 情報検索システム |
JP2002123517A (ja) | 2000-10-16 | 2002-04-26 | Noboru Hayakawa | 検索キーワード解析システム |
US20030113714A1 (en) * | 2001-09-28 | 2003-06-19 | Belcher Angela M. | Biological control of nanoparticles |
-
2003
- 2003-03-14 JP JP2003070281A patent/JP4363868B2/ja not_active Expired - Fee Related
- 2003-08-22 US US10/645,623 patent/US7809737B2/en not_active Expired - Fee Related
- 2003-08-22 CN CNB031551270A patent/CN1279477C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20050050045A1 (en) | 2005-03-03 |
US7809737B2 (en) | 2010-10-05 |
JP2004252911A (ja) | 2004-09-09 |
CN1279477C (zh) | 2006-10-11 |
CN1489087A (zh) | 2004-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4363868B2 (ja) | 検索キーワード分析プログラム及びシステム並びに方法 | |
US8356097B2 (en) | Computer program product and method for estimating internet traffic | |
US8954580B2 (en) | Hybrid internet traffic measurement using site-centric and panel data | |
US7890451B2 (en) | Computer program product and method for refining an estimate of internet traffic | |
US8321278B2 (en) | Targeted advertisements based on user profiles and page profile | |
US8478746B2 (en) | Operationalizing search engine optimization | |
TWI390421B (zh) | 用於估計一資訊封包的性能之方法與裝置 | |
US20080183664A1 (en) | Presenting web site analytics associated with search results | |
US20140297403A1 (en) | Social Analytics System and Method for Analyzing Conversations in Social Media | |
Ahmed et al. | Establishing standard rules for choosing best KPIs for an e-commerce business based on google analytics and machine learning technique | |
JP2011520193A (ja) | 最もクリックされた次オブジェクトを有する検索結果 | |
TWI454945B (zh) | 大規模之搜尋引擎優化 | |
KR20030091751A (ko) | 분배 데이터베이스의 문서 분류 및 제시용 방법 및 장치 | |
WO2013112312A2 (en) | Hybrid internet traffic measurement usint site-centric and panel data | |
Agrawal et al. | Pros and cons of web mining in E-Commerce | |
Spink et al. | Trends in searching for commerce related information on web search engines | |
Khoury et al. | Visualising web browsing data for user behaviour analysis | |
Purandare | Web Mining: A Key to Improve Business on Web. | |
US11727434B2 (en) | Management of cannibalistic ads to improve internet advertising efficiency | |
JP2011198393A (ja) | ユーザ興味分析装置、方法、プログラム | |
Spink et al. | Commerce related Web search: Current trends | |
Ivanova | WEB ANALYTIC TOOLS FOR MEASURING SEO EFFICIENCY |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090303 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090728 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090818 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120828 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120828 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130828 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |