JP2006185280A - Web site diagnostic device and web site diagnostic method - Google Patents
Web site diagnostic device and web site diagnostic method Download PDFInfo
- Publication number
- JP2006185280A JP2006185280A JP2004379554A JP2004379554A JP2006185280A JP 2006185280 A JP2006185280 A JP 2006185280A JP 2004379554 A JP2004379554 A JP 2004379554A JP 2004379554 A JP2004379554 A JP 2004379554A JP 2006185280 A JP2006185280 A JP 2006185280A
- Authority
- JP
- Japan
- Prior art keywords
- page
- calculating
- pages
- access
- calculated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
Description
本発明は、複数のウェブページからなるウェブサイトをアクセス遷移の観点から診断する装置及び方法に関する。 The present invention relates to an apparatus and method for diagnosing a website including a plurality of web pages from the viewpoint of access transition.
一般にアクセスログと呼ばれるウェブページへのアクセスを記録した情報がウェブサイトの評価に用いられることがある。 Information that records access to a web page, generally called an access log, may be used for website evaluation.
特許文献1には、アクセスログ情報のうちの必要なログ情報を抽出するログファイル解析用データベースについて開示されている。特許文献2には、複数のウェブページが階層的にリンクされて構成されるウェブサイトをページ更新の前後における変化をアクセスログに基づいて評価するウェブサイト評価システムが開示されている。
本発明の発明者は、ユーザが検索サイトなどの外部リンクから、評価対象となる当該サイトへとアクセスしてくる場合に、そのユーザにとっての当該サイトの入り口は多様であり、さまざまなページからアクセスがスタートすることに着目する。そして、アクセスしてきたユーザが最初に閲覧したページの後に当該サイト内の他のページを閲覧せずに、「離脱」してしまう場合は、そのページにスタートページとしての不具合があると考える。たとえば、そのページの内容によっては、当該サイト内の他のページへと遷移しにくいものがあるかもしれない。また、サイト内の他ページへのリンクが貼り付けられていないページがあるのかもしれない。本発明の目的は、アクセスログ情報からウェブサイトの評価、とりわけサイト内ページ遷移上の重大な弱みとなっているものを発見するのに有益な情報を取り出すことにある。 The inventor of the present invention, when a user accesses the site to be evaluated from an external link such as a search site, the entrance of the site for the user is diverse, and access from various pages Focus on starting. Then, if the user who has accessed “leaves” without browsing other pages in the site after the first page viewed, the page is considered to have a problem as a start page. For example, depending on the contents of the page, there may be things that are difficult to transition to other pages in the site. There may also be pages that do not have links to other pages on the site. An object of the present invention is to extract information useful for finding an evaluation of a website from the access log information, particularly what is a serious weakness in page transition within the site.
本発明は、「スタート総数」と、「アクセス継続度」とを算出し、それをそれぞれのウェブページごとにプロットして、弱みのあるページを見出すことを最も主要な特徴とする。 The main feature of the present invention is to calculate “start total number” and “access continuity” and plot them for each web page to find a weak page.
請求項1に記載した発明は、複数のウェブページからなるウェブサイトをアクセス遷移の観点から診断するウェブサイト診断装置であって、診断対象である当該ウェブサイトを構成するウェブページのそれぞれのURLを記憶するリクエストURL記憶手段と、所定期間のアクセスログ情報にもとづいて個々のウェブページについてスタートページとなった回数(スタート回数)を算出するスタート回数算出手段と、該スタート回数算出手段により算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト外のものとなった回数(1ページでの離脱数)を算出する1ページ離脱数算出手段と、前記スタート回数算出手段により算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト内のものとなった回数(2ページ以上到達数)を算出する2ページ以上到達数算出手段と、該2ページ以上到達数算出手段により算出された2ページ以降へ進んだアクセス数から前記1ページでの離脱数を差し引いた結果を前記スタート回数で除してなる数(アクセス継続度)を算出するアクセス継続度算出手段と、該アクセス継続度算出手段により算出されたアクセス継続度と、前記スタート回数とをそれぞれのウェブページごとにプロットするプロット手段とを有するものである。
The invention described in
請求項2に記載した発明は、複数のウェブページからなるウェブサイトをアクセス遷移の観点から診断するウェブサイト診断装置における診断方法であって、診断対象である当該ウェブサイトを構成するウェブページのそれぞれのURLを記憶するリクエストURL記憶ステップと、所定期間のアクセスログ情報にもとづいて個々のウェブページについてスタートページとなった回数(スタート回数)を算出するスタート回数算出ステップと、該スタート回数算出ステップにより算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト外のものとなった回数(1ページでの離脱数)を算出する1ページ離脱数算出ステップと、前記スタートページ算出ステップにより算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト内のものとなった回数(2ページ以上到達数)を算出する2ページ以上到達数算出ステップと、該2ページ以上到達数算出ステップにより算出された2ページ以上到達数から前記1ページでの離脱数を差し引いた結果を前記スタート回数で除してなる数(アクセス継続度)を算出するアクセス継続度算出ステップと、該アクセス継続度算出ステップにより算出されたアクセス継続度と、前記スタート回数とをそれぞれのウェブページごとにプロットするプロットステップとを有するものである。
The invention described in
従来からあるアクセスログを有効に生かして、ウェブサイトを構成する一つ一つのウェブページにサイト内ページ遷移上の重大な弱みとなっているものを見つけることができることに本発明の利点がある。 It is an advantage of the present invention that an existing access log can be used effectively to find a serious weakness in page transition within a site in each web page constituting the website.
図4は、本発明に用いるコンピュータのハードウェア構成を示す図である。インターネットにつながったサーバ10、20及び端末コンピュータ101,102,103,104が描かれている。今、サーバ10に診断対象となるウェブサイトを構成するウェブページが置かれているものとする。サーバ20により、このウェブサイトの診断を実行するプログラムを走らせる。端末コンピュータ101,102,103,104はこの診断対象となるウェブサイトを閲覧するユーザのコンピュータである。ユーザが当該サイトにアクセスする履歴はサーバ10又は図示しない他のコンピュータに保存される。ある一定期間、たとえば、数時間、一日、一週間といった単位でアクセスログ情報は、収集されて分析にかけられる。
FIG. 4 is a diagram showing a hardware configuration of a computer used in the present invention.
図1は、アクセス継続度の算出にいたるプログラムのフローチャートである。アクセスログ情報が、インターネットを介して、又は磁気媒体などを介して本発明にかかる診断装置に渡される。本発明におけるいくつかの算出手段は、コンピュータが必要なプログラムを読み込んで実行することにより実現され得る。その手順をフローチャートで表現したのが図1のフローチャートである。このプログラムを走らせる前提として、当該診断対象となるウェブサイトに含まれるウェブページすべてのURLの情報が入力される必要がある。それに含まれるか否かをみて当該サイト内か、サイト外かを判断するためである。 FIG. 1 is a flowchart of a program for calculating the access continuity. The access log information is passed to the diagnostic apparatus according to the present invention via the Internet or a magnetic medium. Some calculation means in the present invention can be realized by a computer reading and executing a necessary program. The procedure is represented by a flowchart in FIG. As a premise for running this program, it is necessary to input URL information of all the web pages included in the website to be diagnosed. This is for judging whether it is included in the site or not from the site.
プログラムがスタートすると(ステップ200)、まずログよりデータを読み込む(ステップ210)。それぞれのアクセスごとに、どのページから遷移してきて、どのページへ遷移して行ったかの情報を中心に読み込まれる。そして、それに基づいて各ウェブページごとの「スタート回数(D)」、「1ページでの離脱数(E)」、「2ページ以上到達数(G)」が算出される(ステップ220)。スタート回数がゼロでなければ、ステップ230でNOと判断されて、アクセス継続度(I)は、ステップ240の式により、I=(G−E)/Dとして算出される。スタート回数がゼロの場合は、I=−100とされる(ステップ250)。アクセス継続度が算出されて終わる(ステップ260)。なお、このフローチャートには省略したが、X軸にアクセス継続度を、Y軸にスタート回数をとって、ウェブページのそれぞれについてプロットすると、それぞれのページの問題点が明確になる。グラフの作成や、プリントアウトまで連続して実行するプログラムとすることも可能である。
When the program starts (step 200), data is first read from the log (step 210). For each access, information is read mainly from which page the page has changed to and which page has been changed to. Based on this, the “start count (D)”, “number of departures per page (E)”, and “number of arrivals over 2 pages (G)” are calculated for each web page (step 220). If the number of start times is not zero, it is determined as NO in
図2は、38のウェブページからなるウェブサイトを例にとってスタート回数、1ページでの離脱数、二ページ以上到達数、アクセス継続度の算出を示す図である。38個のウェブページのIDが1から38まで振られている。それぞれのURLがリクエストURLの欄に記載されている。これは、サイト内かサイト外かを判断するのに必要な情報である。A欄のアクセス総数は、このアクセスログ情報を取得した期間内に当該ウェブページをアクセスした総数である。D欄のスタート回数は、A欄のアクセス総数のうち、そのアクセスの直前にサイト外にいたものの数である。E欄の1ページでの離脱数は、D欄のアクセスのうち、次にサイト外をアクセスしたものの数である。E/Dを求めることにより1ページでの離脱率(F欄)が求められる。D欄のアクセスのうち次もサイト内をアクセスしたものが2ページ以上到達数(G欄)となる。そして、G/Dを求めることにより、2ページ以上到達率(H欄)が求められる。H−Fを算出してアクセス継続度(I)が求まる。 FIG. 2 is a diagram showing the calculation of the number of start times, the number of departures on one page, the number of arrivals of two or more pages, and the degree of access continuation taking a website consisting of 38 web pages as an example. The IDs of 38 web pages are assigned from 1 to 38. Each URL is described in the request URL column. This is information necessary to determine whether the site is inside or outside the site. The total number of accesses in column A is the total number of accesses to the web page within the period when the access log information is acquired. The number of starts in column D is the number of accesses outside the site immediately before the access out of the total number of accesses in column A. The number of withdrawals in one page of column E is the number of accesses made outside the site among the accesses in column D. By obtaining E / D, the separation rate (F column) in one page is obtained. Of the accesses in column D, the next access in the site is the number of arrivals of two or more pages (column G). Then, by obtaining G / D, an arrival rate (H column) of two or more pages is obtained. HF is calculated to obtain the access continuity (I).
図3は、スタート総数とアクセス継続度とをプロットした例を示す図である。図2に示した例について、プロットしたものである。スタート総数は、当該ページのスタートページとしての重要度を表す。アクセス継続度は問題の大きさを表し、アクセス継続度が低い場合はスタートページとしての問題は大きく、一方でアクセス継続度が高い場合は、スタートページとしての問題は小さい。スタート総数を縦軸、アクセス継続度を横軸としてサイト内のページを点表示し、スタートページとしての重大な問題を抱えているものを識別する。この例では、つぎのようなことがわかる。
ページID1では、スタート総数が大きく、アクセス継続度も大きいので問題はなさそうである。
ページID13はスタート総数が大きく、アクセス継続度が小さいので、ページ遷移の点で弱い。
ページID8はスタート総数がやや大きく、アクセス継続度にやや不足が見て取れる。
ページID22と34は、スタート総数がやや大きく、アクセス継続度が小さいので、ページ遷移の点で弱い。
ページID4,11,38はスタート総数が小さいものの、アクセス継続度はマイナス100で最低であり、サイト外からこれらのページにアクセスしてきた場合、必ずサイト外へと離脱してしまう。
ページID6,10,12,14,16,32はスタート総数が小さいものの、アクセス継続度が小さく、サイト内のページ遷移を起こしにくい。
ページID36はスタート総数がゼロである。
このようにスタート総数とアクセス継続度による分析によって、アクセスのスタートとなるウェブページ毎にどの程度重大な問題を抱えているかが把握された。
FIG. 3 is a diagram illustrating an example in which the total number of starts and the access continuation degree are plotted. It is what plotted about the example shown in FIG. The total number of starts represents the importance of the page as the start page. The access continuity indicates the magnitude of the problem. When the access continuity is low, the problem as the start page is large. On the other hand, when the access continuity is high, the problem as the start page is small. The total number of starts is displayed on the vertical axis and the continuity of access is displayed on the horizontal axis, and the pages in the site are displayed as dots to identify those that have serious problems as the start page. In this example, the following can be seen.
In page ID1, since the total number of starts is large and the degree of continuity of access is large, there seems to be no problem.
The
The
Although the
Although the
The
In this way, the analysis based on the total number of starts and the degree of continuity of access revealed how serious problems each web page that started access had.
なお、上の例では、一つのサーバにあるページ群からなる一つのウェブサイトを診断対象としたが、二つ以上のサーバにあるページ群を複合的に一つのウェブサイトとみなして、サイト分析をすることもできる。サイト内にあるか否かは、登録されたURLとの照合をする作業により決定するものであって、一つのサーバにあるものであることを前提としないからである。また、同様に、サイト内のウェブページが階層構造になっている必要もない。 In the above example, one website consisting of a group of pages on one server is targeted for diagnosis. However, site analysis is performed by regarding a group of pages on two or more servers as a single website. You can also This is because whether or not it is in the site is determined by the work of collating with the registered URL, and it is not premised that it is in one server. Similarly, the web pages in the site need not have a hierarchical structure.
本発明は、スタンドアローンのコンピュータで行うこともできるし、ウェブ上のサーバでのサービスとしても提供できる。 The present invention can be performed by a stand-alone computer or can be provided as a service on a server on the web.
10,20 サーバ
101,102,103,104 端末コンピュータ
10, 20
Claims (2)
診断対象である当該ウェブサイトを構成するウェブページのそれぞれのURLを記憶するリクエストURL記憶手段と、
所定期間のアクセスログ情報にもとづいて個々のウェブページについてスタートページとなった回数(スタート回数)を算出するスタート回数算出手段と、
該スタート回数算出手段により算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト外のものとなった回数(1ページでの離脱数)を算出する1ページ離脱数算出手段と、
前記スタート回数算出手段により算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト内のものとなった回数(2ページ以上到達数)を算出する2ページ以上到達数算出手段と、
該2ページ以上到達数算出手段により算出された2ページ以上到達数から前記1ページでの離脱数を差し引いた結果を前記スタート回数で除してなる数(アクセス継続度)を算出するアクセス継続度算出手段と、
該アクセス継続度算出手段により算出されたアクセス継続度と、前記スタート回数とをそれぞれのウェブページごとにプロットするプロット手段と
を有するウェブサイト診断装置。 A website diagnostic apparatus for diagnosing a website composed of a plurality of web pages from the viewpoint of access transition,
Request URL storage means for storing URLs of web pages constituting the website to be diagnosed;
Start number calculating means for calculating the number of times that each individual web page has become a start page (start number) based on access log information for a predetermined period;
A one-page departure number calculating means for calculating the number of times the page viewed next becomes out of the website (number of departures per page) among the start numbers calculated by the start number calculating means;
2 or more pages reached number calculating means for calculating the number of times that the next viewed page in the start number calculated by the start times calculating means (number of pages reached by 2 pages or more) is calculated;
Access continuity for calculating a number (access continuity) obtained by dividing the result obtained by subtracting the number of departures for one page from the number of arrivals for two or more pages calculated by the number of arrivals for two or more pages calculated by the means for calculating the number of arrivals. A calculation means;
A website diagnosis apparatus comprising: plotting means for plotting the access continuity calculated by the access continuity calculation means and the start count for each web page.
診断対象である当該ウェブサイトを構成するウェブページのそれぞれのURLを記憶するリクエストURL記憶ステップと、
所定期間のアクセスログ情報にもとづいて個々のウェブページについてスタートページとなった回数(スタート回数)を算出するスタート回数算出ステップと、
該スタート回数算出ステップにより算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト外のものとなった回数(1ページでの離脱数)を算出する1ページ離脱数算出ステップと、
前記スタートページ算出ステップにより算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト内のものとなった回数(2ページ以上到達数)を算出する2ページ以上到達数算出ステップと、
該2ページ以上到達数算出ステップにより算出された2ページ以降へ進んだアクセス数から前記1ページでの離脱数を差し引いた結果を前記スタート回数で除してなる数(アクセス継続度)を算出するアクセス継続度算出ステップと、
該アクセス継続度算出ステップにより算出されたアクセス継続度と、前記スタート回数とをそれぞれのウェブページごとにプロットするプロットステップと
を有するウェブサイト診断方法。 A diagnostic method in a website diagnostic apparatus for diagnosing a website composed of a plurality of web pages from the viewpoint of access transition,
A request URL storage step for storing each URL of a web page constituting the website to be diagnosed;
A start count calculating step for calculating the number of times that each individual web page has become a start page (start count) based on access log information for a predetermined period;
A one-page departure number calculating step for calculating the number of times that the next viewed page is outside the website (the number of departures per page) among the start numbers calculated in the start number calculating step;
A two-page or more reaching number calculating step for calculating the number of times that the next viewed page is within the website (the number of reaching two or more pages) among the starting times calculated in the start page calculating step;
A number (access continuity) is calculated by dividing the result obtained by subtracting the number of departures from one page from the number of accesses advanced to the second and subsequent pages calculated in the arrival number calculation step of two or more pages. Access continuity calculation step;
A website diagnosis method comprising: a plotting step of plotting the access continuity calculated in the access continuity calculation step and the start count for each web page.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004379554A JP2006185280A (en) | 2004-12-28 | 2004-12-28 | Web site diagnostic device and web site diagnostic method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004379554A JP2006185280A (en) | 2004-12-28 | 2004-12-28 | Web site diagnostic device and web site diagnostic method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006185280A true JP2006185280A (en) | 2006-07-13 |
Family
ID=36738340
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004379554A Pending JP2006185280A (en) | 2004-12-28 | 2004-12-28 | Web site diagnostic device and web site diagnostic method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006185280A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011257913A (en) * | 2010-06-08 | 2011-12-22 | Nec Biglobe Ltd | Content management apparatus, content management method, and program |
JP2013131227A (en) * | 2013-02-01 | 2013-07-04 | Nec Biglobe Ltd | Content management apparatus, content management method, and program |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002091852A (en) * | 2000-09-18 | 2002-03-29 | Seino Information Service Co Ltd | Access history acquiring method and information providing method |
JP2002123516A (en) * | 2000-10-12 | 2002-04-26 | Fuji Xerox Co Ltd | System and method for evaluating web site and recording medium |
-
2004
- 2004-12-28 JP JP2004379554A patent/JP2006185280A/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002091852A (en) * | 2000-09-18 | 2002-03-29 | Seino Information Service Co Ltd | Access history acquiring method and information providing method |
JP2002123516A (en) * | 2000-10-12 | 2002-04-26 | Fuji Xerox Co Ltd | System and method for evaluating web site and recording medium |
Non-Patent Citations (3)
Title |
---|
CSNB200100947001, ゼフ ロビン Robbin Zeff, インターネット広告論 初版 Advertising on the Internet second edition, 20010226, 第1版, 100ページ, 菊地 隆 株式会社流通科学大学出版 * |
CSND200500221013, 大澤 文孝, "サイト内行動や検索ワードが一目瞭然 即効使える!アクセス解析ツール", iNTERNET magazine 2nd STAGE No.116, 20040803, 138ページ, JP, 株式会社インプレス * |
CSND200500858010, 石井 研二, "実践講座 アクセス解析の傾向と対策", iNTERNET magazine 2nd STAGE No.120, 20041202, 104−105ページ, JP, 株式会社インプレス * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011257913A (en) * | 2010-06-08 | 2011-12-22 | Nec Biglobe Ltd | Content management apparatus, content management method, and program |
JP2013131227A (en) * | 2013-02-01 | 2013-07-04 | Nec Biglobe Ltd | Content management apparatus, content management method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8924409B1 (en) | Presentation of match quality in auto-complete suggestions | |
US20090319449A1 (en) | Providing context for web articles | |
EP2350884A2 (en) | Digital image retrieval by aggregating search results based on visual annotations | |
CN102222098A (en) | Method and system for pre-fetching webpage | |
CN105550359B (en) | Webpage sorting method and device based on vertical search and server | |
JP2008071259A (en) | Bookmark tag setting device | |
WO2021129122A1 (en) | Display method for book query page, electronic device and computer storage medium | |
CN112507230A (en) | Webpage recommendation method and device based on browser, electronic equipment and storage medium | |
JP2007249578A (en) | Attribute presumption program and attribute information providing system | |
CN111782946A (en) | Book friend recommendation method, calculation device and computer storage medium | |
US20110087659A1 (en) | Document relevance determining method and computer program | |
JP5232054B2 (en) | Information provision device | |
JP5466133B2 (en) | Document search apparatus with image and document search program with image | |
WO2014150383A1 (en) | Conducting search sessions utilizing navigation patterns | |
WO2015069258A1 (en) | Contextual browser composition and knowledge organization | |
Cheng et al. | Context-based page unit recommendation for web-based sensemaking tasks | |
JP5141144B2 (en) | Information retrieval system and information retrieval program | |
JP2007304644A (en) | Static web page creation method, program, recording medium, and static web page creation management system | |
JP2006185280A (en) | Web site diagnostic device and web site diagnostic method | |
US20090248673A1 (en) | Method of sorting web pages, search terminal and client terminal | |
JP6727097B2 (en) | Information processing apparatus, information processing method, and program | |
JP2008204198A (en) | Information providing system and information providing program | |
JP6339736B2 (en) | Manga search method and apparatus | |
JP5777663B2 (en) | Search support device and search support program | |
CN110825976B (en) | Website page detection method and device, electronic equipment and medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071227 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20080321 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100706 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101116 |