JP5134684B2 - ウェブページ構造分析を通したウェブサイトの情報把握方法 - Google Patents

ウェブページ構造分析を通したウェブサイトの情報把握方法 Download PDF

Info

Publication number
JP5134684B2
JP5134684B2 JP2010510216A JP2010510216A JP5134684B2 JP 5134684 B2 JP5134684 B2 JP 5134684B2 JP 2010510216 A JP2010510216 A JP 2010510216A JP 2010510216 A JP2010510216 A JP 2010510216A JP 5134684 B2 JP5134684 B2 JP 5134684B2
Authority
JP
Japan
Prior art keywords
web page
page
information
message
movement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010510216A
Other languages
English (en)
Other versions
JP2010530567A (ja
Inventor
ムン―ソン チェ,
マン―ジン ハン,
テ―キュン キム,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Isforu Co Ltd
Original Assignee
Isforu Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Isforu Co Ltd filed Critical Isforu Co Ltd
Publication of JP2010530567A publication Critical patent/JP2010530567A/ja
Application granted granted Critical
Publication of JP5134684B2 publication Critical patent/JP5134684B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/389Keeping log of transactions for guaranteeing non-repudiation of a transaction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • H04L63/0227Filtering policies
    • H04L63/0236Filtering by address, protocol, port number or service, e.g. IP-address or URL
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Hardware Design (AREA)
  • Accounting & Taxation (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明はウェブページ構造分析を通したウェブサイトの情報把握方法に係り、さらに詳しくは、クライアントサーバーに予めインストールされた追跡プログラムを通してウェブページの接続及び移動時毎に特定のメッセージを発生することによりウェブページの構造を分析する方式によりクライアントサーバーを使用する一般ユーザーの特定のウェブページの接続をはじめとするウェブサーフィン移動経路を把握してこれをデータベース化することによりウェブサイトの接続現況、ユーザーの関心分野、顧客関係管理(CRM)及びターゲット顧客管理などの種々の情報把握及び管理効果が得られるウェブページ構造分析を通したウェブサイトの情報把握方法に関する。
現在、特定のウェブページへのユーザー接続現況などの情報を把握するために、ログ分析が汎用されているが、ログ分析はウェブサイトの訪問者分析を通して訪問者数、ページビュー数、クッキー値分析などを通して訪問者の情報を分析してウェブサイトの状況を把握するためのものである。
このようなログ分析方法は、1)特定のウェブページを管理するウェブサーバーにログファイルを直接的に埋め込んでログファイルにおいて接続などの信号発生をデータ化してこのようなデータを分析するログファイル埋め込み方式、2)ウェブサイト内にスクリプトまたはコードを埋め込んでコード値を通してデータを生成及び分析するコード埋め込み方式、3)外部統計資料を通した間接的なログ分析方式などから構成されている。
ところが、上記の方式の中で、ログファイルを埋め込む方式の場合、接続者数が多数である場合、ログファイルのデータ量が膨大となって専門分析機関に依頼しない限り分析そのものが不可能になるという不都合があり、コードを埋め込む方式は、小数の訪問者数を持ったウェブサイトにおいては有用であるとはいえ、所定数以上の訪問客がウェブサイトに接続する場合にはむしろログファイル埋め込み方式よりも作業量が膨大となるという不都合があった。
また、何よりも前記ログ分析はウェブサイトにコードまたはログファイルを埋め込むことを余儀なくされるため、主としてウェブサイト運営者が自分が運営するウェブサイトの利用現況を調べる程度でしか活用せざるを得なかった。すなわち、運営者を中心にログ分析がなされるのが現実的なログ分析の限界であった。
ところが、自分が運営するウェブサイトの利用現況だけではなく、競争ウェブサイトの利用現況を戦略的に把握したり、特定の集団のユーザーが主としてどのウェブサイトを訪問するかの有無、広告主の場合、広告を行いたい多数のウェブサイトの中でどのウェブサイト及びウェブページに対するユーザー関心度が高いか、ユーザーのウェブサーフィン移動サイクルを通してCRMを分析しようとするときには自分の運営ウェブサイト以外のウェブサイトの接続現況を把握しなければならないため、現在知られているウェブサイトの運営者が主体となってログ分析を行う方式ではこのような他のウェブサイトの利用情報または顧客性向分析情報などを全く得ることができないという問題がある。
すなわち、益々競争が激しくなるウェブマーケティング分野において単に自分が運営するウェブサイトの接続現況だけを把握する既存のログ分析方式では決して競争業体よりは戦略マーケティング的優位を占めることができないだけではなく、ユーザーの要求事項に一時も早く対処可能な方法を提示することができないため、より新規で且つ特別なウェブサイト分析方法が望まれる。
このような目的に応えるための一例として、ウェブサイトの運営者ではないユーザーを主体としてユーザーのウェブサーフィン現況または移動経路を把握することにより特定の集団のユーザー別にウェブサイトの接続などの情報を抽出する方法を強求することができるであろう。
このとき、特定のユーザーが特定のウェブサイトに接続したかどうか、ウェブサーフィンの経路がどうなるかを把握するためには、先ず、ユーザーの接続がなされる特定のウェブページの構造を分析し、分析されたウェブページの構造に合う接続信号発生または諸信号処理がなされなければならないという前提条件が伴われる。
一般的に、ウェブページは、単一ページと、framesetまたはiframeを用いた複合ページとに大別できる。
単一ページは、最も一般的なウェブページ構造であり、htmlにおいてframesetとiframeなどのタグを使用することなく一つのURLアドレスだけをもって単一のウェブサーバーと連結されるウェブページのことをいい、複合ページは、framesetとiframeなどのタグを用いて一つのページにおいて異なるURLアドレスをもって単一または複数のウェブページと連結されたウェブページのことを言う。複合ページの場合、ページの移動を区分することができ、アドレスウィンドウに表示されるURLに相当するページであるメインページと、このメインページの内部にframesetまたはiframeにより発生するサブページとに区分することができる。
ユーザーが利用するインターネットウェブサイトはいずれもこのような単一または複合ウェブページから構成されているが、これらのウェブページは各ウェブサイト毎にリンクされている場合が多く、ユーザーの様々な移動が可能な状況であり、ユーザーはウェブページ移動をする場合にウェブページのダウンロード作業が全て終了された後に他のウェブページに移動するという特定の規則を有するのではなく、ウェブページのローディング中に移動、任意の中断などの不規則的な移動をすることになる。
より具体的には、ウェブページの構造分析のためには下記の複合的な問題を解決しなければならない。
1)ウェブページは単一または複合のウェブページから構成されており、ユーザーのウェブサーフィンによってこれらのウェブページが反復的に移動されるため、このようなウェブページの種類によって正確な構造分析が行われなければならない。
2)複合ページである場合、内部にサブページをもっており、これらのサブページのローディングが完了されなければ、全体的なページローディングが完了されないが、複合ページ内のサブページは認知しなければならない。
3)ウェブページの移動ではない再読み込みである場合、ページ内部のコンテンツだけが変更されるため、再読み込み時にページ内部のコンテンツが同じであるかどうかを把握しなければならない。
4)ページ内部のフレームのみが変わる場合、そのフレームが使用者が任意に選択して変えたものであるか、あるいは、ページ内において周期的に変えたものであるかを確認しなければならない。
5)単一ページは別途のサブページを保有していないため、このとき、サブページの存在確認以外の方法により単一ページの再読み込み有無を把握可能な方法を探らなければならない。
このため、自分が運営しない多数のウェブサイトの様々な利用状態を把握するためにユーザー中心のウェブページの移動状況をチェックしようとするとき、ユーザーのウェブページの移動状況をより正確に把握するためには、このような各種のウェブページの構造を正確に分析して、ユーザーがウェブページに接続してウェブ文書を全てダウンロードされたかどうか、再読み込み、不規則移動などの上述した様々な移動スタイルを把握することが必要である。
本発明は上記の技術の問題点を克服するためになされたものであり、その目的は、ログファイルやスクリプトをウェブサーバーに埋め込まないだけではなく、自分が運営するウェブサイト以外に他の運営者が運営する多数のウェブサイトの諸利用状況を把握するためにユーザーのウェブサイト利用現況情報をデータ処理してこれを分析する方式によるが、ユーザーのウェブサイト利用現況情報の取得のための基本前提となるユーザーのウェブページ移動経路を追跡するための一環としてウェブページ移動時に各ウェブページ毎にウェブページ移動メッセージを発生及びデータ処理する方法を提供するところにある。
本発明の他の目的は、単一ウェブページまたは複合ウェブページのように異なる構造からなるいかなるウェブページにおいても一様に高いレベルのウェブページ移動情報を取得するために、ウェブページ移動メッセージを時系列的に細分化してこれらをそれぞれのウェブページ移動スタイルによって管理処理する方法を提供するところにある。
本発明のさらに他の目的は、ウェブページの再読み込み時に、単一ページはブラウザーのタイトル変更有無をもって、複合ページはサブページの変更有無を把握するきめ細かい方式によりウェブページ移動有無を判断する方法を提供するところにある。
本発明のさらに他の目的は、ユーザー移動経路の把握のための追跡プログラムをクライアントサーバーにインストールし、追跡プログラム同士の通信を可能にしてこのような追跡プログラムを使用するユーザー間にウェブページ移動経路などのウェブページ利用情報を共有してより様々な情報を追求可能な方法を提供するところにある。
本発明のさらに他の目的は、前記追跡プログラムにおいて得られた情報を別途の管理サーバーに伝送してそれぞれのユーザーのウェブページ移動情報を体系的に分析することにより様々なウェブマーケティング資料として活用する方法を提供するところにある。
本発明のさらに他の目的は、インジケータ実行プログラムと連動されて、ウェブページに付着されたインジケータの正確な位置を再現し、再現された位置情報などを管理サーバーに記録、管理する方法を提供するところにある。
前記目的を達成するために、本発明によるウェブページ構造分析を通した情報把握方法は、ウェブページ移動開始時に移動開始メッセージを発生するが、前記移動開始メッセージは各ウェブページを識別するために発給されたIDを含む第1段階と、ウェブページ移動完了時に移動完了メッセージを発生するが、前記移動完了メッセージは当該ウェブページのURL情報及び自分が前記IDを通して当該ウェブページがメインページであるかサブページであるかを収録した所属情報を含む第2段階と、ウェブページローディングが全て完了したときにどのウェブページの移動が完了したかを分析した情報を含む文書完了メッセージを発生する第3段階と、前記メッセージを取り合わせてメッセージデータベースを生成する第4段階と、前記メッセージデータベースの分析を通して特定のユーザーの訪問状況及び接続現況のウェブサイト情報を把握する第5段階と、を含むことを特徴とする。
本発明によるウェブページ構造分析を通したウェブサイトの情報把握方法によれば、先ず、第一に、ユーザーのウェブサーフィン経路を分析してウェブサイト情報及び構造を把握することにより、ログファイルやスクリプトをウェブサーバーに埋め込まなくても済むだけではなく、自分が運営するウェブサイト以外に他の運営者が運営する多数のウェブサイトの諸利用状況を把握することができるというメリットがあり、第二に、単一ウェブページまたは複合ウェブページのように異なる構造からなるいかなるウェブページにおいても一様に高いレベルのウェブページ移動情報及びウェブサイト構造及び情報を取得することができるだけではなく、第三に、ウェブページ分析のためのプログラム間の通信を可能にしてこのようなプログラムを使用するユーザー間にウェブページ移動経路などのウェブページ利用情報を共有してより様々な情報を追求することができると共に、第四に、単一/複合ページの再読み込み有無、サブページの一部の変更有無を細かく把握することができ、最後に、インジケータと連動されて既存のブラウザー構造において行い難かったウェブページに付着されたインジケータの正確な再現を行うことができるだけではなく、インジケータをウェブ上において正確に実現するのに役立つと共に、ユーザーのターゲット広告及びCRM資料などの広範で且つ専門的な情報を取得することができるという効果を有する。
本発明によるウェブページ構造分析を通したウェブサイト情報把握方法の実行のために基本的に構成されるシステムを示すブロック図。 ウェブページにおいてインジケータが付着実現された状態を例示する使用状態図。 本発明によるウェブページ構造分析を通したウェブサイト情報把握方法の概略的な手続きを示す手順図。 本発明によるウェブページ移動時におけるメッセージの発生順序を示す概念図。 本発明による移動メッセージを通して生成されるウェブページのツリー構造を示す概念図。 本発明によるページ完了状態を確認する状態を示す概念図。 複合ページの再読み込み時にページの移動有無を把握する手続きを示す概念図。 単一ページの再読み込み時にページの移動有無を把握する手続きを示す概念図。 サブページの変更によりサブページの移動サイクルのみが変更されたときにページ移動有無を判断する手続きを示す概念図。
以下、添付図面に基づき、本発明の好適な実施形態を詳述する。添付図面は縮尺によって図示されたものではなく、各図中の同じ参照符号は同じ構成要素を示す。
図1は、本発明によるウェブページ構造分析を通したウェブサイト情報把握方法の実行のために基本的に構成されるシステムを示すブロック図である。
先ず、本発明において言及されるウェブページはページとも呼ばれ、作業IDもまたスレッドID、IDとも呼ばれる。
本発明は、ウェブページの構造分析及びユーザーのウェブページ移動経路把握を通してログ分析以上のウェブサイト活用情報を得るものであるため、先ず、それぞれのユーザーがインターネット利用のために使用するクライアントサーバーにユーザーウェブページ移動経路分析のためのプログラムがインストールされていなければならない。本発明においてはこれを追跡プログラム200といい、このような追跡プログラム200はユーザーの認識有無とは無関係にクライアントサーバーにインストール可能である。
この追跡プログラム200は様々な戦略によってクライアントサーバーにインストールすることが可能であるが、例えば、本出願人が権利者である特許第705474号「ウェブページにおいてインジケータを用いた情報表示及び管理システム」において説明されたインジケータ100(すなわち、各種の特定の情報を収録してウェブページの特定のコンテンツの周辺に積層可能であると共に、ユーザー間の情報共有がなされうる情報表示ウィンドウを意味する)の使用のために実行されるインジケータ実行モジュール230を追跡プログラム200内に搭載して自然にインジケータ実行モジュール230と一緒にクライアントサーバー内にインストール可能である。
図2は、ウェブページにおいてインジケータ100が付着実現された状態を例示する使用状態図である。
より具体的にインジケータ100を説明すると、本発明において言うインジケータ100とは、ウェブページに収録された文書、図柄、動画などに相当する部分に表示されるものであり、まるで一般ノートまたは文書に貼り付けるメモ紙、例えば、3M社の商標名ポストイットと同じ機能を行うウェブ上におけるオンラインメモ紙であると表現することができる。
具体的に、インジケータ100は、所定のサイズからなるブロック空間が与えられてこの空間内に当該ウェブページの内容に対する評価及び敷衍説明、メモなどを行うことができ、必要に応じて、当該インジケータ100を読み込むと、インジケータ100を表示した状態でウェブページが活性化されるのである。
このようなインジケータ100は、自体的な情報、すなわち、インジケータ100内の内容、ウェブページにおける付着位置、付着されたウェブページのURLアドレスなどの情報を保有しており、このようなインジケータ関連情報はインジケータ実行モジュール230に保存されて管理サーバー300に伝送可能である。
この後、管理サーバー300はこのようなインジケータの存在/位置/内容情報を別途のデータベースに分類して記録、管理することになり、このようにしてDB化されたインジケータ情報を通して既存のブラウザにおいてウェブページ上に別途に付着されたウェブ文書までは把握し難かった短所を克服し、正確にウェブページに付着されたインジケータの位置を把握することができ、このようなインジケータを使用するユーザーの具体的な情報を抽出することができ、さらには、これを通してユーザーのターゲット広告、CRM資料として活用可能になる。
もちろん、ユーザーが追跡プログラム200のインストールを認知した場合、ユーザープライバシー保護次元で本発明の核心であると言えるユーザーウェブページ移動探索機能を任意に制限することもできる。
図1を参照すると、本発明によるウェブページ構造分析を通したウェブサイト情報システムは、メッセージデータベース222を管理及び分析するメッセージ分析モジュール310を備えた管理サーバー300、クライアントサーバーにインストールされてユーザーのウェブサーフィン移動経路を追跡し、ウェブページ構造分析のための資料を設け、インジケータ実行モジュール230及びインジケータ確認モジュール240を内蔵した追跡プログラム200から構成されている。追跡プログラム200は、本発明による核心機能であるウェブページの移動経路を把握するための手段であり、メッセージ発生モジュール210とメッセージ保存モジュール220、インジケータ実行モジュール230、インジケータ確認モジュール240から構成されている。
メッセージ発生モジュール210は、後述する3種類のウェブページ移動メッセージを移動過程別に発生する機能を行うものであり、メッセージ保存モジュール220は、このようなウェブページ移動メッセージを保存してデータベース化(メッセージデータベース222)して管理サーバー300に伝送する機能を有する。また、インジケータ実行モジュール230は前記インジケータ100の生成及び実行、情報収録機能をし、インジケータ確認モジュール240は移動されるウェブページにおいてインジケータ100が存在するかどうかを把握する機能をする。
管理サーバー300は前記メッセージデータベース222を伝送されて保存、管理し、メッセージ分析モジュール310を通して前記メッセージデータベース222を分析してウェブページ構造及びこれを含むウェブサイトの構造を分析するだけではなく、ユーザー別、ウェブページ別に様々な接続統計資料を算出することができ、前記インジケータ確認モジュール240のインジケータ情報を伝送されてウェブページに付着されたインジケータ100の存在及び位置などの情報を収集及び管理する役割を果たす。
図3は、本発明によるウェブページ構造分析を通したウェブサイト情報把握方法の概略的な手続きを示す手順図である。
図3から明らかなように、本発明による方法は、大きく3種類のページ移動メッセージをウェブページ移動開始から移動完了に至るまで順次に発生する段階から構成されているが、先ず、ウェブページ移動メッセージについて説明する。
ウェブページ移動メッセージは、ユーザーによるブラウザーの起動時から発生してブラウザーの終了時まで持続的に発生されるメッセージのうち下記のメッセージを言う。
1)ページ移動開始メッセージ−ユーザーがアドレスウィンドウにURLを直接的に入力したり、ウェブページのリンクをクリックしたときにウェブページの移動が開始される場合にメッセージ発生モジュールにおいて発生されるメッセージをいう。このページ移動開始メッセージを通して全てのウェブページ当たりに一つのスレッドID(ID、作業IDとも呼ばれる)を得ることができる。もし、ブラウザーが最初に接続された場合、すなわち、最初に特定のウェブページを接続した場合には新規なスレッドIDを得ることができ、これは後述する。
2)ページ移動完了メッセージ−移動されたウェブページ情報を全て受信した後、モニター上にウェブページをディスプレイする直前に発生するメッセージを意味する。このページ移動完了メッセージは、後述するが、URL情報、ID情報などを含むことになる。
3)文書完了メッセージ−ウェブページの全ての作業が完了して発生するメッセージをいう。この文書完了メッセージは一つのスレッドが完了する度に発生するものであり、サブページ完了及び全てのスレッド完了などの判断をするために必ず必要とされるメッセージである。
これは、最上位のスレッドが最後に発生してページの移動が完了可能であるが、移動完了後、iframeまたはframesetなどによりページ内部の一部だけが変更されて使用者が他のページとして認識する場合を把握しようとするときに有効に活用される。
さらに、インジケータの存否をこの文書完了メッセージの発生段階において把握することになる。
これらの3種類のウェブページ移動メッセージをウェブページ移動過程(もちろん、後述するが、単一ページと複合ページの移動順序には違いがある)によって発生することによりウェブページ構造把握のための資料として活用することになる。
ここで、作業ID(スレッドID、ID)とは、ページ移動サイクル当たりに発生するウェブページ識別記号を意味し、これは、後述するが、サブページ毎にページ完了/文書完了メッセージがランダムに発生するときにサブページなどの正確な出典を認識させるのに有効に使用される。
先ず、ブラウザーの発生メッセージを得るためには、COMのメッセージインボウク機能を利用しなければならず、ブラウザーは各URL当たりに一つのスレッドを生成して各ウェブページ移動を独立的に行うが、結果的にウェブページ移動は直列移動ではなく、並列的な移動方法(後述する図面において詳述する)により行われる。このため、ウェブページ構造の把握のために全ての移動メッセージが発生するときに各移動メッセージ、具体的に特定のIDがどのスレッド(または、どの最上位ID)に属するか、どの状態であるかを把握しなければならない。
これを解消するために、本発明においては、ウェブページと関連する各種の情報を生成、抽出するための移動メッセージの発生過程を経るが、移動メッセージの発生順序をより具体的に説明すれば、下記の通りである。
ウェブページの移動が開始されると、ページ移動開始メッセージが発生し、ここで、当該URLのスレッドID(ID、作業IDとも呼ばれる)とその他の追加情報を得ることができる。もし、この移動開始メッセージがブラウザー開始後に最初に発生したものであれば、ウェブページ移動を区分可能な最上位作業IDを得ることが可能になる。
この後、当該ページの情報の受信が完了すると、ページ移動完了メッセージが発生される。このとき、どのスレッドに相当するメッセージであるかを確認するが、具体的に、前記移動開始メッセージ発生段階において生成されたIDを通して現在移動完了されたウェブページがどのメインページまたは最上位ページのIDに関連するものであるかを分析する過程を通して達成可能である。
さらに、移動完了メッセージ発生段階においては、当該URLを抽出する過程を通して正確なURLアドレスを得ることができる。ここで、移動開始時にURLを抽出しない理由は、開始時に発生するURLの情報は使用者が入力などの理由により正確ではないURLである可能性があり、当該ウェブサイトを管理するウェブサーバーのURL関連システムにおいてこれを任意に変更することができるためであり、結局、この理由から、ウェブページの情報が確定されて全て受信した以降である移動完了時にURLを抽出するのである。
これらの2種類のメッセージが発生する間の各移動作業当たりの各ID、URL、ID発生順序などの情報をツリー構造で分析したメッセージデータベース生成を通してページの構造を把握する。
最後に、文書完了メッセージが発生すると、既存に把握されたウェブページツリー構造からなるメッセージデータベース内においてどのウェブページの作業が完了されたかを把握し(もし、最初に訪問したウェブサイトである場合には前記確認作業後に新たに訪問されたウェブサイトに対する新規ツリー構造が生成されるであろう)、内部ページの完了である場合と最上位作業の完了であるかを確認する方式によってウェブページ完了作業を処理する。
この後、このような各ウェブページに対する3種類の移動メッセージはメッセージデータベースとして生成されてこれを管理サーバーに伝送し、管理サーバーにおいてはこのようなメッセージデータベースを通してウェブサイトの構造分析、メインページの訪問統計、サブページの訪問統計、訪問時間などのウェブサイトの接続現況などの情報だけではなく、特定のユーザーのウェブサイト訪問状況を分析してCRM資料、顧客管理資料として活用することができ、さらに、インジケータを使用するユーザーを対象としてターゲット広告を行える基盤が得られる。
図4は、本発明によるウェブページ移動時におけるメッセージの発生順序を示す概念図である。
先ず、図4を説明する前に、ウェブサイトを構成する基本的なウェブページの構造について述べる。
ウェブページ構造はクライアント画面上に現れるページの構造を言うものであり、一つのURLからなる単一ページ構造と多数のURLアドレスからなる複合ページ構造がある。複合ページ構造の場合、ページの移動を区分することができ、アドレスウィンドウに表示されるURLに相当するページであるメインページ(最上位ページ)とこのメインページの内部にiframeまたはframesetとして生成されるサブページとに分けられる。
メインページはページ転換を区分可能なページの基本単位の意味を有する。フレームを使用しないページは一つのURLに合致する一つのページだけが存在するが、framesetを使用する場合、メインページには内部ページのURLからなるフレームタグだけで構成され、クライアント画面上に現れるあらゆる内容は内部のフレームにおいて処理する。複合ページにおいて一般的に知られている方式によれば、メインページの転換により基本的なページ転換を確認することができるが、内部ページ変更または再読み込みなどは確認することができない。
サブページはメインページの下位に含まれる全てのページを言うが、ページ移動区分を把握しようとするときにサブページだけで確認することはできないが、間接的な法案として活用可能であり、例えば、サブページの移動/変更情報を通して複合ページの再読み込みまたは内部ページ変更を確認することができる。
このため、複合ページの場合には、特にサブページの変化有無を注目する必要があり、このために、本発明による方法は、サブページに対しても別途の3種類からなる移動メッセージを発生し、これらのサーバーページのメインページへの従属関係を観察することになり、正確なウェブサイトの全体構造を把握しようとする。
図4から明らかなように、複合ページに移動される場合、メインページのページ移動開始メッセージを開始として内部コンテンツをローディングする過程と同時にページ移動完了メッセージが発生される。このとき、ページ中に他のサブページが存在する場合、サブページのページ移動開始/完了/文書完了メッセージが発生するが、ページ移動開始メッセージは順次に発生するが、その他の移動完了/文書完了メッセージはランダムに発生する順序を有する。
その理由は、各ページ当たりに一つのスレッドが生成されて同時にページ移動が行われるため、当該ウェブページの内部コンテンツのローディングが完了される時点を待つことにより、メッセージ発生順序を敢えて遅らせる必要がないためであり、すなわち、スレッドを割り当てるページ移動開始時にのみID発給段階を含む状態において順次にページ移動開始メッセージが発生して一旦ID確保を先行し、その後にはサブページのコード量、ローディング時間によってそれぞれその他のメッセージが発生されるのである。この後、終局的にメインページの文書完了メッセージが発生すると、当該ページ移動が完了されるものとみなし、このようなウェブページの構造、すなわち、URL情報、他のウェブページにおいて発行されたIDの連関関係を通したメインページまたはサブページ有無が分析される。
図5は、本発明による移動メッセージを通して生成されるウェブページのツリー構造を示す概念図である。
ウェブページツリー構造は、メッセージデータベースをウェブページ別に分かり易くまとめた情報であり、すなわち、ウェブページ構造をメイン情報からサブ情報に至るまで枝構造にすることにより、全体的にツリー形式で表現した方式であって、最上位ページ(メインページ)を基準として下位ページ(サブページ)に枝打ちをしていく構造である。
このようなツリー構造としてメッセージデータベースを設けてウェブページを分析すると、本発明による方法において作業所要時間を削減しながらメインページ、サブページなどの位置と所属情報をより手軽に探索することができ、新たなページの追加及び削除変更の把握が容易であるというメリットを有することになる。併せて、既に接続されたウェブサイトの場合にはウェブサイト構造に関するツリー構造が既に保存されている状態であるため、既に保存されたツリー構造と比較してより迅速に情報処理を行える特性を有することになる。
上述したように、ページ移動メッセージを通してウェブページの構造を類推するために、先ず、ページ移動開始メッセージ発生段階において各ページを区分可能なIDを与えるが、このようなIDもまたページツリー構造内に保存されていることになる。
もし、特定のウェブページを最初に移動する場合、移動開始メッセージ発生段階において生成された作業IDはブラウザーの移動作業が終わるまで持続的に維持されて移動作業に対する識別機能を担保することになる。
このように最初に移動されて発生された作業ID以外に発生するページの作業IDはいずれもランダムに生成される。ページの移動時にも新たに発生され、ページの再読み込みの場合にも新たに発生される。
このため、管理サーバーにおけるこのようなIDの比較作業及び既存IDと新規IDにおけるURL情報の一致有無を判断する過程を通して特定のウェブページの接続回数、ウェブページの移動有無を把握することが可能になる。
しかしながら、複合ページにおいて一部のページだけが変更される場合、作業IDは新たに与えられないことを基本とする。
このような原則に即して、ページの変更状態が一般的なページ移動であるか、それとも、一部が変更されて新たなページとして認識されなければならない場合であるかを判断することができる。
次に、ウェブページの構造分析のために発生及び記録されるメッセージデータベースを構成するデータ、すなわち、ID、URL情報、移動メッセージ発生順序情報などの使用意味について述べる。
ページ移動開始メッセージが発生すると、新規な接続状態であるかどうかを分析するために当該ウェブページの最上位ページIDが予め保存されているかどうかを確認する。保存されていない状態であれば、ブラウザーが最初に開始されて未だ最初作業IDが与えられていない場合であるため、新たな最上位ページIDを与える。
既に最上位ページのIDが与えられた場合であれば、2種類の場合に区分可能である。
すなわち、最初IDが再発生された場合にはウェブページの移動が新たに開始されるものと把握可能であり、最初IDではない他のIDが発生された場合にはページの移動ではない複合ページ内部のサブページの開始であることを把握することができる。
単一ページの場合、ページ移動サイクルが1回なされることにより、サブページの情報は存在しないため、ID情報だけでウェブページ構造分析が可能であり、但し、単一ページのURLを付加情報として十分に活用することができる。
これに対し、複合ページの場合、ページIDだけでは再読み込み状態であるか、それとも、一部変更であるかを把握することが困難であるため、ID以外にページのURL及びページ生成順序などの情報が発生及び記録される必要がある。
すなわち、複合ページにおいてはメインページ以下のサブページが存在するため、メインページのID情報以外にサブページの作業ID、サブページのURL、サブページの発生順番などの情報をページツリー構造に記録管理してこのようなID比較、URL比較、サブページの発生順序情報を総合的に分析して全体的な複合ページの移動有無または構造を把握することができるため、複合ページにおいては必須的にURL情報及びサブページ発生順序情報が利用される。
以下、単一ページ及び複合ページの移動完了有無を確認する手続きをより詳細に説明する。
図6は、本発明によるページ完了状態を確認する状態を示す概念図である。
単一ページの場合、単一ページ移動サイクルが1回発生し、下位にいかなるサブページを保有していないため、別途のツリー構造の記録なしに3種類の移動メッセージの発生によってページ完了有無を把握する。
複合ページの場合、メインページ移動サイクルの下位に多数のサブページ移動サイクルが存在するため、メインページとサブページを区分する必要があるが、具体的に、メインページ移動開始メッセージの発生後に下位のサブページ移動メッセージがローディング順序によってランダムに発生されて全てのサブページの移動過程が完了すると、メインページ移動サイクルの文書完了メッセージが発生する過程を経ることになる。
この過程において、メインページ文書完了メッセージが存在するかどうかによって複合ページ移動完了を把握することができる。
図7は、複合ページの再読み込み時にページの移動有無を把握する手続きを示す概念図である。
前記図5に示すように、ページツリー構造が正確に作成されたならば、その後に当該ウェブページを訪問したときに全体的なウェブページ構造を把握することが便利になる。
特に、複合ページは下位に多数のサブページが存在するため、今後の管理(再読み込みなど)のためにサブページに関する情報をページツリー構造に詳しく記録する必要がある。
具体的に、図7を参照すると、複合ページにおいて再読み込みが発生する場合、メインページを除く全てのサブページのリロードが発生する。このときに発生されるページ移動サイクルのIDはいずれも新たに発生されて以前ページ作業IDとは全く異なるIDが発生される。
このため、文書完了メッセージ発生後再びページ移動開始メッセージが発生した場合、作業IDが以前に作成されたページツリー構造に含まれないかとメインページのIDではないかを確認して、両方ともに該当しないならば、複合ページの再読み込みであることを把握することが可能になる。
図8は、単一ページの再読み込み時にページの移動有無を把握する手続きを示す概念図である。
単一ページは下位のページそのものがない。このため、複合ページでのように下位ページのメッセージ発生によりページ再読み込みを推察することができない。これを防止するために、下記の2種類のメッセージをさらに用いて単一ページの再読み込み状態にも対応することができる。
すなわち、タイトル変更メッセージはブラウザーのタイトルが変更されたときに発生するメッセージであり、ダウンロード完了メッセージはページ内の全てのコンテンツのダウンロードが完了したときに発生するメッセージである。
換言すると、単一ページの再読み込みが開始されると、最初に発生するメッセージの一つがタイトル変更メッセージである。ページ移動完了後、もし、ページ移動開始メッセージが発生しない状況においてタイトル変更メッセージが発生し、ページの構造も単一ページであれば、ページの再読み込みが起こりうる状況であることを想定しなければならない。すなわち、再読み込みであるという概念が既にウェブページのローディングが完了された後になされる行為であるため、ウェブページが単一ページであるという情報を確認した後に後続するメッセージ発生有無及び種類によって再読み込み状態を把握するのである。
換言すると、文書完了メッセージ発生後に別途の移動開始メッセージが発生せず、タイトル変更メッセージ及び文書の完了の確定を知らせるダウンロード完了メッセージの有無により単一ページの再読み込み状態を把握することが可能になる。
ここで、タイトル変更メッセージ発生状況をページ再読み込みであると断定することなく、単に仮定のみする理由は、タイトル変更メッセージはページ内においてスクリプト修正などにより発生する余地があるためであり、このため、タイトル変更ではページ移動の開始が予想されるということのみを認識し、タイトル変更メッセージ後にダウンロード完了メッセージが発生されるとページの再読み込みが発生されたものと認識する。
図9は、サブページの変更によりサブページの移動サイクルのみが変更されたときにページ移動有無を判断する手続きを示す概念図である。
ウェブサイトの製作方法によって内部のフレームにより掲示板を実現してメインページの変化なしにフレーム内部の掲示板だけを変更してサイトの情報を表示する方法と、ページの広告をフレームにより製作して所定の時間に1回ずつ他の広告に交替する方法が存在する。
このとき、2種類の方法が両方とも内部のページがページ移動サイクルを発生させるが、最初の掲示板の場合、使用者は変更前と変更後を異なるページとして認識するのに対し、広告の場合に修正されるとしても新たなページとして認識しない。このため、サブページの移動時には新たなページとして認識するか、それとも、無視しなければならない移動であるかを判断しなければならない。
メインページではないサブページのみが変更される場合、サブページの作業IDは新たに与えられることなく、以前の作業IDを有している。このため、この作業IDをもってページ構造ツリーにおいてどのページに当該するかを見出す。そして、新たに移動するURLと保存された既存のURLが異なる場合、ページの変更であると認識しなければならず、そうではなく、同じURLであれば、ページの変更を無視する。
そして、URLが異なる場合であれば、新たなURLの状態によって下位のサブページが追加される場合があるが、このページもまた無視することなくページツリー構造に追加しなければならない。
このような過程を経て本発明による方法を通して特定のユーザーのウェブページの移動経路を把握することが可能になり、すなわち、特定のユーザーのウェブサーフィン移動経路を収集したデータを収録したメッセージデータベースが管理サーバーに伝送されて、管理サーバーにおいては移動メッセージデータベースの分析を通して各ウェブサイトの接続現況、特定のユーザーの接続経路分析などの具体的な統計資料を把握することができる。
また、もし、ウェブページにインジケータが付着されている場合、管理サーバーはインジケータに関する情報まで収集してインジケータの付着位置などの情報及び資料を把握することも可能になる。
具体的に、文書完了メッセージが生成される段階において、インジケータにおいて伝送する情報が存在するかどうかを確認して、もし存在する場合、当該インジケータの存在情報を文書完了メッセージと一緒に前記管理サーバーに伝送して、前記管理サーバーはこのようなメッセージデータベースにインジケータ存在情報を含めることができる。
あるいは、文書完了メッセージが発生すると、文書の情報を管理サーバーに伝送して当該文書に存在するインジケータを探索して再伝送してウェブページにインジケータを含めて使用者に表示してもよい。
現在のブラウザー構造だけでは上述したインジケータの位置または存在情報を把握することが困難であったが、本発明による方法及びこのようなインジケータ存在情報を通して特定のウェブページに付着されたインジケータの正確な位置情報を再現することができ、さらに、このような情報を収集して管理サーバーに記録/管理/保存可能であり、これにより、インジケータ使用ユーザーを対象としてターゲット広告を行うこともできると共に、その他の既存のログ分析を通して具体的に把握できなかった情報を収集することができる。
上述したように、本発明によるウェブページ構造分析を通したウェブサイト情報把握方法の構成及び作用を前記説明及び図面に表現したが、これは単に例にとって説明したものに過ぎず、本発明の思想が前記説明及び図面に限定されず、本発明の技術的思想を逸脱しない範囲内において種々の変化及び変更が可能であることはもちろんである。
100 インジケータ、
200 追跡プログラム、
210 メッセージ発生モジュール、
220 メッセージ保存モジュール、
230 インジケータ実行モジュール、
240 インジケータ確認モジュール、
300 管理サーバー、
310 メッセージ分析モジュール、

Claims (9)

  1. ウェブページ構造分析を通したウェブサイト情報把握方法であって、
    クライアントサーバーが、ユーザーがアドレスウィンドウにURLを直接的に入力したり、ウェブページのリンクをクリックしたときにウェブページの移動が開始される時に移動開始メッセージを発生するが、前記移動開始メッセージは当該ウェブページを識別するために発給されたIDを含む第1段階と、
    クライアントサーバーが、ウェブページ移動完了時に移動完了メッセージを発生するが、前記移動完了メッセージは当該ウェブページのURL情報及び前記移動開始メッセージ発生段階において生成されたIDを通して現在移動完了されたウェブページがどのメインページまたは最上位ページのIDに関連するものであるかを分析する過程を通して達成される情報を含む第2段階と、
    クライアントサーバーが、ウェブページローディングが全て完了したときにどのウェブページの移動が完了したかを分析した情報を含む文書完了メッセージを発生する第3段階と、
    クライアントサーバーが、前記メッセージを取り合わせてメッセージデータベースを生成する第4段階と、
    管理サーバーが、前記メッセージデータベースの分析を通して特定のユーザーの訪問状況及び接続現況のウェブサイト情報を把握する第5段階と、
    を含むことを特徴とする、
    ウェブページ構造分析を通したウェブサイト情報把握方法。
  2. 複数のウェブページを移動する場合、前記第1から第3段階におけるメッセージの発生順序段階は、
    前記移動開始メッセージはクライアントサーバーによってウェブページ別に順次に発生され、前記移動完了メッセージと文書完了メッセージは前記移動開始メッセージ発生後ローディング順序によってランダムにクライアントサーバーによって発生される段階からなり、
    クライアントサーバーが、前記メッセージ発生順序を収録した情報を前記メッセージデータベースに保存する段階を含むことを特徴とする、
    請求項1に記載のウェブページ構造分析を通したウェブサイト情報把握方法。
  3. 前記第4段階は、
    クライアントサーバーが、前記第1から第3段階において発生した各メッセージを通して特定のウェブサイトの複数のウェブページをメインページからサブページまでツリー構造で把握したメッセージデータベースを生成することを特徴とする、
    請求項1に記載のウェブページ構造分析を通したウェブサイト情報把握方法。
  4. 前記第1段階は、
    クライアントサーバーが、当該ウェブページに対する最初訪問であるかどうかを把握するために、前記メッセージデータベースにおいて当該ウェブページに対するID情報が保存されているかどうかを確認する段階を含むことを特徴とする、
    請求項1に記載のウェブページ構造分析を通したウェブサイト情報把握方法。
  5. ウェブページが複合ページの再読み込み状態である場合、
    管理サーバーが、サブページにおいて発行されたIDが既存のIDと一致するかどうかを比較分析する過程を通して複合ページの再読み込み状態を把握する段階を含むことを特徴とする、
    請求項1に記載のウェブページ構造分析を通したウェブサイト情報把握方法。
  6. ウェブページが単一ページの再読み込み状態である場合、
    タイトル変更メッセージを生成する段階と、
    ウェブページの内部コンテンツのダウンロード完了時にダウンロード完了メッセージをさらに生成する段階と、
    を含み、
    前記タイトル変更メッセージとダウンロード完了メッセージの有無をもって単一ページの再読み込み状態を把握することを特徴とする、
    請求項1に記載のウェブページ構造分析を通したウェブサイト情報把握方法。
  7. 複合ページにおいてサブページのみが変更された場合、
    サブページの作業IDを再生成することなく維持する段階と、
    維持されたIDを通して前記メッセージデータベースにおいて当該ウェブページの位置を検索する段階と、
    現在のURL情報と検索されたウェブページのURL情報が異なる場合、ウェブページが変更されたものと認識する段階と、
    をさらに含むことを特徴とする、
    請求項1に記載のウェブページ構造分析を通したウェブサイト情報把握方法。
  8. 前記第3段階は、
    クライアントサーバーが、当該ウェブページに別途に付着されたインジケータが存在するかどうかを確認して、インジケータが存在する場合に別途のインジケータ存在情報を生成することを特徴とする、
    請求項1に記載のウェブページ構造分析を通したウェブサイト情報把握方法。
  9. 前記インジケータ存在情報は、インジケータ位置情報、内容情報を含んで別途のデータベースに保存されることを特徴とする、
    請求項8に記載のウェブページ構造分析を通したウェブサイト情報把握方法。
JP2010510216A 2007-05-29 2008-05-29 ウェブページ構造分析を通したウェブサイトの情報把握方法 Expired - Fee Related JP5134684B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020070052016A KR100755468B1 (ko) 2007-05-29 2007-05-29 웹 페이지 구조 분석을 통한 웹 사이트의 정보 파악 방법
KR10-2007-0052016 2007-05-29
PCT/KR2008/003023 WO2008147126A1 (en) 2007-05-29 2008-05-29 Method for grasping information of web site through analyzing structure of web page

Publications (2)

Publication Number Publication Date
JP2010530567A JP2010530567A (ja) 2010-09-09
JP5134684B2 true JP5134684B2 (ja) 2013-01-30

Family

ID=38736504

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010510216A Expired - Fee Related JP5134684B2 (ja) 2007-05-29 2008-05-29 ウェブページ構造分析を通したウェブサイトの情報把握方法

Country Status (7)

Country Link
US (1) US8392470B2 (ja)
EP (1) EP2171612A4 (ja)
JP (1) JP5134684B2 (ja)
KR (1) KR100755468B1 (ja)
CN (1) CN101689176A (ja)
RU (1) RU2424562C1 (ja)
WO (1) WO2008147126A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100938816B1 (ko) * 2008-12-29 2010-01-26 주식회사 로그 접속자별 접속 통계 정보 제공 방법 및 시스템
WO2011087171A1 (ko) * 2010-01-18 2011-07-21 주식회사 로그 접속자 단말에서 발생한 이벤트의 유형을 판단하는 방법
CN102073678B (zh) * 2010-12-03 2013-02-27 厦门市美亚柏科信息股份有限公司 一种网站信息分析系统及其方法
US8850308B1 (en) * 2011-03-11 2014-09-30 Amazon Technologies, Inc. Automated determination of website structure
US9430118B2 (en) * 2011-04-19 2016-08-30 International Business Machines Corporation Spatially-oriented traversal animations for network address transitions
US10324916B2 (en) 2012-02-22 2019-06-18 Nokia Technologies Oy Predictive service access
CN103678321B (zh) * 2012-09-03 2017-11-24 阿里巴巴集团控股有限公司 页面元素确定方法及设备、用户行为路径确定方法及装置
KR101401948B1 (ko) * 2012-11-19 2014-05-30 한국인터넷진흥원 대규모 웹사이트 방문점검 방법
US9841863B1 (en) * 2012-12-20 2017-12-12 Open Text Corporation Mechanism for partial page refresh using URL addressable hierarchical page structure
CN103971244B (zh) 2013-01-30 2018-08-17 阿里巴巴集团控股有限公司 一种商品信息的发布与浏览方法、装置及系统
US9614862B2 (en) * 2013-07-24 2017-04-04 Nice Ltd. System and method for webpage analysis
CN104423973B (zh) * 2013-08-20 2020-02-18 腾讯科技(深圳)有限公司 浮动框架页面加载信息的处理方法、装置及系统
US10460015B1 (en) * 2015-03-27 2019-10-29 Open Text Corporation Assimilation in multi model webpage composition
CN104951311B (zh) * 2015-07-03 2018-04-24 北京京东尚科信息技术有限公司 一种页面制作方法及装置
RU2682863C1 (ru) * 2017-12-15 2019-03-21 Общество с ограниченной ответственностью "САЙТСЕКЬЮР" Система и способ оценки веб-сайта на соответствие законодательству о персональных данных
CN113065055B (zh) * 2021-04-21 2024-04-02 深圳赛安特技术服务有限公司 新闻资讯抓取方法、装置、电子设备及存储介质

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6014638A (en) 1996-05-29 2000-01-11 America Online, Inc. System for customizing computer displays in accordance with user preferences
JPH11345202A (ja) 1998-06-03 1999-12-14 Hitachi Ltd サービス提供形態のカスタマイズ方法
JP3437933B2 (ja) * 1999-01-21 2003-08-18 インターナショナル・ビジネス・マシーンズ・コーポレーション ブラウザ共有方法及びシステム
US6393479B1 (en) * 1999-06-04 2002-05-21 Webside Story, Inc. Internet website traffic flow analysis
DE60114999T2 (de) * 2000-03-14 2006-09-07 Speed-Trap.Com Ltd., Newbury Überwachung von und interaktion mit netzwerkdiensten
US6895111B1 (en) * 2000-05-26 2005-05-17 Kidsmart, L.L.C. Evaluating graphic image files for objectionable content
JP2002117206A (ja) * 2000-07-28 2002-04-19 Toshiba Corp Web視聴者分析方法、Web視聴者分析プログラム、記録媒体、Web視聴者分析システム
US7305622B2 (en) * 2000-12-05 2007-12-04 Clickfox, Llc Graphical user interface and web site evaluation tool for customizing web sites
US7165105B2 (en) * 2001-07-16 2007-01-16 Netgenesis Corporation System and method for logical view analysis and visualization of user behavior in a distributed computer network
US20040268233A1 (en) * 2002-06-27 2004-12-30 Oki Electric Industry Co., Ltd. Information processing apparatus and information processing method
US20040205514A1 (en) * 2002-06-28 2004-10-14 Microsoft Corporation Hyperlink preview utility and method
US20040039776A1 (en) * 2002-08-26 2004-02-26 Eugene Ballard System and method for efficient data refresh
KR100501410B1 (ko) * 2002-11-27 2005-07-18 한국전자통신연구원 서블릿 프로그램의 재사용 가능한 비즈니스 로직으로부터이제이비 컴포넌트를 생성하는 시스템 및 방법
CA2418568C (en) * 2003-02-10 2011-10-11 Watchfire Corporation Method and system for classifying content and prioritizing web site content issues
KR20030040263A (ko) * 2003-04-07 2003-05-22 주식회사 드림나우 인터넷 홈페이지 이용자의 행태 정보 획득 방법 및 그 장치
JP2005189942A (ja) * 2003-12-24 2005-07-14 Nec Corp Webサイトアクセス状況の集計方法、そのシステム、およびプログラム
US7672865B2 (en) * 2005-10-21 2010-03-02 Fair Isaac Corporation Method and apparatus for retail data mining using pair-wise co-occurrence consistency
US20080046562A1 (en) * 2006-08-21 2008-02-21 Crazy Egg, Inc. Visual web page analytics
CN101131747B (zh) * 2006-08-22 2012-02-01 国际商业机器公司 捕获和/或分析客户端的Web页面事件的方法、装置及系统
US9912766B2 (en) * 2007-03-23 2018-03-06 Yahoo Holdings, Inc. System and method for identifying a link and generating a link identifier for the link on a webpage

Also Published As

Publication number Publication date
US8392470B2 (en) 2013-03-05
US20100235402A1 (en) 2010-09-16
RU2424562C1 (ru) 2011-07-20
EP2171612A4 (en) 2011-02-02
KR100755468B1 (ko) 2007-09-04
JP2010530567A (ja) 2010-09-09
EP2171612A1 (en) 2010-04-07
CN101689176A (zh) 2010-03-31
WO2008147126A1 (en) 2008-12-04

Similar Documents

Publication Publication Date Title
JP5134684B2 (ja) ウェブページ構造分析を通したウェブサイトの情報把握方法
CN107562620B (zh) 一种埋点自动设置方法和装置
Li et al. Here's what I did: Sharing and reusing web activity with ActionShot
US8533141B2 (en) Systems and methods for rule based inclusion of pixel retargeting in campaign management
US20110238723A1 (en) Systems and methods for web decoding
US8996682B2 (en) Automatically instrumenting a set of web documents
CN104965691B (zh) 配置网页页面的页面元素的方法、装置及系统
US8065667B2 (en) Injecting content into third party documents for document processing
CN101443751A (zh) 用于应用爬取器的方法和装置
US20080126931A1 (en) System and method for recording and reproducing user operation
US20100058118A1 (en) Storage medium recording information reacquisition procedure generation program and information reacquisition procedure generation apparatus
JP4940791B2 (ja) テスト支援プログラム、テスト支援装置、およびテスト支援方法
CN103729285A (zh) 一种网页测试方法、设备及系统
KR20110023749A (ko) 웹 지도 상에서의 트래픽 시각화
CN106603296A (zh) 日志的处理方法及装置
CN110515830A (zh) 操作轨迹可视化方法、装置、设备及存储介质
CN108574669B (zh) 用户行为树构建方法及装置
CN111859076B (zh) 数据爬取方法、装置、计算机设备及计算机可读存储介质
CN105808605B (zh) 一种搜索日志合并方法和系统
JP2013152724A (ja) デジタルコンテンツ閲覧装置及びデジタルコンテンツ閲覧管理システム
CN105190598A (zh) 资源索引分类
WO2013106813A1 (en) System and method for collecting financial information over a global communications network
JP4996504B2 (ja) Sbmサーバ、登録用画面生成方法及びプログラム
CN109951457A (zh) 一种基于html5特性的防爬虫系统及方法
JPH11306160A (ja) サービス利用履歴からのサービス単位の抽出方法、抽出装置及び抽出プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110713

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111013

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111020

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120709

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121010

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121109

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151116

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees