JP6839640B2 - Accessor characteristic estimation system - Google Patents

Accessor characteristic estimation system Download PDF

Info

Publication number
JP6839640B2
JP6839640B2 JP2017218744A JP2017218744A JP6839640B2 JP 6839640 B2 JP6839640 B2 JP 6839640B2 JP 2017218744 A JP2017218744 A JP 2017218744A JP 2017218744 A JP2017218744 A JP 2017218744A JP 6839640 B2 JP6839640 B2 JP 6839640B2
Authority
JP
Japan
Prior art keywords
access
characteristic
accessor
cookie
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017218744A
Other languages
Japanese (ja)
Other versions
JP2019091190A (en
Inventor
竜二 熊谷
竜二 熊谷
Original Assignee
株式会社ナレッジコンサルティング
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ナレッジコンサルティング filed Critical 株式会社ナレッジコンサルティング
Priority to JP2017218744A priority Critical patent/JP6839640B2/en
Publication of JP2019091190A publication Critical patent/JP2019091190A/en
Application granted granted Critical
Publication of JP6839640B2 publication Critical patent/JP6839640B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Description

本発明は、ウエブページにアクセスをした者(以下「アクセス者」)の特性を推測するアクセス者特性推測システムに関する。 The present invention relates to an accessor characteristic estimation system that estimates the characteristics of a person who has accessed a web page (hereinafter referred to as "accessor").

アクセス者の特性(例えば所属する企業名)を推測し、その結果に基づいてビジネスに有用な情報を得るシステムが、例えば特許文献1,2に開示されている。いずれも、アクセス者のIPアドレスに基づいて特性を推測する。 Patent Documents 1 and 2 disclose, for example, a system that infers the characteristics of an accessor (for example, the name of the company to which the user belongs) and obtains useful information for business based on the result. In each case, the characteristics are estimated based on the IP address of the accessor.

しかし、IPアドレスに基づいて特性を推測することは、必ずしも確実でない。例えば動的IPアドレスが使用される場合には、1のアクセス者のIPアドレスがアクセスの都度変動する可能性や、1のIPアドレスが異なる特性のアクセス者によって使用される可能性がある。また、例えばノートブックコンピュータを使用するアクセス者は、公共のWIFIステーション等の特性を推測できないIPアドレスからアクセスする可能性がある。 However, it is not always certain to guess the characteristics based on the IP address. For example, when a dynamic IP address is used, the IP address of one accessor may fluctuate with each access, or the IP address of one may be used by accessors having different characteristics. Further, for example, an accessor who uses a notebook computer may access from an IP address whose characteristics cannot be inferred, such as a public WIFI station.

特開2016−024530号公報Japanese Unexamined Patent Publication No. 2016-024530 特開2016−118957号公報Japanese Unexamined Patent Publication No. 2016-118957

本発明は、高精度でアクセス者の特性を推測するアクセス者特性推測システムを提供することを課題とする。 An object of the present invention is to provide an accessor characteristic estimation system that estimates the characteristics of an accessor with high accuracy.

本発明のアクセス者特性推測システムは、
インターネットを介してアクセスしたアクセス者の所属する組織である特性を推測するアクセス者特性推測システムであって、
前記アクセスを実行するプログラムに付され、IDを有するクッキーに基づいて前記特性を推測する特性推測部と、
前記ID−特性関連データを更新する関連更新部と、
前記IDと前記特性とを関連付け、前記特性推測部に参照されるID−特性関連データと、
アクセスごとに生成されて、アクセス元のIPアドレスとそのアクセスにおいて検出された前記クッキーの前記IDとアクセス時刻とに関する情報を含むアクセスログを集積したアクセスログデータとを備え、
前記特性推測部は、前記ID−特性関連データにおいて前記IDが関連付けられた特性が存在する場合には、該特性であると推測し、
前記関連更新部は、(1)前記アクセスログデータに同一のIPアドレス(安定IPアドレス)を有し、前記ID−特性関連データにおいて同一の特性(安定特性)に関連付けられたIDを有する第1のアクセスと第2のアクセスとが含まれ、(2)前記第1のアクセスと第2のアクセスとの間の時刻のものであって前記安定IPアドレスを有する第3のアクセスが含まれ、かつ、(3)前記第3のアクセスに係る前記クッキーの有するIDが前記ID−特性関連データにおいて前記安定特性と異なる特性に関連付けられていない場合に、前記第3のアクセスに係るIDを前記安定特性に関連付けるように、前記ID−特性関連データを更新することを特徴とする。
The accessor characteristic estimation system of the present invention
It is an accessor characteristic estimation system that infers the characteristics of the organization to which the accessor who accessed via the Internet belongs.
A characteristic estimation unit that is attached to the program that executes the access and estimates the characteristics based on a cookie having an ID,
A related update unit that updates the ID-characteristic related data, and
ID-characteristic-related data that associates the ID with the characteristic and is referred to by the characteristic estimation unit,
It includes access log data generated for each access and accumulating access logs including information on the IP address of the access source and the ID and access time of the cookie detected in the access.
When the characteristic associated with the ID exists in the ID-characteristic-related data, the characteristic estimation unit estimates that the characteristic is the characteristic.
The related update unit (1) has the same IP address (stable IP address) in the access log data, and has an ID associated with the same characteristic (stable characteristic) in the ID-characteristic related data. Access and second access are included, and (2) a third access that is at a time between the first access and the second access and has the stable IP address is included. , (3) When the ID of the cookie related to the third access is not associated with a characteristic different from the stable characteristic in the ID-characteristic-related data, the ID related to the third access is referred to as the stable characteristic. It is characterized in that the ID-characteristic related data is updated so as to be associated with.

この特徴によれば、高精度のID−特性関連データを構築することができ、それに基づいてクッキーのID(クッキーが付されたコンピュータを表す)から高精度で特性を推測することができる。すなわち、第3のアクセスに係るIDを安定特性に関連付けて、正確なID−特性関連データを構築することができる。一方、第3のアクセスに係るIDは、安定特性とは別の特性に関連付けられている可能性もある。かかる場合に、すでに関連付けられた特性と安定特性のいずれと関連付けるべきかの判断は、例えば関連付けの信頼度等の統計的手法によることが好ましい。かかる事情が存在しない場合には、第3のアクセスに係るIDを安定特性に関連付ける。 According to this feature, high-precision ID-characteristic-related data can be constructed, and based on this, the characteristic can be inferred from the cookie ID (representing a computer to which the cookie is attached) with high accuracy. That is, accurate ID-characteristic-related data can be constructed by associating the ID related to the third access with the stable characteristic. On the other hand, the ID related to the third access may be associated with a characteristic other than the stable characteristic. In such a case, it is preferable to determine whether to associate with the already associated characteristic or the stable characteristic by a statistical method such as the reliability of the association. If such a situation does not exist, the ID related to the third access is associated with the stability characteristic.

本発明のアクセス者特性推測システムは、
前記関連更新部は、前記アクセスログデータに前記第1のアクセスと前記第2のアクセスとの間の時刻のものであって前記安定IPアドレスと相違するIPアドレス及び前記第1のアクセス又は前記第2のアクセスの有するID同一のIDを有する第4のアクセスが含まれない場合にのみ、前記第3のアクセスに係るIDを前記第1のアクセス及び前記第2のアクセスの有するIDに関連付けられた特性に関連付けるように、前記ID−特性関連データを更新することを特徴とする。
The accessor characteristic estimation system of the present invention
The related update unit has an IP address that is different from the stable IP address and has a time between the first access and the second access to the access log data, and the first access or the first access. ID of 2 Access Only when the 4th access having the same ID is not included, the ID related to the 3rd access is associated with the ID of the 1st access and the 2nd access. It is characterized in that the ID-characteristic-related data is updated so as to be associated with the characteristic.

この特徴によれば、第1のアクセス又は第2のアクセスを行ったコンピュータが、それとは異なるIPアドレスからアクセスした場合に、そのクッキーのIDと特性との関連の信頼度が低いものとして取扱い、第3のアクセスにおけるアクセス者の特性を誤って関連付けたID−特性関連データの更新を行ってしまう可能性を小さくすることができる。 According to this feature, when the computer that made the first access or the second access accesses from a different IP address, it is treated as having low reliability of the relationship between the ID and the characteristic of the cookie. It is possible to reduce the possibility of updating the ID-characteristic-related data that is erroneously associated with the accessor's characteristics in the third access.

本発明のアクセス者特性推測システムは、
前記関連更新部は、前記アクセスログデータにおける前記第1のアクセスの時刻と前記第2のアクセスの時刻との差が所定の値以下である場合にのみ、前記第3のアクセスに係るIDを前記第1のアクセス及び前記第2のアクセスの有するIDに関連付けられた特性に関連付けるように、前記ID−特性関連データを更新することを特徴とする。
The accessor characteristic estimation system of the present invention
The related update unit assigns the ID related to the third access only when the difference between the time of the first access and the time of the second access in the access log data is equal to or less than a predetermined value. It is characterized in that the ID-characteristic-related data is updated so as to be associated with the characteristic associated with the ID of the first access and the second access.

この特徴によれば、第1のアクセスの時刻と第2のアクセスの時刻とが所定の値以下の差である場合にのみ、第3のアクセスに関する推定が行われる。動的IPアドレスが使用され、第1のアクセスの後でIPアドレスが他の特性を有する者に割り当てられてその間に第3のアクセスが、再びIDに関連付けられた特性を有する者に割り当てられた後に第2のアクセスが行われる場合に、第3のアクセスにおけるアクセス者の特性を誤って関連付けたID−特性関連データの更新を行ってしまう可能性を小さくすることができる。このため、「所定の値」は動的IPアドレスの割り当てが2回行われることのない短い時間であることが好ましい。 According to this feature, the estimation regarding the third access is performed only when the time of the first access and the time of the second access are different from each other by a predetermined value or less. A dynamic IP address was used, after which the IP address was assigned to a person with other characteristics after the first access, while a third access was again assigned to a person with the characteristics associated with the ID. When the second access is performed later, the possibility of updating the ID-characteristic-related data that is erroneously associated with the characteristics of the accessor in the third access can be reduced. Therefore, it is preferable that the "predetermined value" is a short time during which the dynamic IP address is not assigned twice.

本発明のアクセス者特性推測システムは、
前記特性推測部は、前記ID−特性関連データにおいて前記IDが関連付けられた特性が存在しない場合には、アクセス元のIPアドレスからの直近の他のアクセスに関してアクセス者に与えられた特性と同一の特性であると推測することを特徴とする。
The accessor characteristic estimation system of the present invention
The characteristic estimation unit is the same as the characteristic given to the accessor with respect to the most recent other access from the IP address of the access source when the characteristic associated with the ID does not exist in the ID-characteristic-related data. It is characterized by presuming that it is a characteristic.

この特徴によれば、IDが関連付けられた特性が存在しない場合には、IPアドレスに基づいて特性を推測することができる。 According to this feature, if the characteristic associated with the ID does not exist, the characteristic can be inferred based on the IP address.

本発明のアクセス者特性推測システムは、
前記特性推測部は、アクセス者の特性を推測するアクセスが前記直近の他のアクセスのセッション終了前に行われた場合にのみ、直近の他のアクセスに関してアクセス者に与えられた特性と同一の特性であると推測することを特徴とする。
The accessor characteristic estimation system of the present invention
The characteristic guessing unit has the same characteristics as those given to the accessor with respect to the other most recent access only when the access for estimating the characteristic of the accessor is performed before the end of the session of the other most recent access. It is characterized by inferring that.

この特徴によれば、IPアドレスに基づく特性の推測について、該IPアドレスについて動的IPアドレスの再割り当てが行われていないことを保証することができる。 According to this feature, it is possible to guarantee that the dynamic IP address is not reassigned for the IP address for the estimation of the characteristic based on the IP address.

本発明のアセス者特性推測システムは、
IDを有する前記クッキーを有さないアプリケーションソフトウェアからのアクセスを受けた時に、該アプリケーションソフトウェアにIDを有する前記クッキーを付することを特徴とする。
The assessor characteristic estimation system of the present invention
When an access is received from the application software that does not have the ID-bearing cookie, the application software is attached with the ID-bearing cookie.

この特徴によれば、最初にアクセスを受けた時にクッキーを付し、その後にクッキーを利用することができる。ここで「アプリケーションソフトウェア」はインターネットのブラウザである場合が多いと考えられるが、メール処理などのソフトウェアでhtmlを取扱うものも、クッキーを付することができ、アプリケーションソフトウェアに含まれる。 According to this feature, it is possible to attach a cookie when first accessed and then use the cookie. Here, it is considered that the "application software" is an Internet browser in many cases, but software such as mail processing that handles html can also be attached with a cookie and is included in the application software.

本発明のアセス者特性推測システムは、
初期設定部を備え、
前記初期設定部は、
前記特性に関連付けられたURLを備え、そのURLへのアクセスによって、前記クッキーをその端末機のアプリケーションソフトウェアに付し、
前記ID−特性関連データにおいて、該クッキーのIDと該特性とを関連付ける
ことを特徴とする。
The assessor characteristic estimation system of the present invention
Equipped with an initial setting section
The initial setting unit is
It has a URL associated with the characteristic, and by accessing the URL, the cookie is attached to the application software of the terminal.
The ID-characteristic-related data is characterized in that the ID of the cookie is associated with the characteristic.

この特徴によれば、特性が既知の者に特性に関連付けられたURLにアクセスしてもらうことで、特性に関連付けられたクッキーを付することができる。 According to this feature, a cookie associated with a characteristic can be attached by having a person with a known characteristic access the URL associated with the characteristic.

本発明のアクセス者特性推測システムは、
2以上のホームページを提供するサーバ上で動作し、
該2以上のホームページのいずれにアクセスしたアクセス者についても、前記アクセスログを生成することを特徴とする。
The accessor characteristic estimation system of the present invention
It runs on a server that provides two or more homepages,
It is characterized in that the access log is generated for an accessor who has accessed any of the two or more homepages.

この特徴によれば、多くのアクセスログを生成することができ、特性の推定精度を向上させることができる。 According to this feature, many access logs can be generated, and the estimation accuracy of the characteristics can be improved.

本発明によれば、高精度でアクセス者の特性を推測するアクセス者特性推測システムを提供することができる。 According to the present invention, it is possible to provide an accessor characteristic estimation system that estimates the characteristics of an accessor with high accuracy.

図1は、アクセス者特性推測システム及びその利用状況の構成を示す図である。FIG. 1 is a diagram showing a configuration of an accessor characteristic estimation system and its usage status. 図2は、ID−特性関連データを示す図である。FIG. 2 is a diagram showing ID-characteristic related data. 図3は、アクセスログデータを示す図である。FIG. 3 is a diagram showing access log data. 図4は、アクセス受信部の処理を示すフローチャートである。FIG. 4 is a flowchart showing the processing of the access receiving unit. 図5は、特性推測部の処理を示すフローチャートである。FIG. 5 is a flowchart showing the processing of the characteristic estimation unit. 図6は、特性推測部の処理(変形例)を示すフローチャートである。FIG. 6 is a flowchart showing the processing (modification example) of the characteristic estimation unit. 図7は、アクセスログデータ(変形例)を示す図である。FIG. 7 is a diagram showing access log data (modification example).

以下、本発明の実施例を説明する。 Hereinafter, examples of the present invention will be described.

(システムの構成)
図1は、アクセス者特性推測システム及びその利用状況の構成を示す図である。サーバ1は、複数のホームページ11を提供するものであり、アクセス者特性推測システム2を備えている。端末機3が、ネットワーク4を介してホームページ11にアクセスする。なお、ホームページ11は、サーバ1(として動作するコンピュータ)に保持されていても、ネットワーク4を介して他のコンピュータに保持されていても(サーバ1がネームサーバとして動作しても)、これらの両方であってもよい。また、URLによってアクセス可能なデータであれば、必ずしもインターネットのホームページでなくともよい。
(System configuration)
FIG. 1 is a diagram showing a configuration of an accessor characteristic estimation system and its usage status. The server 1 provides a plurality of homepages 11, and includes an accessor characteristic estimation system 2. The terminal 3 accesses the homepage 11 via the network 4. It should be noted that the homepage 11 may be held by the server 1 (the computer operating as) or by another computer via the network 4 (even if the server 1 operates as the name server). It may be both. Further, as long as the data can be accessed by the URL, it does not necessarily have to be the home page of the Internet.

アクセス者特性推測システム2は、アクセス受信部21、クッキー付与部22、特性推測部23、関連更新部24及び初期設定部25を備え、ID−特性関連データ26及びアクセスログデータ27を保持している。 The accessor characteristic estimation system 2 includes an access reception unit 21, a cookie granting unit 22, a characteristic estimation unit 23, a related update unit 24, and an initial setting unit 25, and holds an ID-characteristic related data 26 and an access log data 27. There is.

アクセス受信部21は、サーバ1においてホームページ11へのアクセスを最初に受け付ける部分である。アクセス受信部21は、アクセスの都度、アクセスログデータ27のアクセスログを追加する。アクセス受信部21の処理の詳細については後述する。 The access receiving unit 21 is a part that first receives access to the homepage 11 on the server 1. The access receiving unit 21 adds the access log of the access log data 27 each time it is accessed. The details of the processing of the access receiving unit 21 will be described later.

クッキー付与部22は、アクセス受信部21からの通知を受け、クッキー32を有さない端末機3からのアクセスがあった場合に、該端末機3にクッキー32を付与する。 The cookie giving unit 22 receives the notification from the access receiving unit 21, and when there is an access from the terminal 3 that does not have the cookie 32, the cookie giving unit 22 gives the cookie 32 to the terminal 3.

特性推測部23は、アクセス受信部21からの通知を受け、ID−特性関連データ26に基づいてアクセス者の特性を推測し、特性値として出力する。特性推測部23の処理の詳細については後述する。 The characteristic estimation unit 23 receives a notification from the access reception unit 21, estimates the characteristics of the accessor based on the ID-characteristic-related data 26, and outputs the characteristics as a characteristic value. The details of the processing of the characteristic estimation unit 23 will be described later.

関連更新部24は、アクセスログデータ27に基づいてID−特性関連データ26を更新する。関連更新部24の処理の詳細については後述する。 The related update unit 24 updates the ID-characteristic related data 26 based on the access log data 27. The details of the processing of the related update unit 24 will be described later.

初期設定部25は、クッキー付与ホームページ251を備える。クッキー付与ホームページ251は、端末機3にクッキー32を付与するが、付与されるクッキーのIDは、ID−特性関連データにおいて、予め判っている特性と関連付けられる。 The initial setting unit 25 includes a cookie giving homepage 251. The cookie-giving homepage 251 grants the cookie 32 to the terminal 3, and the ID of the cookie to be given is associated with a characteristic known in advance in the ID-characteristic-related data.

ID−特性関連データ26は、クッキーのIDと特性との対応を表すデータである。図2は、ID−特性関連データを示す図である。クッキーのIDと特性との対応が表されている。複数のID(A1、A2)が1の特性(A社)に対応する場合がある。 The ID-characteristic-related data 26 is data representing the correspondence between the ID of the cookie and the characteristic. FIG. 2 is a diagram showing ID-characteristic related data. The correspondence between the cookie ID and the characteristics is shown. A plurality of IDs (A1, A2) may correspond to a characteristic (Company A) of 1.

アクセスログデータ27は、アクセスの都度アクセス受信部21によって生成されるアクセスログを集積したデータである。図3は、アクセスログデータを示す図である。図の各行が1のアクセスログであり、アクセスログにはアクセス元のIPアドレス及びクッキーのID、並びにアクセスを受け付けた時刻が含まれている。 The access log data 27 is data that accumulates access logs generated by the access receiving unit 21 each time an access is made. FIG. 3 is a diagram showing access log data. Each line in the figure is an access log of 1, and the access log contains the IP address of the access source, the ID of the cookie, and the time when the access is received.

端末機3が、ネットワーク4を介して、ホームページ11にアクセスすると、アクセス受信部21がそのアクセスを処理する。 When the terminal 3 accesses the homepage 11 via the network 4, the access receiving unit 21 processes the access.

端末機3は、アプリケーションソフトウェア31を備え、アプリケーションソフトウェア31に付されるクッキー32を保持することができる。 The terminal 3 includes the application software 31 and can hold the cookie 32 attached to the application software 31.

(アクセス受信時の動作)
端末機3が、ネットワーク4を介して、ホームページ11にアクセスすることによって、アクセス受信部21が起動される。図4は、アクセス受信部の処理を示すフローチャートである。
(Operation when receiving access)
When the terminal 3 accesses the homepage 11 via the network 4, the access receiving unit 21 is activated. FIG. 4 is a flowchart showing the processing of the access receiving unit.

アクセス受信部21は、まず、アクセス元の端末機にクッキー32が存在するか否かを確認する(ステップ21A)。クッキー32が存在しない場合には、クッキー付与部22を起動する(ステップ21B)。 The access receiving unit 21 first confirms whether or not the cookie 32 exists in the access source terminal (step 21A). If the cookie 32 does not exist, the cookie granting unit 22 is activated (step 21B).

起動されたクッキー付与部22は、端末機3のアプリケーションソフトウェア31にクッキーを付与する。クッキーの付与は、HTTPヘッダによる通常の方法でよい。付与されるクッキーは、他のクッキーと峻別するためのIDを有する。例えばName属性として、固有の文字列を設定することができる。 The activated cookie giving unit 22 gives a cookie to the application software 31 of the terminal 3. The cookie can be added by the usual method using the HTTP header. The cookie given has an ID for distinguishing it from other cookies. For example, a unique character string can be set as the Name attribute.

アクセス受信部21は、次に、特性推測部23を起動する(ステップ21C)。特性推測部23は特性を推測し、特性値として出力する。 The access receiving unit 21 then activates the characteristic estimation unit 23 (step 21C). The characteristic estimation unit 23 estimates the characteristic and outputs it as a characteristic value.

アクセス受信部21は、最後に、端末機3にホームページ11へのアクセスを提供する。端末機3から受信するURLにしたがって、アクセスを提供するホームページを定め、そのホームページ(htmlファイル)を送信する(ステップ21D)。 Finally, the access receiving unit 21 provides the terminal 3 with access to the home page 11. A home page for providing access is determined according to the URL received from the terminal 3, and the home page (html file) is transmitted (step 21D).

特性値は、ホームページ11に引数として渡される、所定のファイルに保存される、その他の方法でホームページ11が利用することができる。ホームページ11は、例えば、表示する広告を選択することができる。 The characteristic value can be used by the homepage 11 by passing it as an argument to the homepage 11, storing it in a predetermined file, or using other methods. The homepage 11 can select, for example, an advertisement to be displayed.

以上の処理は、アプリケーションソフトウェア31がブラウザである場合にも、その他もhtmlを処理するソフトウェアである場合にも、行うことができる。 The above processing can be performed regardless of whether the application software 31 is a browser or other software that processes html.

(特性の推測)
以下、特性推測部23の動作について説明する。図5は、特性推測部の処理を示すフローチャートである。特性推測部23は、アクセス元の端末機に存在するクッキー32のID及びアクセス元のIPアドレスに基づいて動作する。
(Guessing characteristics)
Hereinafter, the operation of the characteristic estimation unit 23 will be described. FIG. 5 is a flowchart showing the processing of the characteristic estimation unit. The characteristic estimation unit 23 operates based on the ID of the cookie 32 existing in the access source terminal and the access source IP address.

特性推測部23は、まず、ID−特性関連データ26を参照し、クッキー32のIDに関連付けられた特性が存在するか否かを確認する(ステップ23A)。クッキー32のIDに関連付けられた特性が存在する場合には、その特性を推測された特性値として出力する(ステップ23B) First, the characteristic estimation unit 23 refers to the ID-characteristic-related data 26 and confirms whether or not the characteristic associated with the ID of the cookie 32 exists (step 23A). If there is a characteristic associated with the ID of the cookie 32, that characteristic is output as an inferred characteristic value (step 23B).

クッキー32のIDに関連付けられた特性が存在しない場合には、特性推測部23は、アクセスログデータ27を参照し、アクセスログが所定の要件を満たすか否かを判断する(ステップ23C)。 When the characteristic associated with the ID of the cookie 32 does not exist, the characteristic estimation unit 23 refers to the access log data 27 and determines whether or not the access log satisfies a predetermined requirement (step 23C).

ここで、「所定の要件」は、(1)アクセスログデータ27に同一のIPアドレス(安定IPアドレス)を有し、ID−特性関連データ26において同一の特性に関連付けられたIDを有する第1のアクセスと第2のアクセスとが含まれ、(2)第1のアクセスと第2のアクセスとの間の時刻のものであって安定IPアドレスを有する第3のアクセスが、現在処理中のアクセスであることであるとする。特性推測部23は、アクセスログが所定の要件を満たす場合には、第1のアクセス及び第2のアクセスに関連付けられた特性を、推測された特性値として出力する(ステップ23D)。 Here, the "predetermined requirement" is (1) a first having the same IP address (stable IP address) in the access log data 27 and having an ID associated with the same characteristic in the ID-characteristic-related data 26. Access and second access are included, and (2) the third access, which is the time between the first access and the second access and has a stable IP address, is currently being processed. Is to be. When the access log satisfies a predetermined requirement, the characteristic estimation unit 23 outputs the characteristics associated with the first access and the second access as estimated characteristic values (step 23D).

図2に示すID−特性関連データ26、図3に示すアクセスログデータ27を例に説明する。いま、アクセスログ27Qに係るアクセスを処理しているものとする。 The ID-characteristic-related data 26 shown in FIG. 2 and the access log data 27 shown in FIG. 3 will be described as examples. It is assumed that the access related to the access log 27Q is being processed now.

アクセスログ27Pが、クッキーIDが「A1」であり、ID−特性関連データ26において「A社」の特性に関連付けられている。また、アクセスログ27Sが、クッキーIDが「A2」であり、ID−特性関連データ26において「A社」の特性に関連付けられている。アクセスログ27Pに係るアクセスを第1のアクセス、アクセスログ27Sに係るアクセスを第2のアクセスとし、現在処理中のアクセスログ27Qに係るアクセスを第3のアクセスとすると、いずれもIPアドレスが「**.**.1」であるので、所定の要件を満たす。すなわち、アクセスログ27Qに係るアクセスについて、特性が「A社」であると推定される。 The access log 27P has a cookie ID of "A1" and is associated with the characteristic of "Company A" in the ID-characteristic-related data 26. Further, the access log 27S has a cookie ID of "A2" and is associated with the characteristic of "Company A" in the ID-characteristic-related data 26. Assuming that the access related to the access log 27P is the first access, the access related to the access log 27S is the second access, and the access related to the access log 27Q currently being processed is the third access, the IP address is "*". Since it is "*. ***. 1", it satisfies the predetermined requirements. That is, it is estimated that the characteristic of the access related to the access log 27Q is "Company A".

ここで、アクセスログ27Rもまた、IPアドレスが「**.**.1」である。しかし、アクセスログ27Rは、クッキーIDが「B」であり、ID−特性関連データ26において「B社」の特性に関連付けられている。すなわち、アクセスログ27Pと27Rとは、異なる特性に関連付けられている。したがって、所定の要件を満たしてアクセスログ27Qに係るアクセスについて、特性が「A社」であると推定されるものではない。 Here, the IP address of the access log 27R is also "**. ***. 1". However, the access log 27R has a cookie ID of "B" and is associated with the characteristic of "Company B" in the ID-characteristic-related data 26. That is, the access logs 27P and 27R are associated with different characteristics. Therefore, it is not presumed that the characteristic of the access related to the access log 27Q that satisfies the predetermined requirements is "Company A".

すなわち、アクセスログ27Pとアクセスログ27Rとでは、IPアドレスが「**.**.1」であることによって特性を推測する根拠とはならない。アクセスログ27Sが存在して初めて、IPアドレスが「**.**.1」であることによって特性が「A社」である(アクセスログ27Rは例えば来訪者のノートブックコンピュータ等による偶発的なものである)と推測することができる。アクセスログ27Rが偶発的なものではない場合への対処については後述する。 That is, the access log 27P and the access log 27R do not serve as a basis for estimating the characteristics because the IP address is "**. ***. 1". Only when the access log 27S exists, the characteristic is "Company A" because the IP address is "**. ***. 1" (The access log 27R is accidental, for example, by a visitor's notebook computer or the like. It can be inferred. The measures to be taken when the access log 27R is not accidental will be described later.

一方、アクセスログ27Qに係るアクセスを受けた時点においては、アクセスログ27Sに係るアクセスは未だなされておらず、アクセスログデータ27を参照してもアクセスログが所定の要件を満たすものではないと判断されると考えられる。現在処理中のアクセスよりも後の時点における第2のアクセスを要件に含むので、アクセスを受けてから特性推測部23が起動されるまでの極短時間の間に第2のアクセスがなされる場合を除き、アクセスを受けた時点においては所定の要件を満たすものではないと判断されることとなる。 On the other hand, at the time of receiving the access related to the access log 27Q, the access related to the access log 27S has not been made yet, and it is determined that the access log does not satisfy the predetermined requirements even if the access log data 27 is referred to. It is thought that it will be done. Since the requirement includes a second access at a time after the access currently being processed, the second access is made within a very short time from receiving the access until the characteristic estimation unit 23 is started. Except for, it will be judged that the prescribed requirements are not met at the time of receiving the access.

そこで、特性推測部23は、所定の要件を満たさないアクセスについて、以下のとおりに特性を推測する。まず、特性を推測しようとしているアクセスと同一のIPアドレスからの過去のアクセスであって、特性を推測できるもの(クッキーIDがID−特性関連データ26において何らかの特性に関連付けられているもの)が存在するか否かを確認する(ステップ23E)。かかる過去のアクセスがない場合には、特性推測不能とする(ステップ23H)。 Therefore, the characteristic estimation unit 23 estimates the characteristics of the access that does not satisfy the predetermined requirements as follows. First, there is a past access from the same IP address as the access for which the characteristic is to be inferred, and the characteristic can be inferred (the cookie ID is associated with some characteristic in the ID-characteristic related data 26). Confirm whether or not to do so (step 23E). If there is no such past access, the characteristics cannot be inferred (step 23H).

かかる過去のアクセスがある場合、それらのうちの直近のもの(特性を推測しようとしているアクセスに最も近い時間に行われたもの)と同一の特性であると推測することに合理性がある。動的IPアドレスが1社に割り当てられた場合、短時間で再割り当てがあるものではなく、直近のアクセスと特性を推測しようとしているアクセスとは同一の社に割り当てられたと考えられるためである。 If there are such past accesses, it is reasonable to infer that they have the same characteristics as the most recent one (the one that was made at the time closest to the access for which the characteristic is to be inferred). This is because when a dynamic IP address is assigned to one company, there is no reassignment in a short time, and it is considered that the latest access and the access whose characteristics are to be inferred are assigned to the same company.

直近のアクセスと特性を推測しようとしているアクセスとの間でIPアドレスの再割り当てがなされていないことを確認するため、特性推測部23は、直近のアクセスのセッションが継続している(終了していない)ことを確認する(ステップ23F)。動的IPアドレスは、セッション継続中に再割り当てされないためである。特性推測部23は、セッションが継続している場合には直近のアクセスと同一の特性であると推測し(ステップ23G)、セッションが継続していない場合には特性推測不能とする(ステップ23H)。 In order to confirm that the IP address has not been reassigned between the latest access and the access whose characteristics are to be inferred, the characteristic estimation unit 23 continues (ends) the session of the latest access. Confirm that there is no such thing (step 23F). This is because the dynamic IP address is not reassigned during the duration of the session. The characteristic estimation unit 23 estimates that the characteristics are the same as the latest access when the session is continuous (step 23G), and makes it impossible to estimate the characteristics when the session is not continuous (step 23H). ..

ここで、ステップ23Fは、省略してもよい。すなわち、セッションの継続如何にかかわらず、特性を推測できる直近のアクセスと同一の特性であると推測してもよい。推測結果の利用方法が誤推測を許容できる場合(例えば広告の選択に推測結果を用いる場合)も考えられ、一定の制度を得ることができれば可としてもよい。 Here, step 23F may be omitted. That is, regardless of the continuation of the session, it may be inferred that the characteristics are the same as those of the latest access whose characteristics can be inferred. There may be cases where the method of using the guess results can tolerate erroneous guesses (for example, when the guess results are used for selecting advertisements), and it may be acceptable as long as a certain system can be obtained.

なお、セッションが継続しているか否かについては、セッションの定義方法に幅があり(例えば一定時間のタイムアウトによってセッションを終了する場合、当該一定時間をいかに定めるかは各業者の裁量であり)、厳密な判断は困難である。動的IPアドレスを割り当てる業者と同一の定義とすることが好ましいが、上記のとおり、許容可能な範囲の誤推測とすることができれば、任意に設計しても差し支えない。 There is a range of ways to define a session as to whether or not the session continues (for example, if the session ends due to a time-out of a certain period of time, it is at the discretion of each vendor how to determine the fixed time). Strict judgment is difficult. It is preferable to use the same definition as the vendor that assigns the dynamic IP address, but as described above, any design may be used as long as it can be misguessed within an acceptable range.

以下、アクセスを受けた時点においては所定の要件を満たすものではないと判断されることとなってしまう点についての対策を説明する。図6は、特性推測部の処理(変形例)を示すフローチャートである。特性推測部23は、アクセスログが所定の要件を満たさない場合には、上述のステップ23E、23Gの処理に替えて、待機して(ステップ23I)後にアクセスログが所定の要件を満たすか否かを再判断することとしてもよい。アクセスログ27Sに係るアクセスがあった時に、所定の要件を満たすとして正確な推測を行うものである。再判断を行うタイミングについては、例えば、1分につき1回としてもよく、アクセスログデータ27が更新された時としてもよく、任意に設計してよい。 Hereinafter, measures will be described for the point that it is judged that the predetermined requirements are not satisfied at the time of receiving the access. FIG. 6 is a flowchart showing the processing (modification example) of the characteristic estimation unit. If the access log does not meet the predetermined requirement, the characteristic estimation unit 23 determines whether or not the access log satisfies the predetermined requirement after waiting (step 23I) instead of the above-mentioned processes of steps 23E and 23G. May be re-judged. When there is an access related to the access log 27S, an accurate guess is made assuming that a predetermined requirement is satisfied. The timing of re-judgment may be, for example, once per minute or when the access log data 27 is updated, and may be arbitrarily designed.

また、再判断が無期限に続くことのないよう、例えば、10分後に再判断を打ち切る、セッション終了時に再判断を打ち切る、その他の方法で打ち切ることとする。 In addition, in order to prevent the re-judgment from continuing indefinitely, for example, the re-judgment will be terminated after 10 minutes, the re-judgment will be terminated at the end of the session, or other methods will be terminated.

上記「所定の要件」は、追加の要件を付して、さらに厳格なものとすることができる。 The above "predetermined requirements" can be made even more stringent with additional requirements.

図7は、アクセスログデータを示す図である。アクセスログデータ27は、図3に示したものと比して、アクセスログ27Qの時刻が遅くなりアクセスログ27Q’となっている。アクセスログ27Sの時刻が遅くなりアクセスログ27S’となっている。また、アクセスログ27Rに替えてアクセスログ27Xとなっている。 FIG. 7 is a diagram showing access log data. In the access log data 27, the time of the access log 27Q is later than that shown in FIG. 3, and the access log data 27 is the access log 27Q'. The time of the access log 27S is delayed and becomes the access log 27S'. Further, the access log 27X is used instead of the access log 27R.

ここで、アクセスログ27Pに係るアクセスを第1のアクセス、アクセスログ27S’に係るアクセスを第2のアクセスとし、現在処理中のアクセスログ27Q’に係るアクセスを第3のアクセスとすると、アクセスログ27Q’は、前述の要件を満たしている。 Here, assuming that the access related to the access log 27P is the first access, the access related to the access log 27S'is the second access, and the access related to the access log 27Q'currently being processed is the third access, the access log 27Q'satisfies the above requirements.

しかし、図7に示したアクセスログデータ27は、動的IPアドレスが使用された結果、A社に対して、10月1日にIPアドレス「**.**.1」が、10月2日にIPアドレス「**.**.3」が、10月3日にIPアドレス「**.**.1」が割り当てられたものと推認される。そうすると、アクセスログ27Q’に係るアクセスの時点におけるIPアドレス「**.**.1」は、A社以外に割り当てられていると考えられる。 However, in the access log data 27 shown in FIG. 7, as a result of using the dynamic IP address, the IP address "**. ***. 1" was given to Company A on October 1st, and October 2nd. It is presumed that the IP address "**. ***. 3" was assigned on the day and the IP address "**. ***. 1" was assigned on October 3. Then, it is considered that the IP address "**. ***. 1" at the time of access related to the access log 27Q'is assigned to a company other than company A.

追加の要件として、例えば、第1のアクセスと第2のアクセスとの間の時刻のものであって安定IPアドレスと相違するIPアドレス及び第1のアクセス又は第2のアクセスの有するIDと同一のIDを有する第4のアクセスが含まれないことを、追加の要件としてもよい。 As an additional requirement, for example, an IP address that is at a time between the first access and the second access and is different from the stable IP address and the same as the ID of the first access or the second access. It may be an additional requirement that the fourth access with the ID is not included.

これによれば、途中で他のIPアドレスが割り当てられたことを第4のアクセスによって検出し、第3のアクセスに係る誤推定を減ずることができる。図7において、アクセスログ27Xが第4のアクセスであり、アクセスログ27Q’に係るアクセスは特性が「A社」と推定されない。 According to this, it is possible to detect that another IP address is assigned on the way by the fourth access and reduce the erroneous estimation related to the third access. In FIG. 7, the access log 27X is the fourth access, and the access related to the access log 27Q'is not presumed to have the characteristic "Company A".

また、追加の要件として、例えば、第1のアクセスの時刻と第2のアクセスの時刻との差が所定の値以下第1のアクセスと第2のアクセスとの間の時刻のものであって安定IPアドレスと相違するIPアドレス及び第1のアクセス又は第2のアクセスの有するIDと同一のIDを有する第4のアクセスが含まれないことを、追加の要件としてもよい。 Further, as an additional requirement, for example, the difference between the time of the first access and the time of the second access is less than or equal to a predetermined value and is stable because it is the time between the first access and the second access. It may be an additional requirement that the IP address different from the IP address and the fourth access having the same ID as the ID of the first access or the second access are not included.

これによれば、所定の値を、IPアドレスの割り当てが2度行われる時間よりも小さな値、例えば1日とすることで、途中で他のIPアドレスが割り当てられた場合を除外し、第3のアクセスに係る誤推定を減ずることができる。上述のアクセスログ27Rが偶発的なものではない場合への対処を行うものである。図7において、アクセスログ27P(第1のアクセス)の時刻とでアクセスログ27S’(第2のアクセス)の時刻との差が2日以上であり、アクセスログ27Q’に係るアクセスは特性が「A社」と推定されない。 According to this, by setting a predetermined value to a value smaller than the time when the IP address is assigned twice, for example, one day, the case where another IP address is assigned in the middle is excluded, and the third It is possible to reduce the misestimation related to the access of. This is to deal with the case where the above-mentioned access log 27R is not accidental. In FIG. 7, the difference between the time of the access log 27P (first access) and the time of the access log 27S'(second access) is 2 days or more, and the access related to the access log 27Q'has a characteristic of ". It is not presumed to be "Company A".

以上の追加の要件の設定は、一般化して言えば、ID−特性関連データ26及びアクセスログデータ27に係る「信頼度」を処理するとも考えられる。追加の要件を固定的に定めず、統計的処理等によって決定することもできる。 Generally speaking, the setting of the above additional requirements can be considered to process the "reliability" related to the ID-characteristic related data 26 and the access log data 27. Additional requirements may not be fixedly set and may be determined by statistical processing or the like.

(アクセス受信時以外の動作)
上記の、「アクセスログデータ27に同一のIPアドレス(安定IPアドレス)を有し、ID−特性関連データ26において同一の特性に関連付けられたIDを有する第1のアクセスと第2のアクセスとが含まれ、第1のアクセスと第2のアクセスとの間の時刻のものであって安定IPアドレスを有する第3のアクセスが、現在処理中のアクセスであることであることを要件として特性を推測する」処理について、第2のアクセスは、アクセス者がホームページ11から離脱した後に発生するかもしれない。この場合、特性推測部23は、特性を推測することができない。
(Operation other than when receiving access)
The above-mentioned "first access and second access having the same IP address (stable IP address) in the access log data 27 and having an ID associated with the same characteristic in the ID-characteristic-related data 26 are Guess the characteristics on the condition that the third access, which is included, at the time between the first and second access, and has a stable IP address, is the access currently being processed. For the "do" process, the second access may occur after the accessor leaves the home page 11. In this case, the characteristic estimation unit 23 cannot estimate the characteristics.

しかし、第3のアクセスに係るクッキー32のIDは、第1のアクセスと第2のアクセスに係る特性に関連付けられるべきものである。 However, the ID of the cookie 32 according to the third access should be associated with the characteristics relating to the first access and the second access.

そこで、関連更新部24によって、ID−特性関連データ26を更新する。 Therefore, the related update unit 24 updates the ID-characteristic related data 26.

アクセス者特性推測システムは、定期的に(例えば1時間につき1回)関連更新部24を起動する。関連更新部24は、アクセスログ中に所定の要件を満たすアクセスがあるか否かを調べ、ある場合には、そのアクセスログのクッキーのIDと、その所定の要件を満たすことによって推測される特性とを関連付ける情報を、ID−特性関連データ26に追加する。 The accessor characteristic estimation system periodically (for example, once an hour) activates the related update unit 24. The related update unit 24 checks whether or not there is an access satisfying a predetermined requirement in the access log, and if so, the cookie ID of the access log and the characteristics estimated by satisfying the predetermined requirement. The information associated with is added to the ID-characteristic related data 26.

これにより、所定の要件が後刻に調べられ、ID−特性関連データ26が更新される。最初のアクセスにおいて特性推測部23による推測ができない場合にも、後のアクセスでは確実に推測される。 As a result, the predetermined requirements are examined later and the ID-characteristic related data 26 is updated. Even if the characteristic estimation unit 23 cannot make an estimate in the first access, it is surely inferred in the later access.

(事前の設定)
以上説明した特性の推測は、少なくとも1のクッキー32について、そのIDが特性に関連付けられ、ID−特性関連データ26に情報が存在することを必要とする。アクセス者特性推測システム2の運用を開始する時に、かかるクッキーを生成することが課題となる。
(Pre-setting)
The estimation of the characteristic described above requires that the ID of at least one cookie 32 is associated with the characteristic and the information exists in the ID-characteristic-related data 26. When the operation of the accessor characteristic estimation system 2 is started, it is a problem to generate such a cookie.

むろん、運用者が特性についての情報を有しており、自らID−特性関連データ26を作成することは可能である。しかし、初期設定部25によって効率的に生成することができる。 Of course, the operator has information about the characteristics, and it is possible to create the ID-characteristic-related data 26 by himself / herself. However, it can be efficiently generated by the initial setting unit 25.

初期設定部25は、特性に関連付けられたクッキー付与ホームページ(URL)251を、特性の数だけ有している。ユーザ(将来のアクセス者)がたクッキー付与ホームページ251にアクセスすると、端末機3のアプリケーションソフトウェア31にクッキー32が付与される。クッキーの付与は、クッキー付与部22と同様である。 The initial setting unit 25 has as many cookie-giving homepages (URLs) 251 associated with the characteristics as there are characteristics. When the user (future accessor) accesses the cookie giving homepage 251, the cookie 32 is given to the application software 31 of the terminal 3. The cookie granting is the same as that of the cookie granting unit 22.

初期設定部25は、クッキー付与ホームページ251(複数であればそのうちの1つ)によってクッキー32が付与されると、そのクッキー32のIDとクッキー付与ホームページ251に関連付けられた特性とを関連付ける情報を、ID−特性関連データ26に追加する。 When the cookie 32 is given by the cookie-giving homepage 251 (one of them if there is more than one), the initial setting unit 25 provides information that associates the ID of the cookie 32 with the characteristics associated with the cookie-giving homepage 251. It is added to the ID-characteristic related data 26.

すなわち、クッキー付与ホームページ251の各々のホームページは、それに関連付けられた特性のユーザのみによってアクセスされることで、IDが特性に関連付けられ、ID−特性関連データ26に情報が存在するクッキー32が生成される。 That is, each homepage of the cookie-giving homepage 251 is accessed only by the user of the characteristic associated with the homepage, so that the ID is associated with the characteristic and the cookie 32 in which the information exists in the ID-characteristic-related data 26 is generated. To.

各々のホームページがそれに関連付けられた特性のユーザのみによってアクセスされること、及びそのアクセスを誘導することは、例えば以下のように行うことができる。 Each home page can be accessed only by users with the characteristics associated with it, and the access can be guided, for example, as follows.

特性の特定されるメールアドレス(例えば「@」の後に既知の企業のURLを有するメールアドレス)にメールを送信する。スクレイピング等によれば、かかるメールアドレスを合法的に取得できる。そのメールに対する操作によってその特性に関連付けられたクッキー付与ホームページ251へのアクセスを行う。 An email is sent to an email address whose characteristics are specified (for example, an email address having a URL of a known company after "@"). According to scraping etc., such an e-mail address can be legally obtained. By operating on the mail, the cookie-giving homepage 251 associated with the characteristic is accessed.

むろん、メールによらずに、例えば文書を送付する等、他の方法によってクッキー付与ホームページ251へのアクセスを誘導してもよい。 Of course, instead of using e-mail, access to the cookie-giving homepage 251 may be guided by other methods such as sending a document.

(留意事項)
アクセス者特性推測システム2は、1のホームページのみへのアクセスを対象とする必要はない。多数のホームページへのアクセスを対象とすることで、アクセスログの数が増加する。これにより、特性を推測することができる可能性が高くなり、推測された特性の精度が上がる。
(Notes)
The accessor characteristic estimation system 2 does not need to target access to only one homepage. By targeting access to a large number of homepages, the number of access logs will increase. This increases the likelihood that the characteristics can be inferred and increases the accuracy of the inferred characteristics.

このため、アクセス者特性推測システム2は、多数のホームページを提供するサーバ上で動作し、いずれのホームページにアクセスしたアクセス者についても、アクセスログを生成することが好ましい。 Therefore, it is preferable that the accessor characteristic estimation system 2 operates on a server that provides a large number of homepages, and generates an access log for an accessor who has accessed any of the homepages.

(まとめ)
以上詳細に説明したように、本実施例のアクセス者特性推測システム2によれば、クッキー32による推測とIPアドレスにいる推測を併用することができ、動的IPアドレスに対応して高精度でアクセス者の特性を推測することができる。
(Summary)
As described in detail above, according to the accessor characteristic guessing system 2 of this embodiment, the guessing by the cookie 32 and the guessing at the IP address can be used at the same time, and the guessing corresponding to the dynamic IP address can be performed with high accuracy. The characteristics of the accessor can be inferred.

高精度でアクセス者の特性を推測するアクセス者特性推測システムである。多くのホームページ管理企業による利用が考えられる。 It is an accessor characteristic estimation system that estimates the characteristics of the accessor with high accuracy. It can be used by many homepage management companies.

1 サーバ
11 ホームページ
2 アクセス者特性推測システム
21 アクセス受信部
22 クッキー付与部
23 特性推測部
24 関連更新部
25 初期設定部
26 ID−特性関連データ
27 アクセスログデータ
31 アプリケーションソフトウェア
32 クッキー
4 ネットワーク
1 Server 11 Homepage 2 Accessor characteristic estimation system 21 Access receiver 22 Cookie granting unit 23 Characteristic estimation unit 24 Related update unit 25 Initial setting unit 26 ID-Characteristic related data 27 Access log data 31 Application software 32 Cookie 4 Network

Claims (8)

インターネットを介してアクセスしたアクセス者の所属する組織である特性を推測するアクセス者特性推測システムであって、
前記アクセスを実行するプログラムに付され、IDを有するクッキーに基づいて前記特性を推測する特性推測部と、
前記ID−特性関連データを更新する関連更新部と、
前記IDと前記特性とを関連付け、前記特性推測部に参照されるID−特性関連データと、
アクセスごとに生成されて、アクセス元のIPアドレスとそのアクセスにおいて検出された前記クッキーの前記IDとアクセス時刻とに関する情報を含むアクセスログを集積したアクセスログデータとを備え、
前記特性推測部は、前記ID−特性関連データにおいて前記IDが関連付けられた特性が存在する場合には、該特性であると推測し、
前記関連更新部は、(1)前記アクセスログデータに同一のIPアドレス(安定IPアドレス)を有し、前記ID−特性関連データにおいて同一の特性(安定特性)に関連付けられたIDを有する第1のアクセスと第2のアクセスとが含まれ、(2)前記第1のアクセスと第2のアクセスとの間の時刻のものであって前記安定IPアドレスを有する第3のアクセスが含まれ、かつ、(3)前記第3のアクセスに係る前記クッキーの有するIDが前記ID−特性関連データにおいて前記安定特性と異なる特性に関連付けられていない場合に、前記第3のアクセスに係るIDを前記安定特性に関連付けるように、前記ID−特性関連データを更新することを特徴とする、アクセス者特性推測システム。
It is an accessor characteristic estimation system that infers the characteristics of the organization to which the accessor who accessed via the Internet belongs.
A characteristic estimation unit that is attached to the program that executes the access and estimates the characteristics based on a cookie having an ID,
A related update unit that updates the ID-characteristic related data, and
ID-characteristic-related data that associates the ID with the characteristic and is referred to by the characteristic estimation unit,
It includes access log data generated for each access and accumulating access logs including information on the IP address of the access source and the ID and access time of the cookie detected in the access.
When the characteristic associated with the ID exists in the ID-characteristic-related data, the characteristic estimation unit estimates that the characteristic is the characteristic.
The related update unit (1) has the same IP address (stable IP address) in the access log data, and has an ID associated with the same characteristic (stable characteristic) in the ID-characteristic related data. Access and second access are included, and (2) a third access that is at a time between the first access and the second access and has the stable IP address is included. , (3) When the ID of the cookie related to the third access is not associated with a characteristic different from the stable characteristic in the ID-characteristic-related data, the ID related to the third access is referred to as the stable characteristic. An accessor characteristic estimation system, characterized in that the ID-characteristic-related data is updated so as to be associated with.
前記関連更新部は、前記アクセスログデータに前記第1のアクセスと前記第2のアクセスとの間の時刻のものであって前記安定IPアドレスと相違するIPアドレス及び前記第1のアクセス又は前記第2のアクセスの有するID同一のIDを有する第4のアクセスが含まれない場合にのみ、前記第3のアクセスに係るIDを前記第1のアクセス及び前記第2のアクセスの有するIDに関連付けられた特性に関連付けるように、前記ID−特性関連データを更新することを特徴とする、請求項1に記載のアクセス者特性推測システム。 The related update unit has an IP address that is different from the stable IP address and has a time between the first access and the second access to the access log data, and the first access or the first access. ID of 2 Access Only when the 4th access having the same ID is not included, the ID related to the 3rd access is associated with the ID of the 1st access and the 2nd access. The accessor characteristic estimation system according to claim 1, wherein the ID-characteristic-related data is updated so as to be associated with the characteristic. 前記関連更新部は、前記アクセスログデータにおける前記第1のアクセスの時刻と前記第2のアクセスの時刻との差が所定の値以下である場合にのみ、前記第3のアクセスに係るIDを前記第1のアクセス及び前記第2のアクセスの有するIDに関連付けられた特性に関連付けるように、前記ID−特性関連データを更新することを特徴とする、請求項1又は2に記載のアクセス者特性推測システム。 The related update unit assigns the ID related to the third access only when the difference between the time of the first access and the time of the second access in the access log data is equal to or less than a predetermined value. The accessor characteristic estimation according to claim 1 or 2, wherein the ID-characteristic-related data is updated so as to be associated with the characteristics associated with the ID of the first access and the second access. system. 前記特性推測部は、前記ID−特性関連データにおいて前記IDが関連付けられた特性が存在しない場合には、アクセス元のIPアドレスからの直近の他のアクセスに関してアクセス者に与えられた特性と同一の特性であると推測することを特徴とする、請求項1〜3のいずれか1項に記載のアクセス者特性推測システム。 The characteristic estimation unit is the same as the characteristic given to the accessor with respect to the most recent other access from the IP address of the access source when the characteristic associated with the ID does not exist in the ID-characteristic-related data. The accessor characteristic estimation system according to any one of claims 1 to 3, wherein the characteristic is estimated. 前記特性推測部は、アクセス者の特性を推測するアクセスが前記直近の他のアクセスのセッション終了前に行われた場合にのみ、直近の他のアクセスに関してアクセス者に与えられた特性と同一の特性であると推測することを特徴とする、請求項4に記載のアクセス者特性推測システム。 The characteristic guessing unit has the same characteristics as those given to the accessor with respect to the other most recent access only when the access for estimating the characteristic of the accessor is performed before the end of the session of the other most recent access. The accessor characteristic estimation system according to claim 4, wherein the accessor characteristic estimation system is characterized in that. IDを有する前記クッキーを有さないアプリケーションソフトウェアからのアクセスを受けた時に、該アプリケーションソフトウェアにIDを有する前記クッキーを付することを特徴とする、請求項1〜5のいずれか1項に記載のアクセス者特性推測システム。 The invention according to any one of claims 1 to 5, wherein the cookie having an ID is attached to the application software when an access is received from the application software having the ID and not having the cookie. Accessor characteristic estimation system. 初期設定部を備え、
前記初期設定部は、
前記特性に関連付けられたURLを備え、そのURLへのアクセスによって、前記クッキーをその端末機のアプリケーションソフトウェアに付し、
前記ID−特性関連データにおいて、該クッキーのIDと該特性とを関連付けることを特徴とする、請求項1〜6のいずれか1項に記載のアクセス者特性推測システム。
Equipped with an initial setting section
The initial setting unit is
It has a URL associated with the characteristic, and by accessing the URL, the cookie is attached to the application software of the terminal.
The accessor characteristic estimation system according to any one of claims 1 to 6, wherein the ID of the cookie is associated with the characteristic in the ID-characteristic-related data.
2以上のホームページを提供するサーバ上で動作し、
該2以上のホームページのいずれにアクセスしたアクセス者についても、前記アクセスログを生成することを特徴とする、請求項1〜7のいずれか1項に記載のアクセス者特性推測システム。
It runs on a server that provides two or more homepages,
The accessor characteristic estimation system according to any one of claims 1 to 7, wherein an access log is generated for an accessor who has accessed any of the two or more homepages.
JP2017218744A 2017-11-14 2017-11-14 Accessor characteristic estimation system Active JP6839640B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017218744A JP6839640B2 (en) 2017-11-14 2017-11-14 Accessor characteristic estimation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017218744A JP6839640B2 (en) 2017-11-14 2017-11-14 Accessor characteristic estimation system

Publications (2)

Publication Number Publication Date
JP2019091190A JP2019091190A (en) 2019-06-13
JP6839640B2 true JP6839640B2 (en) 2021-03-10

Family

ID=66837405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017218744A Active JP6839640B2 (en) 2017-11-14 2017-11-14 Accessor characteristic estimation system

Country Status (1)

Country Link
JP (1) JP6839640B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5709448B2 (en) * 2010-09-29 2015-04-30 三菱スペース・ソフトウエア株式会社 Access analysis device, access analysis method, and access analysis program
US10509841B2 (en) * 2011-06-06 2019-12-17 International Business Machines Corporation Inferred user identity in content distribution
CN103995907B (en) * 2014-06-13 2017-04-12 北京奇艺世纪科技有限公司 Determining method of access users
JP6383284B2 (en) * 2014-12-22 2018-08-29 新日鉄住金ソリューションズ株式会社 Server apparatus, system, information processing method, and program

Also Published As

Publication number Publication date
JP2019091190A (en) 2019-06-13

Similar Documents

Publication Publication Date Title
US11533356B2 (en) Establishing a trust association
JP4719684B2 (en) Information search providing apparatus and information search providing system
US8745202B2 (en) Tracking remote browser crashes via cookies
JP5604441B2 (en) Impact estimation
CN109040329B (en) Method for determining contact person label, terminal device and medium
JP2006146882A (en) Content evaluation
US20090327054A1 (en) Personal reputation system based on social networking
EP2410478A1 (en) Browser based user identification
US20070174249A1 (en) Method and system for incorporating trusted metadata in a computing environment
WO2004084097A1 (en) Method and apparatus for detecting invalid clicks on the internet search engine
WO2006112988A2 (en) Prescriptive architecture recommendations
US9521034B2 (en) Method and apparatus for generating resource address, and system thereof
CN111444287A (en) Graph database construction method, associated information query method, device and computing equipment
US10922624B2 (en) Identifying users of shared devices based on user interactions and identity graph
JP2008176782A (en) Method and system for providing information extracted by reflecting concern
JP2009223802A (en) Improper content determining device, content providing system, improper content determining method, and computer program
US9531581B1 (en) Method and system for identifying and automatically registering domain names
US11334476B2 (en) Client-side survey control
JP6839640B2 (en) Accessor characteristic estimation system
JP2013161472A (en) Apparatus, method, and program for estimating difficulty of question and knowledge level of user in question/answer service
JP6872853B2 (en) Detection device, detection method and detection program
US8271482B2 (en) Information processing device
CN108737493B (en) Address allocation method and device and electronic equipment
JP2011233041A (en) Preference prediction system and preference prediction method
KR100676045B1 (en) Information providing method and system of extracting a personalized issue

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210215

R150 Certificate of patent or registration of utility model

Ref document number: 6839640

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150