KR20190120600A - Method for matching user identification information, and data management system - Google Patents

Method for matching user identification information, and data management system Download PDF

Info

Publication number
KR20190120600A
KR20190120600A KR1020180043979A KR20180043979A KR20190120600A KR 20190120600 A KR20190120600 A KR 20190120600A KR 1020180043979 A KR1020180043979 A KR 1020180043979A KR 20180043979 A KR20180043979 A KR 20180043979A KR 20190120600 A KR20190120600 A KR 20190120600A
Authority
KR
South Korea
Prior art keywords
information
user
log information
web
data management
Prior art date
Application number
KR1020180043979A
Other languages
Korean (ko)
Inventor
손상목
Original Assignee
에스케이플래닛 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이플래닛 주식회사 filed Critical 에스케이플래닛 주식회사
Priority to KR1020180043979A priority Critical patent/KR20190120600A/en
Publication of KR20190120600A publication Critical patent/KR20190120600A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

The present invention relates to a method for matching non-identification personal information, and a data management system. In classifying and collecting web usage information of a plurality of unspecified users made on a website which is connected through a communication network to provide predetermined information or service, the method matches the non-identification personal information collected from a plurality of different websites for the same user to obtain continuity of information collected for the same user. The data management system includes a data management server and an ID matching server.

Description

비식별 개인 정보 매칭 방법 및 이를 위한 데이터 관리 시스템 {Method for matching user identification information, and data management system}Non-identifiable personal information matching method and data management system for the same {Method for matching user identification information, and data management system}

본 발명은 통신망을 통해 접속되어 소정의 정보 또는 서비스를 제공하는 웹 사이트 상에서 이루어지는 불특정 다수의 사용자의 웹 이용 정보를 사용자 별로 구분하여 수집하기 위한 비식별 개인 정보 매칭 방법 및 이를 위한 데이터 관리 시스템에 관한 것이다.The present invention relates to a non-identifiable personal information matching method for collecting and classifying web usage information of an unspecified number of users on a web site providing predetermined information or services connected through a communication network, and a data management system therefor. will be.

유무선 통신망을 기반으로 온라인 서비스의 이용이 보편화되면서, 인터넷 상에 있는 각 웹 사이트, 모바일 단말에 설치된 어플리케이션 등 다양한 광고 매체를 통해 광고가 제공되고 있다.As the use of online services is becoming more common based on wired and wireless communication networks, advertisements are provided through various advertising media such as web sites on the Internet and applications installed in mobile terminals.

여기서 사용자에게 제시할 광고는 무작위로 선택하는 것보다도, 사용자의 관심사에 관련이 높을 것으로 예상되는 것을 선별하여 제공할 경우, 광고 효과를 더 높일 수 있다. 따라서, 사용자별로 개인화된 광고를 제공하기 위한 다양한 고안이 이루어지고 있다.In this case, if the advertisement to be presented to the user is selectively selected and provided to be expected to be highly related to the user's interest, the advertisement effect can be enhanced. Therefore, various designs have been made to provide personalized advertisements for each user.

이렇게 개인화된 광고를 제공하기 위해서는, 사용자를 식별하고 식별된 사용자와 관련된 다양한 정보를 수집하고, 수집한 정보를 기반으로 사용자의 성향을 분석할 수 있어야 한다. 그러나 최근 보안 및 사용자의 프라이버시 보호 측면이 강조되면서, 사용자로부터 직접적인 정보 수집이 어려워지고 있다. In order to provide such a personalized advertisement, it is necessary to identify the user, collect various information related to the identified user, and analyze the user's disposition based on the collected information. However, with the recent emphasis on security and privacy protection, it has become difficult to collect information directly from users.

이에 직접적인 회원 가입 절차 없이 정보 수집이 가능한 방식이 시도되고 있으며, 그 대표적인 방법으로, 브라우저를 통해서 웹상에서 이루어지는 사용자의 웹 이용 행위에 대한 정보(예를 들어, 접속 사이트 정보 등)를 수집하고, 쿠키(Cookie)를 이용하여 수집한 웹 이용 행위들을 사용자 별로 구분하고, 구분된 웹 이용 행위들의 분석을 통해서 사용자의 성향이나 관심도를 추출하는 방식이 사용된다. In this regard, a method of collecting information without a direct member registration process has been attempted. As a representative method, information on a user's web use behavior (for example, access site information, etc.) performed on the web through a browser is collected, and cookies are used. The web usages collected by using (Cookie) are classified by user, and the method of extracting user's disposition or interest through analysis of the divided web usages is used.

여기서, 쿠키는 사용자가 어떠한 웹사이트를 방문할 경우 그 사이트가 사용하고 있는 서버를 통해 사용자의 단말에 설치되는 작은 기록 정보 파일로서, HTTP 쿠키, 웹 쿠키, 브라우저 쿠키라고도 불리운다. 이 쿠키에 담긴 정보는 사용자가 같은 웹사이트를 방문할 때마다 읽히고 수시로 새로운 정보로 변경되는 것으로서, 서로 다른 사용자를 구분하는데 이용될 수는 있으나, 사용자나 디바이스를 정확히 특정할 수 있는 정보가 아니기 때문에 비식별 디바이스 ID 혹은 비식별 개인정보로서 사용자 정보 수집을 위해 많이 이용된다.Here, the cookie is a small record information file installed in the terminal of the user through the server used by the site when the user visits a website, and is also called an HTTP cookie, a web cookie, or a browser cookie. The information contained in this cookie is read each time a user visits the same website and is changed from time to time. It may be used to distinguish different users, but it is not information that can accurately identify a user or device. It is often used for collecting user information as a non-identifying device ID or non-identifying personal information.

이러한 쿠키는 도메인별로 저장되는데, 저장 및 접근 가능 여부에 따라서 퍼스트 파티 쿠키(1'st party cookie)와 서드 파티 쿠키(3rd party cookie)로 구분될 수 있다. 퍼스트 파티 쿠키는 사용자가 의도적으로 접속한 웹 사이트와 동일한 도메인에서 발생시킨 쿠키로서, 자신의 도메인에 자신의 정보를 써 넣을 수 있는 쿠키이고, 서드 파티 쿠키는 사용자가 의도적으로 액세스한 도메인이 아닌 다른 도메인(서드 파티 도메인)에 의해 발생된 쿠키로서, 자신의 도메인이 아닌 다른 도메인(즉, 1'st party 측 도메인)에 정보를 써 넣을 수 있는 쿠키를 말한다.These cookies are stored for each domain and may be classified into first party cookies and third party cookies according to their storage and accessibility. First-party cookies are cookies that originate from the same domain as the website you are intentionally accessing. You can write your information in your own domain. Third-party cookies are cookies that are different from the domain you have intentionally accessed. A cookie generated by a domain (third party domain). It is a cookie that can write information to a domain other than its own domain (ie, 1'st party domain).

광고 서비스 제공자는 상기 서드 파티 쿠키를 이용하여, 동일 사용자에 대해서 하나 이상의 다른 서비스 제공자에 의해 운용되는 웹 사이트에서 발행된 퍼스트 파티 쿠키를 동기화시키고, 이를 기반으로 사용자별 웹 이용 정보를 연속적으로 수집할 수 있다.The advertisement service provider may use the third party cookie to synchronize first party cookies issued by a website operated by one or more other service providers for the same user, and continuously collect user-specific web usage information based on the third party cookie. Can be.

그런데 이러한 서드 파티 쿠키는 해당 웹 사이트의 개인 정보 보호 정책의 통제를 받지 않는 것으로서, 이를 신뢰하지 못하는 사용자들을 위해서, 서드 파티 쿠키의 이용을 차단하는 기능이 추가됨으로써, 서드 파티 쿠키를 이용할 수 없게 되어, 동일 사용자에 대해서 하나 이상의 다른 서비스 제공자에 의해 운용되는 웹 사이트에서 발행된 퍼스트 파티 쿠키를 동기화시켜 사용자의 웹 이용 정보를 연속적으로 수집하는 것이 불가능하게 되었다.However, these third party cookies are not controlled by the website's privacy policy, and for users who do not trust them, the third party cookie is added to block the use of third party cookies, so third party cookies cannot be used. In addition, it has become impossible to continuously collect user web usage information by synchronizing first party cookies issued by websites operated by one or more other service providers for the same user.

따라서, 서드 파티 쿠키의 이용의 불가능한 환경에서도, 사용자의 웹 이용 정보를 연속적으로 수집하기 위해서, 동일한 사용자에 대하여 복수의 서로 다른 웹 사이트에서 발행되는 쿠키들을 매칭시키기 위한 기술이 필요하다.Therefore, even in an environment where third party cookies are not available, a technique for matching cookies issued from a plurality of different web sites for the same user is required in order to continuously collect the web usage information of the user.

한국공개특허 제10-2016-0003810호, 2016년 01월 11일 공개 (명칭: 정보 처리 시스템 및 정보 처리 방법)Korean Patent Publication No. 10-2016-0003810, published January 11, 2016 (Name: Information processing system and information processing method)

본 발명은 통신망을 통해 접속되어 소정의 정보 또는 서비스를 제공하는 웹 사이트 상에서 이루어지는 불특정 다수의 사용자의 웹 이용 정보를 사용자 별로 구분하여 수집하는데 있어서, 동일 사용자에 대하여 수집되는 정보의 연속성을 확보하기 위하여 동일 사용자에 대하여 복수의 서로 다른 웹 사이트에서 수집된 비식별 개인 정보를 매칭하는 비식별 개인 정보 매칭 방법 및 이를 위한 데이터 관리 시스템을 제공하고자 한다.The present invention is to collect the web usage information of an unspecified number of users made on a website that provides a predetermined information or service connected through a communication network for each user, in order to ensure the continuity of information collected for the same user To provide a non-identified personal information matching method for matching the non-identified personal information collected from a plurality of different web sites for the same user and a data management system for the same.

상기 과제를 해결하기 위한 수단으로서, 본 발명은 사용자의 접속 요청에 따라서 웹 기반 서비스를 제공하는 하나 이상의 서비스 제공 서버 및 상기 웹 기반 서비스에 대한 사용자의 웹 이용 정보를 수집하기 위한 데이터 관리 서버와 연동하는 아이디 매칭 서버에 의한 비식별 개인 정보 매칭 방법에 있어서, 상기 하나 이상의 서비스 제공 서버에서 제공하는 웹 페이지에, 해당 서비스 제공 서버를 접속하도록 설정된 제1 이미지 태그 및 상기 데이터 관리 서버에 접속하도록 설정된 제2 이미지 태그가 거의 동시에 구동하도록 적용하는 단계; 상기 하나 이상의 서비스 제공 서버로부터 제1 로그 정보 및 상기 데이터 관리 서버로부터 제2 로그 정보를 수집하는 단계; 상기 제1 로그 정보와 제2 로그 정보를 비교하여, 동일 시간대에 동일한 유저 에이전트 환경을 갖는 로그 정보를 추출하는 단계; 상기 추출한 제1 로그 정보의 퍼스트 파티 쿠키값과 제2 로그 정보의 서드 파티 쿠키값을 동일 사용자의 쿠키값으로 매칭시키는 단계를 포함하는 것을 특징으로 하는 비식별 개인 정보 매칭 방법을 제공한다.As a means for solving the above problems, the present invention is linked to at least one service providing server for providing a web-based service according to the user's access request and a data management server for collecting the user's web usage information for the web-based service A non-identified personal information matching method by an ID matching server, comprising: a first image tag configured to access a corresponding service providing server to a web page provided by the at least one service providing server, and a first image tag configured to access the data management server; Applying two image tags to drive at about the same time; Collecting first log information from the at least one service providing server and second log information from the data management server; Comparing the first log information with the second log information to extract log information having the same user agent environment in the same time zone; And matching the first party cookie value of the extracted first log information and the third party cookie value of the second log information with a cookie value of the same user.

여기서, 상기 제1,2 로그 정보는 접속 시간 정보, 유저의 IP 주소, 유저 에이전트 정보 중 하나 이상을 포함하고, 상기 유저 에이전트 정보는 단말 정보, OS 정보, 웹 브라우저 정보 중 하나 이상을 포함한다.The first and second log information may include at least one of access time information, an IP address of a user, and user agent information, and the user agent information may include at least one of terminal information, OS information, and web browser information.

아울러, 상기 추출하는 단계는, 접속 시간 정보를 기준으로, 제2 로그 정보와 거의 동일 시간대에 기록된 제1 로그 정보를 추출하는 단계; 상기 제2 로그 정보의 유저 IP 주소와 상기 추출한 제1 로그 정보의 유저 IP 주소를 비교하는 단계; 상기 제2 로그 정보의 유저 에이전트 정보와 상기 추출한 제1 로그 정보의 유저 에이전트 정보를 비교하는 단계; 및 상기 유저 IP 주소와 유저 에이전트 정보 중 하나 이상이 일치하면, 상기 추출한 제1 로그 정보를 제2 로그 정보를 동일 사용자에 대한 접속 기록으로 판단하는 단계를 포함할 수 있다.The extracting may include extracting first log information recorded at about the same time zone as the second log information based on the access time information; Comparing the user IP address of the second log information with the user IP address of the extracted first log information; Comparing the user agent information of the second log information with the user agent information of the extracted first log information; And when the at least one of the user IP address and the user agent information match, determining the extracted first log information as the second log information as an access record for the same user.

또한, 본 발명은 상술한 과제의 다른 해결 수단으로서, 하나 이상의 서비스 제공 서버를 통해 사용자에게 제공되는 웹 기반 서비스에 대한 사용자의 웹 이용 정보를 수집하기 위한 데이터 관리 시스템에 있어서, 상기 하나 이상의 서비스 제공 서버로부터 사용자들의 웹 이용 정보를 수집하고, 상기 하나 이상의 서비스 제공에서 웹 기반 서비스의 사용자에게 제공되는 쿠키값을 이용하여 상기 수집한 웹 이용 정보를 사용자별로 구분하는 데이터 관리 서버; 및 상기 하나 이상의 서비스 제공 서버에서 제공하는 웹 페이지에, 해당 서비스 제공 서버를 접속하도록 설정된 제1 이미지 태그 및 상기 데이터 관리 서버에 접속하도록 설정된 제2 이미지 태그가 거의 동시에 구동하도록 적용한 후, 상기 하나 이상의 서비스 제공 서버로부터 제1 로그 정보 및 상기 데이터 관리 서버로부터 제2 로그 정보를 수집하고, 상기 수집한 제1 로그 정보와 제2 로그 정보를 비교하여, 동일 시간대에 동일한 유저 에이전트 환경을 갖는 로그 정보를 추출하여, 상기 추출한 제1 로그 정보의 퍼스트 파티 쿠키값과 제2 로그 정보의 서드 파티 쿠키값을 동일 사용자의 쿠키값으로 매칭시키는 아이디 매칭 서버를 포함하는 데이터 관리 시스템을 제공한다.In addition, the present invention as another solution to the above problem, in the data management system for collecting the user's web usage information for the web-based service provided to the user through one or more service providing server, the one or more services provided A data management server that collects web usage information of users from a server and classifies the collected web usage information for each user by using a cookie value provided to a user of a web-based service in providing the one or more services; And applying the first image tag set to access the service providing server and the second image tag set to access the data management server to operate at substantially the same time on a web page provided by the one or more service providing servers. Collecting the first log information from the service providing server and the second log information from the data management server, and comparing the collected first log information and the second log information, log information having the same user agent environment in the same time zone And an ID matching server extracting the first party cookie value of the extracted first log information and the third party cookie value of the second log information to a cookie value of the same user.

본 발명에 따른 데이터 관리 시스템에 있어서, 상기 아이디 매칭 서버는, 접속 시간 정보를 기준으로, 제2 로그 정보와 거의 동일 시간대에 기록된 제1 로그 정보를 추출하고, 상기 제2 로그 정보의 유저 IP 주소 및 유저 에이전트 정보중 하나 이상을 상기 추출한 제1 로그 정보의 유저 IP 주소 및 유저 에이전트 정보 중 하나 이상과 비교하여, 상기 유저 IP 주소와 유저 에이전트 정보 중 하나 이상이 일치하면, 상기 추출한 제1 로그 정보를 제2 로그 정보를 동일 사용자에 대한 접속 기록으로 판단할 수 있다.In the data management system according to the present invention, the ID matching server extracts the first log information recorded at about the same time zone as the second log information based on the access time information, and the user IP of the second log information. Comparing the at least one of address and user agent information with at least one of user IP address and user agent information of the extracted first log information, and if at least one of the user IP address and the user agent information is matched, the extracted first log The information may determine the second log information as a connection record for the same user.

더하여, 본 발명에 따른 데이터 관리 시스템은, 상기 제1,2 이미지 태그가 삽입된 웹 페이지를 포함하는 웹 사이트를 구동하여, 사용자의 요청에 따라서 상기 웹 페이지를 제공하는 하나 이상의 서비스 제공 서버를 더 포함할 수 있다.In addition, the data management system according to the present invention may further include at least one service providing server configured to drive a web site including a web page into which the first and second image tags are inserted and to provide the web page in response to a user's request. It may include.

상술한 해결 수단에 따르면, 본 발명은 사용자가 서드 파티 쿠키의 사용을 차단하더라도, 사용자가 웹 페이지의 접속 시, 이미지 태그를 이용하여 사용자의 단말기가 퍼스트 파티측, 즉, 서비스 제공 서버의 웹 사이트 및 서드 파티 측, 즉, 데이터 관리 서버의 웹 사이트에 동시에 접속하여 접속 로그를 남기도록 한 후, 사기 서비스 제공 서버 및 데이터 관리 서버의 로그 정보를 수집하여 비교함에 의하여, 동일한 사용자에 의하여 동일한 조건으로 기록된 로그 정보를 기반으로 동일 사용자의 퍼스트 파티 쿠키값 및 서드 파티 쿠키값을 매칭시킬 수 있으며, 그 결과, 동일 사용자의 웹 이용 정보를 연속적으로 수집할 수 있게 한다.According to the above-described solution, the present invention, even if the user blocks the use of third-party cookies, when the user accesses the web page, the user terminal using the image tag, the first party side, that is, the website of the service providing server And by simultaneously accessing the third party side, that is, the web site of the data management server to leave the access log, and collecting and comparing log information of the fraud service providing server and the data management server on the same condition by the same user. The first party cookie value and the third party cookie value of the same user can be matched based on the recorded log information. As a result, the web user information of the same user can be continuously collected.

도 1은 본 발명에 따른 데이터 관리 시스템의 전체 구성을 나타낸 블록도이다.
도 2는 본 발명에 따른 비식별 개인 정보 매칭 방법을 나타낸 순서도이다.
도 3은 본 발명에 따른 비식별 개인 정보 매칭 방법에 있어서, 로그 정보의 비교 분석 과정을 더 구체적으로 나타낸 순서도이다.
도 4는 본 발명에 따른 비식별 개인 정보 매칭 방법이 적용된 데이터 관리 시스템의 웹 이용 정보 수집 동작을 나타낸 메시지 흐름도이다.
1 is a block diagram showing the overall configuration of a data management system according to the present invention.
2 is a flowchart illustrating a method of matching non-identifiable personal information according to the present invention.
3 is a flowchart illustrating a comparative analysis process of log information in a non-identified personal information matching method according to the present invention in more detail.
4 is a message flow diagram illustrating a web usage information collection operation of a data management system to which a non-identifying personal information matching method according to the present invention is applied.

이하 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 다만, 하기의 설명 및 첨부된 도면에서 본 발명의 요지를 흐릴 수 있는 공지 기능 또는 구성에 대한 상세한 설명은 생략한다. 또한, 도면 전체에 걸쳐 동일한 구성 요소들은 가능한 한 동일한 도면 부호로 나타내고 있음에 유의하여야 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. However, in the following description and the accompanying drawings, detailed descriptions of well-known functions or configurations that may obscure the subject matter of the present invention will be omitted. In addition, it should be noted that like elements are denoted by the same reference numerals as much as possible throughout the drawings.

이하에서 설명되는 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위한 용어의 개념으로 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서 본 명세서에 기재된 실시 예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시 예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다.The terms or words used in the specification and claims described below should not be construed as being limited to ordinary or dictionary meanings, and the inventors are appropriate as concepts of terms for explaining their own invention in the best way. It should be interpreted as meanings and concepts in accordance with the technical spirit of the present invention based on the principle that it can be defined. Therefore, the embodiments described in the present specification and the configuration shown in the drawings are only the most preferred embodiments of the present invention, and do not represent all of the technical ideas of the present invention, and various alternatives may be substituted at the time of the present application. It should be understood that there may be equivalents and variations.

또한, 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하기 위해 사용하는 것으로, 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용될 뿐, 상기 구성요소들을 한정하기 위해 사용되지 않는다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제2 구성요소는 제1 구성요소로 명명될 수 있고, 유사하게 제1 구성요소도 제2 구성요소로 명명될 수 있다.In addition, terms including ordinal numbers, such as first and second, are used to describe various components, and are used only to distinguish one component from another component, and to limit the components. Not used. For example, without departing from the scope of the present invention, the second component may be referred to as the first component, and similarly, the first component may also be referred to as the second component.

더하여, 어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급할 경우, 이는 논리적 또는 물리적으로 연결되거나, 접속될 수 있음을 의미한다. 다시 말해, 구성요소가 다른 구성요소에 직접적으로 연결되거나 접속되어 있을 수 있지만, 중간에 다른 구성요소가 존재할 수도 있으며, 간접적으로 연결되거나 접속될 수도 있다고 이해되어야 할 것이다.In addition, when a component is referred to as being "connected" or "connected" to another component, it means that it may be connected or connected logically or physically. In other words, although a component may be directly connected or connected to other components, it should be understood that other components may exist in the middle, and may be connected or connected indirectly.

또한, 본 명세서에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 또한, 본 명세서에서 기술되는 "포함 한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.In addition, the terminology used herein is for the purpose of describing particular embodiments only and is not intended to be limiting of the invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In addition, the terms "comprises" or "having" described herein are intended to indicate that there is a feature, number, step, operation, component, part, or combination thereof described in the specification, and one or the same. It is to be understood that the present invention does not exclude in advance the possibility of the presence or the addition of other features, numbers, steps, operations, components, parts, or a combination thereof.

이하에서 설명하는 본 발명은 웹 사이트나 웹 어플리케이션의 접속 이력, 접속한 웹 사이트에서의 구매 이력, 검색 이력 등과 같은 웹 이용 정보를 수집하여, 사용자 별로 구분하여 분석하기 위한 데이터 관리 시스템(Data Management Platform)에 관련된다. 이러한 데이터 관리 시스템은 광고 서비스를 제공하는 광고 서비스 서버와 연계되어, 광고를 제공할 사용자들을 웹 이용 정보를 기반으로 분류하여, 광고에 타겟팅된 그룹의 사용자가 광고 요청 시, 상기 광고를 제공하기 위하여 이용될 수 있다. 물론, 상기 데이터 관리 시스템의 적용 분야는 광고 서비스에 한정되지 않고 다양한 분야에서 응용될 수 있다.The present invention described below is a data management system for collecting and analyzing web usage information such as a web site or web application access history, a purchase history and a search history on an access web site, and analyzing the data for each user. Is related to). The data management system is linked with an advertisement service server that provides an advertisement service, and classifies users who will provide advertisements based on web usage information, so that the user of the group targeted to the advertisement is provided when the advertisement is requested. Can be used. Of course, the application field of the data management system is not limited to the advertisement service, but may be applied in various fields.

특히, 본 발명은 이러한 데이터 관리 시스템에서, 불특정 다수의 사용자들로부터 수집한 웹 이용 정보를, 사용자별로 구분하는데 이용되는 비식별 개인 정보를 사용자별로 매칭하기 위한 기술이다.In particular, the present invention is a technology for matching the non-identified personal information used to distinguish the web usage information collected from the unspecified number of users for each user in such a data management system.

여기서, 비식별 개인 정보는, 주민등록번호, 사용자 ID와 같이 특정한 개인을 식별할 수 있는 정보를 제외한 사용자 정보로서, 사전 동의 없이 활용될 수 있는 정보를 의미하는 것이다. 이러한 비식별 개인 정보는 다양한 정보를 포함할 수 있는데, 대표적으로 웹 브라우저를 통해 웹 사이트에 접속 시, 상기 웹 사이트에서 생성되어 제공되는 쿠키(Cookies) 정보가 될 수 있다. 이하에서, 비식별 개인 정보로서, 쿠키를 예를 들어 설명한다.Here, the non-identifying personal information is user information excluding information for identifying a specific individual, such as a social security number and a user ID, and means information that can be utilized without prior consent. Such non-identifying personal information may include various information. Typically, when the web site is accessed through a web browser, the non-identified personal information may be cookie information generated and provided by the web site. In the following, cookies are described as non-identified personal information.

부연하면, 본 발명은 웹 브라우저에서 사용자에 의해 서드 파티 쿠키가 차단 설정되더라도, 서로 다른 웹 사이트, 더 구체적으로, 퍼스트 파티 측의 웹 사이트와 서드 파티측 웹 사이트에서 발생된 쿠키를 매칭시키고자 한다.In other words, the present invention attempts to match cookies generated from different websites, more specifically, first party websites and third party websites, even if third party cookies are set to be blocked by the user in a web browser. .

도 1은 본 발명에 따른 비식별 개인 정보 매칭 기술이 적용된 데이터 관리 시스템의 전체 구조를 나타낸 블럭도이다.1 is a block diagram showing the overall structure of a data management system to which a non-identifying personal information matching technology according to the present invention is applied.

본 발명에 따른 데이터 관리 시스템은, 통신망(10)을 통하여 연동하는, 단말기(20)와, 하나 이상의 서비스 제공 서버(30)와, 데이터 관리 서버(40)와, 아이디 매칭 서버(50)를 포함하여 이루어질 수 있다.The data management system according to the present invention includes a terminal 20, at least one service providing server 30, a data management server 40, and an ID matching server 50, which interoperate with the communication network 10. It can be done by.

상기 통신망(10)은, 상용화되었거나 연구되고 있는 다양한 방식의 유선 및 무선 통신망을 포함하는 것으로서, 예를 들면, WLAN(Wireless LAN), 와이파이(Wi-Fi), 와이브로(Wibro), 와이맥스(Wimax), HSDPA(High Speed Downlink Packet Access) 등의 무선 통신망과, 이더넷(Ethernet), xDSL(ADSL, VDSL), HFC(Hybrid Fiber Coaxial Cable), FTTC(Fiber to The Curb), FTTH(Fiber To The Home) 등의 유선 통신망을 포함할 수도 있다.The communication network 10 includes various types of wired and wireless communication networks that are commercially available or are being studied. For example, a wireless LAN (WLAN), a Wi-Fi (Wi-Fi), a Wibro, a WiMAX (Wimax) , Wireless communication networks such as High Speed Downlink Packet Access (HSDPA), Ethernet, xDSL (ADSL, VDSL), Hybrid Fiber Coaxial Cable (HFC), Fiber to The Curb (FTTC), and Fiber To The Home (FTTH) It may also include a wired communication network such as.

아울러, 본 발명의 통신망(10)은 예컨대, 다수의 접속망(미도시) 및 이들을 연결하는 코어망(미도시)으로 이루어진 이동통신망을 포함할 수 있다. 여기서, 접속망은 단말과 직접 접속하여 무선 통신을 수행하는 망으로서, 예를 들어, BS(Base Station), BTS(Base Transceiver Station), NodeB, eNodeB 등과 같은 다수의 기지국과, BSC(Base Station Controller), RNC(Radio Network Controller)와 같은 기지국 제어기로 구현될 수 있다. 또한, 전술한 바와 같이, 상기 기지국에 일체로 구현되어 있던 디지털 신호 처리부와 무선 신호 처리부를 각각 디지털 유니트(Digital Unit, 이하 DU라 함과 무선 유니트(Radio Unit, 이하 RU라 함)으로 구분하여, 다수의 영역에 각각 다수의 RU(미도시)를 설치하고, 다수의 RU를 집중화된 DU와 연결하여 구성할 수도 있다. 또한, 접속망과 함께 모바일 망을 구성하는 코어망(미도시)은 접속망과 외부 망, 예컨대, 인터넷망과 같은 다른 통신망을 연결하는 역할을 수행한다.In addition, the communication network 10 of the present invention may include, for example, a mobile communication network including a plurality of connection networks (not shown) and a core network (not shown) connecting them. Here, the access network is a network that performs wireless communication by directly connecting to a terminal, for example, a plurality of base stations such as a base station (BS), a base transceiver station (BTS), a NodeB, an eNodeB, and a base station controller (BSC). It may be implemented as a base station controller such as a Radio Network Controller (RNC). In addition, as described above, the digital signal processing unit and the wireless signal processing unit, which are integrally implemented in the base station, are divided into digital units (hereinafter referred to as DUs and radio units (hereinafter referred to as RUs)). A plurality of RUs (not shown) may be installed in a plurality of areas, respectively, and a plurality of RUs may be connected to a centralized DU, and a core network (not shown) constituting a mobile network together with an access network may be connected with the access network. It serves to connect another communication network such as an external network, for example, the Internet network.

이러한 코어망은 앞서 설명한 바와 같이, 접속망 간의 이동성 제어 및 스위칭 등의 이동통신 서비스를 위한 주요 기능을 수행하는 통신망 시스템으로서, 서킷 교환(circuit switching) 또는 패킷 교환(packet switching)을 수행하며, 모바일 망 내에서의 패킷 흐름을 관리 및 제어한다. 또한, 코어망은 주파수간 이동성을 관리하고, 접속망 및 코어망 내의 트래픽 및 다른 통신망, 예컨대 인터넷망과의 연동을 위한 역할을 수행할 수도 있다. 이러한 코어망은 SGW(Serving GateWay), PGW(PDN GateWay), MSC(Mobile Switching Center), HLR(Home Location Register), MME(Mobile Mobility Entity)와 HSS(Home Subscriber Server) 등을 더 포함하여 구성될 수도 있다.As described above, the core network is a communication network system that performs main functions for mobile communication services such as mobility control and switching between access networks, and performs circuit switching or packet switching. Manage and control the flow of packets within In addition, the core network may manage inter-frequency mobility and may play a role for interworking with traffic in the access network and the core network and other communication networks such as the Internet network. The core network may further include a serving gateway (SGW), a PDN gateway (PGW), a mobile switching center (MSC), a home location register (HLR), a mobile mobility entity (MME), and a home subscriber server (HSS). It may be.

또한, 본 발명에 따른 통신망(10)은 인터넷망을 포함할 수 있다. 인터넷망은 TCP/IP 프로토콜에 따라서 정보가 교환되는 통상의 공개된 통신망, 즉 공용망을 의미한다.In addition, the communication network 10 according to the present invention may include an internet network. The Internet network refers to a general public communication network, that is, a public network, through which information is exchanged according to the TCP / IP protocol.

상술한 통신망(10)을 통해 연동하는 구성 중, 단말기(20)는 웹 기반의 서비스를 이용하는 사용자의 장치를 나타낸 것으로서, 하나 이상의 프로세서, 상기 프로세서에 의해 실행되는 프로그램 모듈 및 그에 의해 처리된 데이터를 저장하는 메모리, 통신망(10)에 접속하여 데이터를 송수신하기 위한 통신 모듈, 사용자 조작을 위한 입력 수단 등을 포함할 수 있으며, 상기 프로세서에 의해서 실행되는 프로그램 모듈로서, OS 프로그램 및 웹 사이트에 접속하여 웹 페이지를 랜더링할 수 있는 웹 브라우저 등을 포함할 수 있다.In the configuration of interworking through the communication network 10 described above, the terminal 20 is a device of a user using a web-based service, one or more processors, a program module executed by the processor and the data processed by the It may include a memory for storing, a communication module for transmitting and receiving data by connecting to the communication network 10, an input means for a user operation, etc., which is a program module executed by the processor, connected to an OS program and a website And a web browser capable of rendering a web page.

상기 단말기(20)는 웹 브라우저를 구동하고, 상기 구동된 웹 브라우저를 통해서 하나 이상의 서비스 제공 서버(30)에서 제공하는 웹 사이트를 이용할 수 있다.The terminal 20 may drive a web browser and use a web site provided by one or more service providing servers 30 through the driven web browser.

하나 이상의 서비스 제공 서버(30)는, 웹 기반 서비스를 제공하는 서버 장치로서, 각각 고유의 도메인 네임을 가지는 웹 사이트를 하나 이상 제공한다. 여기서, 웹 사이트는, 하나 이상의 웹 페이지로 이루어지는 정보의 집합체를 의미한다. 참고로, 상기 도메인 네임은 최상위 도메인과 서브도메인, 호스트 이름 등으로 계층적으로 구성되어, 통신망(10)에 연결된 컴퓨터, 예를 들어, 서버 컴퓨터를 구별해 준다.The at least one service providing server 30 is a server device for providing a web-based service, and provides at least one web site each having a unique domain name. Here, a web site means a collection of information which consists of one or more web pages. For reference, the domain name is hierarchically composed of a top-level domain, a subdomain, and a host name to distinguish a computer connected to the communication network 10, for example, a server computer.

이러한 서비스 제공 서버(30)는 예를 들어, 온라인 상에서 물품 또는 서비스의 구매/판매 서비스를 제공하는 전자상거래 서비스, 웹 기반으로 제공되는 정보의 검색 서비스, 웹 사이트/웹 브라우저와 같은 온라인 광고 매체를 통해서 광고를 제공하는 광고 서비스 등의 다양한 서비스를 각각 제공할 수 있다.The service providing server 30 may be provided with, for example, an e-commerce service that provides a purchase / sale service of goods or services online, a search service of information provided on a web basis, and an online advertising medium such as a web site / web browser. Various services such as an advertisement service for providing an advertisement may be provided through each.

상기 단말기(20)는 웹 브라우저를 이용하여 상기 서비스 제공 서버(30)에서 제공하는 웹 사이트에 접근하여, 해당 웹 사이트에서 제공하는 정보 또는 서비스를 사용자에게 제공한다.The terminal 20 accesses a web site provided by the service providing server 30 using a web browser, and provides the user with information or service provided by the web site.

다음으로, 데이터 관리 서버(40)는 상기 하나 이상의 서비스 제공 서버(30)에서 제공하는 웹 사이트에 대한 단말기(20)의 접속에 따른 웹 이용 정보를 수집하고, 수집한 웹 이용 정보를 웹 사이트에서 제공하는 쿠키를 기반으로 사용자 별로 구분하여 분석한다. Next, the data management server 40 collects web usage information according to the connection of the terminal 20 to the web site provided by the one or more service providing servers 30, and collects the collected web usage information on the web site. Based on the cookies provided, they are analyzed by user.

마지막으로, 아이디 매칭 서버(50)는 상기 하나 이상의 서비스 제공 서버(30) 및 데이터 관리 서버(40)에서 동일 단말기(30)에 대하여 제공하는 쿠키를 매칭하기 위한 장치로서, 본 발명에 따른 비식별 개인 정보 매칭 방법에 따라서 단말기(20)가 사용자 의도에 따라서 접속한 웹 사이트로부터 상기 단말기(20)의 사용자에 대하여 생성되어 제공되는 퍼스트 파티 쿠키값과, 상기 데이터 관리 서버(40)가 상기 단말기(20)가 접속한 웹 사이트의 웹 이용 정보 수집을 위하여 상기 단말기(20)에 대하여 생성한 서드 파티 쿠키값을 매칭시킨다. 상기 아이디 매칭 서버(50)의 매칭 결과는 상기 데이터 관리 서버(40)로 제공되어, 상기 데이터 관리 서버(40)가 매칭된 퍼스트 파티 쿠키값과 서드 파티 쿠키값을 이용하여 동일 사용자의 웹 이용 정보를 누적하고, 이를 분석하여 해당 사용자의 행위를 분석할 수 있게 한다.Finally, the ID matching server 50 is a device for matching the cookies provided by the one or more service providing server 30 and the data management server 40 for the same terminal 30, the non-identification according to the present invention According to the personal information matching method, a first party cookie value generated and provided to a user of the terminal 20 from a web site accessed by the terminal 20 according to a user's intention, and the data management server 40 is connected to the terminal ( The third party cookie value generated for the terminal 20 is matched to collect the web usage information of the web site accessed by 20). The matching result of the ID matching server 50 is provided to the data management server 40 so that the data management server 40 uses the first party cookie value and the third party cookie value matched with the web user information. To accumulate and analyze the user's behavior.

다음으로, 도 2 및 도 3은 본 발명에 따른 비식별 개인 정보 매칭 방법을 나타낸 순서도이다. 상술한 데이터 관리 시스템에 있어서, 도 2 및 도 3에 도시한 비식별 개인 정보 매칭 방법은, 상기 데이터 관리 서버(40)와 아이디 매칭 서버(50)의 연동을 통해 이루어진다.Next, FIGS. 2 and 3 are flowcharts illustrating a method of matching non-identifiable personal information according to the present invention. In the above-described data management system, the non-identifiable personal information matching method shown in FIGS. 2 and 3 is performed through the interworking of the data management server 40 and the ID matching server 50.

도 2를 참조하면, 본 발명은 비식별 개인 정보 매칭을 위하여, 먼저, 사용자가 의도적으로 접속하는 퍼스트 파티 측을 호출하는 제1 이미지 태그와, 사용자의 의도로 접속된 것이 아닌 서드 파티측을 호출하기 위한 제2 이미지 태그를 설정한다(S205, S215). 여기서 이미지 태그는 쿠키와 결합되어 이용자가 웹 사이트를 이용하거나 이메일을 보내는 등의 행동을 모니터링하기 위해 웹 페이지에 포함되는 오브젝트를 의미하는 것으로서, 사용자에게 보이지 않도록 1픽셀*1픽셀 이하로 임베디드되는 투명한 이미지를 통해 추가된다. 이러한 이미지 태그는 Web bug, web beacon, pixel tag, clear GIF, e-mail 트래킹이라는 다양한 이름으로 불린다. 이러한 이미지 태그를 통해서 통상적으로, 웹 사이트 운영자는 이용자들이 언제 접속하고 얼마만큼의 시간동안 이용하는지, 어떤 타입의 브라우저에서 이용하는지, 쿠키 값을 어떻게 설정하는 지, 이용자의 IP 주소는 무엇인지에 관하여 정보를 추적할 수 있다. 본 발명은, 이러한 이미지 태그를 이용하여 비식별 개인 정보를 매칭시키고자 하는 것으로서, 삽입되는 웹 페이지의 브라우징 시에 동시에 구동되어 각각 퍼스트 파티측과 서드 파티측을 각각 호출하는 제1,2 이미지 태그를 설정하는 것이다. 여기서 퍼스트 파티측은, 사용자가 호출한 웹 페이지의 도메인에 해당하는 웹 사이트로서, 도 1의 데이터 관리 시스템에 있어서, 하나 이상의 서비스 제공 서버(30) 중 어느 하나가 될 수 있으며, 서드 파티측은 사용자가 의도적으로 호출하지 않은 도메인을 의미하는 것으로서, 본 발명에서는 사용자의 웹 이용 정보를 수집하고자 하는 데이터 관리 서버(40)가 된다.Referring to FIG. 2, in order to match non-identified personal information, first, a first image tag calling a first party side in which the user intentionally connects, and a third party side not connected to the intention of the user are called. A second image tag to be set is set (S205 and S215). Here, an image tag is an object that is embedded in a web page that is combined with a cookie to monitor the user's behavior such as using a website or sending an email. Is added via image. These image tags are called various names: Web bugs, web beacons, pixel tags, clear GIFs, and e-mail tracking. With these image tags, a web site operator typically tells users when and how long they are connected, how long they use, what type of browser they use, how to set cookie values, and what their IP address is. Information can be tracked. The present invention is intended to match non-identifiable personal information using such an image tag, and is driven simultaneously when browsing an inserted web page, and the first and second image tags respectively calling first and third parties respectively. To set it. Here, the first party side is a web site corresponding to the domain of the web page called by the user. In the data management system of FIG. 1, the first party side may be any one or more service providing servers 30. As the domain is not intentionally called, in the present invention, the data management server 40 to collect the user's web usage information.

그리고, 상기 제1,2 이미지 태그는 추적하고자 하는 웹 사이트의 해당 웹 페이지에 동시에 구동되도록 적용된다(S220). 상기 제1,2 이미지태그의 적용은, 해당 웹 사이트를 운용하는 서비스 제공 서버(40)을 통해서 이루어질 수 있다.In addition, the first and second image tags are applied to be simultaneously driven to the corresponding web page of the web site to be tracked (S220). Application of the first and second image tags may be made through a service providing server 40 operating a corresponding web site.

따라서, 이후 사용자가 해당 웹 사이트를 호출하면, 상기 웹 페이지에 삽입된 제1,2 이미지 태그가 동시에 구동하여, 서비스 제공 서버(30)와 데이터 관리 서버(40)에 접속을 수행하며, 이에, 상기 서비스 제공 서버(30)와 데이터 관리 서버(40)에는 상기 사용자의 웹 접속 이력이 로그에 기록된다.Therefore, when the user calls the web site, the first and second image tags inserted into the web page are simultaneously driven to access the service providing server 30 and the data management server 40. In the service providing server 30 and the data management server 40, a web access history of the user is recorded in a log.

따라서, 상기 아이디 매칭 서버(50)는 퍼스트 파티 측에 해당하는 하나 이상의 서비스 제공 서버(30)로부터 제1,2 이미지 태그의 적용 이후 소정 기간 동안의 로그 정보(이하, 제1 로그 정보라 함)를 수집하고, 동시에 서드 파티측에 해당하는 데이터 관리 서버(40)로부터 제1,2 이미지 태그의 적용 이후 소정 기간 동안의 로그 정보(이하, 제2 로그 정보라 함)을 수집한다(S230, S235). 상기 제1,2 로그 정보는, 각 서버에서 기록하는 로그 정보로서, 해당 서버에 대한 접속 시간, 접속한 유저 에이전트 정보, 접속한 클라이언트의 IP 주소를 포함한다. 상기에서 유저 에이전트 정보는, 접속한 유저가 사용한 웹 브라우저의 종류 및 버전 정보, 상기 유저의 단말기에 설치된 OS 정보 등, 접속한 유저가 사용한 단말기(20)의 환경 정보를 포함한다. 여기서, 해당 서버에서 기록하는 로그 정보량이 많을 경우, 접속 로그로 한정하여 수집할 수도 있다.Accordingly, the ID matching server 50 logs information for a predetermined period of time after the application of the first and second image tags from one or more service providing servers 30 corresponding to the first party (hereinafter, referred to as first log information). And collect log information (hereinafter referred to as second log information) for a predetermined period after the application of the first and second image tags from the data management server 40 corresponding to the third party side (S230 and S235). ). The first and second log information are log information recorded by each server, and include a connection time for the server, user agent information connected, and an IP address of a client connected. The user agent information includes the environment information of the terminal 20 used by the connected user, such as the type and version information of the web browser used by the connected user, OS information installed in the terminal of the user. Here, when the amount of log information recorded by the server is large, it may be limited to the access log and collected.

그리고, 아이디 매칭 서버(50)는 상기 수집한 제1 로그 정보와 제2 로그 정보를 비교하여, 동일 사용자에 의해 동일 시간대에 이루어진 로그 정보를 추출한다(S240). 그리고, 동일 시간대의 제1 로그 정보와 제2 로그 정보의 각각 퍼스트 파티 쿠키값과 서드 파티 쿠키값을 동일 사용자의 쿠키값으로 매칭시킨다(S245).The ID matching server 50 compares the collected first log information with the second log information, and extracts log information made by the same user in the same time zone (S240). Then, the first party cookie value and the third party cookie value of the first log information and the second log information of the same time zone are matched with the cookie values of the same user (S245).

도 3은 본 발명에 따른 비식별 개인 정보 매칭 방법에 있어서 상기 S240 단계 및 S245 단계를 더 구체적으로 나타낸 것으로서, 이를 참조하여 제1,2 로그 정보를 비교하여 동일 사용자의 퍼스트 파티 쿠키값과 서드 파티 쿠키값을 추출하여 매칭시키는 과정을 더 구체적으로 설명한다.3 is a diagram illustrating steps S240 and S245 in more detail in the method of matching non-identifiable personal information according to the present invention. First and second party cookie values and third parties of the same user are compared by referring to the first and second log information with reference thereto. The process of extracting and matching cookie values will be described in more detail.

본 발명에서와 같이, 데이터 관리 서버(40)를 통해서 특정 웹 사이트에 접속한 사용자의 웹 이용 정보를 수집하고자 할 경우, 데이터 관리 서버(40)에서 생성한 DMP 쿠키와 매칭되는 동일 사용자의 다른 웹 사이트의 쿠키 정보를 찾아야 한다.As in the present invention, when it is desired to collect web usage information of a user accessing a specific web site through the data management server 40, another web of the same user matching the DMP cookie generated by the data management server 40 Find your site's cookie information.

따라서, 본 발명은, 도 3에 도시된 바와 같이, 상기 데이터 관리 서버(40), 즉, DMP 사이트의 제2 로그 정보를 기준으로 상기 제2 로그 정보에 기록된 접속 시간과 동일 시간대에 기록된 제1 로그 정보를 추출한다(S305). 이때 동일 시간대의 범위는 통신망 상에서의 전송 지연 시간의 차 및 서버 성능에 따른 처리 지연 시간의 차를 고려하여, 상기 제1 로그 정보의 접속 시간을 기준으로 ±±αα의 범위 이내가 될 수 있다.Therefore, the present invention, as shown in Figure 3, is recorded in the same time zone as the access time recorded in the second log information on the basis of the second log information of the data management server 40, that is, DMP site The first log information is extracted (S305). In this case, the range of the same time zone may be within ±± αα based on the access time of the first log information in consideration of the difference in the transmission delay time on the communication network and the difference in the processing delay time according to the server performance.

그리고, 제2 로그 정보와 동일 시간대의 제1 로그 정보가 추출되면, 상기 제1,2 로그 정보에 기록된 유저 에이전트 정보를 확인한다(S310). 여기서 유저 에이전트 정보는, 해당 서버에 접속한 사용자 측 에이전트의 환경 정보로서, 앞서 설며안 바와 같이, OS 종류 및 버전 정보, 웹 브라우저의 종류 및 버전 정보, 디바이스 정보 등을 포함한다.When the first log information at the same time zone as the second log information is extracted, the user agent information recorded in the first and second log information is checked (S310). Here, the user agent information is environment information of the user side agent connected to the server, and as described above, the OS agent information includes OS type and version information, web browser type and version information, and device information.

또한, 상기 동일 시간대의 제1,2 로그 정보에서 유저의 IP 정보를 확인한다(S315).In addition, the IP information of the user is checked from the first and second log information of the same time zone (S315).

그리고 상기 확인한 유저 에이전트 정보와 유저 IP 정보 중 하나 이상이 일치하면 동일 시간대에 퍼스트 파티 사이트에 접속한 사용자와 서드 파티, 즉, DMP 사이트에 접속한 사용자를 동일한 사용자로 판단하고(S320), 상기 동일 시간대에 추출한 제1 로그 정보의 퍼스트 파티 쿠키값과 제2 로그 정보의 서드 파트 쿠키값, 즉, DMP 쿠키값을 매칭시킨다(S325).If one or more of the checked user agent information and the user IP information match, the user who accesses the first party site and the third party, that is, the user who accesses the DMP site are determined to be the same user (S320). The first party cookie value of the first log information extracted in the time zone and the third part cookie value of the second log information, that is, the DMP cookie value are matched (S325).

도 4는 본 발명에 따른 비식별 개인 정보 매칭 기술을 적용하여 이루어지는 데이터 관리 시스템의 연동 동작을 나타낸 메시지 흐름도이다.4 is a message flow diagram illustrating an interlocking operation of a data management system by applying a non-identifying personal information matching technology according to the present invention.

도 4를 참조하여, 본 발명에 따른 비식별 개인정보 매칭 방법을 적용한 데이터 관리 시스템의 동작을 설명한다.Referring to FIG. 4, the operation of the data management system to which the non-identifying personal information matching method according to the present invention is applied will be described.

이하의 실시 예에서, 단말기(20)의 사용자가 두 개의 서비스 제공 서버, 즉, 제1,2 서비스 제공 서버(31,32)에서 제공하는 웹 사이트를 연속적으로 이용하고, 본 발명에 따른 데이터 관리 서버(40)는 상기 제1,2 서비스 제공 서버(31,32)에서 제공하는 웹 사이트에 대한 웹 이용 정보를 수집하는 것으로 가정한다. 또한, 설명의 편의를 위하여, 제1 서비스 제공 서버(31)가 제공하는 웹 사이트를 사이트 A로, 제2 서비스 제공 서버(32)가 제공하는 웹 사이트를 사이트 B로 지칭한다.In the following embodiment, the user of the terminal 20 continuously uses the web sites provided by two service providing servers, that is, the first and second service providing servers 31 and 32, and manages data according to the present invention. It is assumed that the server 40 collects web usage information about web sites provided by the first and second service providing servers 31 and 32. In addition, for convenience of description, the website provided by the first service providing server 31 is referred to as site A, and the website provided by the second service providing server 32 is referred to as site B. FIG.

본 발명은, 비식별 개인 정보 매칭을 위하여, 웹 이용 정보를 수집하고자 하는 대상 웹 사이트에, 즉, 제1 서비스 제공 서버(31)에서 제공하는 사이트 A의 웹 페이지 및 제2 서비스 제공 서버(32)에서 제공하는 사이트 B의 웹 페이지에 각각 제1,2 이미지 태그를 적용한다(S405). 상기 S405 단계는 제1,2 서비스 제공 서버(31,32)를 통해서 이루어질 수 있다. 앞서 설명한 바와 같이, 제1 이미지 태그는 사용자가 의도적으로 접속하는 퍼스트 파티 측, 즉, 제1,2 서비스 제공 서버(31,32)에 접속하도록 설정된 것이며, 제2 이미지 태그는 사용자의 의도로 접속된 것이 아닌 서드 파티측, 즉, 데이터 관리 서버(40)에 접속하도록 설정된 것이다.The present invention provides a web page of a site A provided by a first service providing server 31 and a second service providing server 32 to a target web site to which web usage information is to be collected for non-identifying personal information matching. The first and second image tags are applied to the web pages of the site B provided by the step S405. The step S405 may be performed through the first and second service providing servers 31 and 32. As described above, the first image tag is set to connect to the first party side to which the user intentionally connects, that is, the first and second service providing servers 31 and 32, and the second image tag is connected to the user's intention. It is set to connect to the third party side, that is, the data management server 40, rather than the other.

예를 들어, 사이트 A에 적용되는 제1 이미지 태그는, <img src="http://SiteA. com/pixel?nid=2&uid=1234/>로 설정될 수 있다. For example, the first image tag applied to the site A may be set to <img src = "http://SiteA.com/pixel?nid=2&uid=1234/>.

이때, 제2 이미지 태그는 <img src="http://dmp.com/pixel?nid=2&uid=1234&url=http:\\Site_B.com\oixel\recopickuid=1234"/>)로 설정될 수 있다. 여기서 nid는 사이트 A의 ID를 의미하고, id는 해당 nid에서의 쿠키값을 의미하다. In this case, the second image tag may be set to <img src = "http://dmp.com/pixel?nid=2&uid=1234&url=http:\\Site_B.com\oixel\recopickuid=1234" />). . Where nid represents the ID of site A and id represents the cookie value of the corresponding nid.

한편, 임의의 사용자가 임의의 웹 사이트에 접속하여 정보 및/또는 서비스를 이용하고자 할 경우, 통신망(10)에 접속된 단말기(20)에서 먼저 웹 브라우저를 구동한다(S410). 그리고 상기 구동한 웹 브라우저를 통해서 원하는 웹 사이트의 도메인 네임, 예를 들어, 사이트 A의 도메인 네임을 입력하여 호출하면, 상기 단말기(20)는 상기 도메인 네임에 대응하는 제1 서비스 제공 서버(31)로 접속 요청 메시지를 전송한다(S415).On the other hand, when any user wants to access any web site and use information and / or services, the terminal 20 connected to the communication network 10 first drives a web browser (S410). When the domain name of the desired web site, for example, the domain name of the site A is input and called through the driven web browser, the terminal 20 provides the first service providing server 31 corresponding to the domain name. In step S415, the access request message is transmitted.

이에 제1 서비스 제공 서버(31)는, 응답 메시지를 통해서 요청에 대응되는 소정의 웹 페이지를 단말기(20)로 전송한다(S420). 이때, 상기 웹 페이지는 제1,2 이미지 태그를 포함한다. 아울러, 제1 서비스 제공 서버(31)는 단말기(20)의 사용자에 관련되어 설정한 쿠키값을 전송한다(S420).Accordingly, the first service providing server 31 transmits a predetermined web page corresponding to the request to the terminal 20 through the response message (S420). In this case, the web page includes first and second image tags. In addition, the first service providing server 31 transmits the cookie value set in relation to the user of the terminal 20 (S420).

상기 단말기(20)는 웹 브라우저를 통해서, 상기 수신한 웹 페이지를 랜더링하여 표시하며, 상기 쿠키값을 퍼스트 사이트 도메인, 즉, 사이트 A 도메인에 기록한다.The terminal 20 renders and displays the received web page through a web browser, and records the cookie value in a first site domain, that is, a site A domain.

아울러, 상기 단말기(20)는 상기 웹 페이지를 처리하는 과정에서, 웹 페이지에 삽입된 제1,2 이미지 태그를 호출하고, 이에 의하여 제1 서비스 제공 서버(31) 및 데이터 관리 서버(40)에 접속한다(S430, S435). 상기 접속에 대응하여 제1 서비스 제공 서버(31)와 데이터 관리 서버(40)가 각각 단말기(20)의 접속 로그를 기록한다(S440,S445). 상기 제1 서비스 제공 서버(31) 및 데이터 관리 서버(40)에 접속은 거의 동시에 이루어질 수 있다.In addition, the terminal 20 calls the first and second image tags inserted into the web page in the process of processing the web page, thereby making a call to the first service providing server 31 and the data management server 40. (S430, S435). In response to the connection, the first service providing server 31 and the data management server 40 record access logs of the terminal 20, respectively (S440 and S445). The first service providing server 31 and the data management server 40 may be connected at about the same time.

이어서, 상기 단말기(20)의 사용자가 사이트 B로 이동을 지시할 경우, 단말기(20)로부터 사이트 B에 대응하는 제2 서비스 제공 서버(32)로 접속 요청 메시지를 전송하고(S450), 이에 응답하여 제2 서비스 제공 서버(32)는 사이트 B의 특정 웹 페이지 및 사이트 B에서 사용자에게 설정한 쿠키값을 단말기(20)로 전송한다.Subsequently, when the user of the terminal 20 instructs to move to the site B, the terminal 20 transmits a connection request message from the terminal 20 to the second service providing server 32 corresponding to the site B (S450). The second service providing server 32 transmits the specific web page of the site B and the cookie value set for the user in the site B to the terminal 20.

단말기(20)는 수신된 사이트 B의 웹 페이지를 처리하여 표시하고, 아울러, 상기 사이트 B의 쿠키값을 해당 퍼스트 파티 도메인에 기록한다(S460).The terminal 20 processes and displays the received web page of the site B, and also records the cookie value of the site B in the first party domain (S460).

이때, 상기 사이트 B의 웹 페이지에 삽입된 제1,2 이미지 태그가 거의 동시에 호출되어, 단말기(20)는 제2 서비스 제공 서버(32) 및 데이터 관리 서버(40)에 각각 접속하고(S465,S470), 제2 서비스 제공 서버(32) 및 데이터 관리 서버(40)에 접속 로그 기록을 남긴다(S475, S480).At this time, the first and second image tags inserted into the web page of the site B are called at about the same time, so that the terminal 20 connects to the second service providing server 32 and the data management server 40, respectively (S465, S470), the access log record is left in the second service providing server 32 and the data management server 40 (S475, S480).

상기 S420 내지 S480의 사용자의 요청에 따라서 반복적으로 이루어지며, 단말기(20)가 임의의 웹 페이지에 접속할 때, 그 접속 로그가 퍼스트 파티측 서버 및 데이터 관리 서버(40)에 동시에 기록된다.Repeatedly performed according to the user's request of S420 to S480, when the terminal 20 accesses an arbitrary web page, the access log is simultaneously recorded in the first party server and the data management server 40. FIG.

이러한 상태에서, 아이디 매칭 서버(50)는 상기 웹 이용 정보의 수집 대상, 즉, 제1,2 서비스 제공 서버(31,32) 및 웹 이용 정보의 수집 주체인 데이터 관리 서버(40)로부터 각각 로그 정보를 수집한다(S485,S495).In this state, the ID matching server 50 logs each of the web usage information to be collected, that is, the first and second service providing servers 31 and 32 and the data management server 40 which collects the web usage information, respectively. Collect information (S485, S495).

상기 로그 정보의 수집은, 실시간으로 혹은 일정 주기로 이루어질 수 있다.The log information may be collected in real time or at regular intervals.

그리고, 아이디 매칭 서버(50)는 수집한 로그 정보를 비교 분석하여, 동일 시간대에 동일한 접속 환경으로 접속한 로그 정보를 추출하고, 이를 통해 퍼스트 파티 쿠키값과 서드 파티 쿠키값을 매칭시킨다(S490,S500).In addition, the ID matching server 50 compares and analyzes the collected log information, extracts log information connected to the same access environment in the same time zone, and matches the first party cookie value with the third party cookie value (S490, S500).

여기서, 사이트 A 및 사이트 B의 로그 정보가 제1 로그 정보가 되며, DMP 사이트의 로그 정보가 제2 로그 정보가 된다. 따라서, 도 3의 방법에 따라서 DMP 사이트의 로그 정보를 기준으로 사이트 A 로그 정보/사이트 B의 로그 정보를 비교하여, DMP 사이트의 접속 로그와 거의 동일한 접속 로그를 추출하고, 해당 접속 로그의 쿠키값을 서로 매칭시킨다. 여기서, 사이트 A의 쿠키값과 사이트 B의 쿠키값이 퍼스트 파티 쿠키값이 되고, DMP 사이트의 쿠키값이 서드 파티 쿠키값이 된다.Here, the log information of the site A and the site B becomes the first log information, and the log information of the DMP site becomes the second log information. Therefore, according to the method of FIG. 3, the log information of the site A log information / site B is compared based on the log information of the DMP site, and the access log almost identical to the access log of the DMP site is extracted, and the cookie value of the corresponding access log is extracted. To match each other. Here, the cookie value of the site A and the cookie value of the site B become the first party cookie value, and the cookie value of the DMP site becomes the third party cookie value.

상기 아이디 매칭 서버(50)는, 매칭된 쿠키값을 데이터 관리 서버(40)에 제공한다. 이에 데이터 관리 서버(40)는 동일한 DMP 사이트의 쿠키값과 매칭된 사이트 A의 쿠키값과 사이트 B의 쿠키값을 동일 사용자의 것으로 판단하여, 해당 쿠키값에 대응하는 사이트 A의 웹 이용 정보와 사이트 B의 웹 이용 정보를 동일 사용자의 웹 이용 정보로 분류할 수 있으며, 사용자의 연속된 웹 이용 정보를 수집할 수 있게 된다.The ID matching server 50 provides the matched cookie value to the data management server 40. Accordingly, the data management server 40 determines that the cookie value of Site A and the cookie value of Site B matched with the cookie value of the same DMP site as that of the same user, and thus the web usage information and site of Site A corresponding to the cookie value. The web usage information of B can be classified into web usage information of the same user, and user's continuous web usage information can be collected.

따라서, 사용자의 웹 브라우저가 서드 파티 쿠키값을 이용할 수 없도록 차단하더라도, 상술한 비식별 개인 정보의 매칭 과정을 통해서 동일 사용자의 쿠키값을 매칭시킬 수 있게 된다.Therefore, even if the user's web browser is blocked from using the third party cookie value, the cookie value of the same user can be matched through the above-described non-identifying personal information matching process.

이상과 같이, 본 명세서와 도면에는 본 발명의 바람직한 실시 예에 대하여 개시하였으나, 여기에 개시된 실시 예외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다. 또한, 본 명세서와 도면에서 특정 용어들이 사용되었으나, 이는 단지 본 발명의 기술 내용을 쉽게 설명하고 발명의 이해를 돕기 위한 일반적인 의미에서 사용된 것이지, 본 발명의 범위를 한정하고자 하는 것은 아니다.As described above, although the present specification and drawings disclose preferred embodiments of the present invention, it is understood that other modifications based on the technical idea of the present invention can be implemented in the technical field to which the present invention pertains. It is self-evident to those of ordinary knowledge. In addition, although specific terms are used in the specification and the drawings, they are only used in a general sense to easily explain the technical contents of the present invention and to help the understanding of the present invention, and are not intended to limit the scope of the present invention.

또한, 본 발명에 따른 데이터 관리 시스템의, 단말기(20)와, 하나 이상의 서비스 제공 서버(30)와, 데이터 관리 서버(40)와, 아이디 매칭 서버(50)는 각각 하나 이상의 프로세서와 메모리를 탑재하고, 상기 프로세서를 통해서 본 발명에 따른 방법을 실행하기 위한 프로그램 명령을 처리할 수 있다. 일 구현예에서, 이 프로세서는 싱글 쓰레드(Single-threaded) 프로세서일 수 있으며, 다른 구현예에서 본 프로세서는 멀티 쓰레드(Multithreaded) 프로세서일 수 있다. 나아가 본 프로세서는 메모리 혹은 저장 장치 상에 저장된 명령을 처리하는 것이 가능하다.Further, in the data management system according to the present invention, the terminal 20, the one or more service providing servers 30, the data management server 40, and the ID matching server 50 each include one or more processors and memory. The processor may process program instructions for executing the method according to the present invention. In one implementation, this processor may be a single-threaded processor, and in other implementations, the processor may be a multithreaded processor. Furthermore, the processor is capable of processing instructions stored on memory or storage devices.

또한, 단말기(20)와, 하나 이상의 서비스 제공 서버(30)와, 데이터 관리 서버(40)와, 아이디 매칭 서버(50)는 메모리를 탑재하고, 상기 메모리에 정보 및 본 발명에 따른 방법을 실행시키는 프로그램 모듈을 저장한다. 일 구현예에서, 메모리는 컴퓨터 판독 가능한 기록 매체로서, 휘발성 메모리 유닛일 수 있으며, 비휘발성 메모리 유닛일 수도 있다. 다양한 서로 다른 구현예에서, 상기 메모리는 예컨대 하드디스크 장치, 광학디스크 장치, 혹은 어떤 다른 대용량 저장 장치를 포함할 수도 있다.In addition, the terminal 20, one or more service providing server 30, the data management server 40, and the ID matching server 50 are equipped with a memory, and the information and the method according to the present invention is executed in the memory. Save the program module you want to load. In one implementation, the memory is a computer readable recording medium, which may be a volatile memory unit or may be a nonvolatile memory unit. In various different implementations, the memory may include, for example, a hard disk device, an optical disk device, or some other mass storage device.

아울러, 비록 본 명세서와 도면에서는 예시적인 장치 구성을 기술하고 있지만, 본 명세서에서 설명하는 기능적인 동작과 주제의 구현물들은 다른 유형의 디지털 전자 회로로 구현되거나, 본 명세서에서 개시하는 구조 및 그 구조적인 등가물들을 포함하는 컴퓨터 소프트웨어, 펌웨어 혹은 하드웨어로 구현되거나, 이들 중 하나 이상의 결합으로 구현 가능하다. 본 명세서에서 설명하는 주제의 구현물들은 하나 이상의 컴퓨터 프로그램 제품, 다시 말해 본 발명에 따른 장치의 동작을 제어하기 위하여 혹은 이것에 의한 실행을 위하여 유형의 프로그램 저장매체 상에 인코딩된 컴퓨터 프로그램 명령에 관한 하나 이상의 모듈로서 구현될 수 있다. 컴퓨터로 판독 가능한 매체는 기계로 판독 가능한 저장 장치, 기계로 판독 가능한 저장 기판, 메모리 장치, 기계로 판독 가능한 전파형 신호에 영향을 미치는 물질의 조성물 혹은 이들 중 하나 이상의 조합일 수 있다.In addition, although the specification and drawings describe exemplary device configurations, the functional operations and subject matter implementations described herein may be implemented in other types of digital electronic circuitry, or the structures disclosed herein, and structural It may be implemented in computer software, firmware or hardware including equivalents, or in combination with one or more of these. Implementations of the subject matter described herein relate to one or more computer program products, ie computer program instructions encoded on a program storage medium of tangible type for controlling or by the operation of an apparatus according to the invention. It may be implemented as the above module. The computer readable medium may be a machine readable storage device, a machine readable storage substrate, a memory device, a composition of materials affecting a machine readable propagated signal, or a combination of one or more thereof.

아울러, 본 발명에 있어서 "시스템"은 예컨대 프로그래머블 프로세서, 컴퓨터 혹은 다중 프로세서나 컴퓨터를 포함하여 데이터를 처리하기 위한 모든 기구, 장치 및 기계를 포괄하는 것으로서, 하드웨어에 부가하여, 예컨대 프로세서 펌웨어를 구성하는 코드, 프로토콜 스택, 데이터베이스 관리 시스템, 운영 체제 혹은 이들 중 하나 이상의 조합 등 요청 시 컴퓨터 프로그램에 대한 실행 환경을 형성하는 코드를 포함할 수 있다.In addition, in the present invention, the "system" encompasses all the mechanisms, devices, and machines for processing data, including, for example, a programmable processor, a computer, or a multiprocessor or a computer. Code, protocol stacks, database management systems, operating systems, or combinations of one or more of these may include code that forms an execution environment for a computer program on demand.

또한, 본 발명에 따른 장치에 탑재되고 본 발명에 따른 방법을 실행하는 컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 어플리케이션, 스크립트 혹은 코드로도 알려져 있음)은 컴파일 되거나 해석된 언어나 선험적 혹은 절차적 언어를 포함하는 프로그래밍 언어의 어떠한 형태로도 작성될 수 있으며, 독립형 프로그램이나 모듈, 컴포넌트, 서브루틴 혹은 컴퓨터 환경에서 사용하기에 적합한 다른 유닛을 포함하여 어떠한 형태로도 전개될 수 있다. 컴퓨터 프로그램은 파일 시스템의 파일에 반드시 대응하는 것은 아니다. 프로그램은 요청된 프로그램에 제공되는 단일 파일 내에, 혹은 다중의 상호 작용하는 파일(예컨대, 하나 이상의 모듈, 하위 프로그램 혹은 코드의 일부를 저장하는 파일) 내에, 혹은 다른 프로그램이나 데이터를 보유하는 파일의 일부(예컨대, 마크업 언어 문서 내에 저장되는 하나 이상의 스크립트) 내에 저장될 수 있다. 컴퓨터 프로그램은 하나의 사이트에 위치하거나 복수의 사이트에 걸쳐서 분산되어 통신 통신망에 의해 상호 접속된 다중 컴퓨터나 하나의 컴퓨터 상에서 실행되도록 전개될 수 있다.Furthermore, a computer program (also known as a program, software, software application, script or code) mounted on an apparatus according to the invention and executing a method according to the invention comprises a compiled or interpreted language or a priori or procedural language. It can be written in any form of programming language, and can be deployed in any form, including stand-alone programs or modules, components, subroutines, or other units suitable for use in a computer environment. Computer programs do not necessarily correspond to files in the file system. A program may be in a single file provided to the requested program, in multiple interactive files (eg, a file that stores one or more modules, subprograms, or parts of code), or part of a file that holds other programs or data. (Eg, one or more scripts stored in a markup language document). The computer program may be deployed to run on a single computer or on multiple computers located at one site or distributed across a plurality of sites and interconnected by a communication network.

컴퓨터 프로그램 명령어와 데이터를 저장하기에 적합한 컴퓨터로 판독 가능한 매체는, 예컨대 EPROM, EEPROM 및 플래시메모리 장치와 같은 반도체 메모리 장치, 예컨대 내부 하드디스크나 외장형 디스크와 같은 자기 디스크, 자기광학 디스크 및 CD-ROM과 DVD-ROM 디스크를 포함하여 모든 형태의 비휘발성 메모리, 매체 및 메모리 장치를 포함한다. 프로세서와 메모리는 특수 목적의 논리 회로에 의해 보충되거나, 그것에 통합될 수 있다.Computer-readable media suitable for storing computer program instructions and data include, for example, semiconductor memory devices such as EPROM, EEPROM, and flash memory devices, such as magnetic disks such as internal hard disks or external disks, magneto-optical disks, and CD-ROMs. And all forms of nonvolatile memory, media and memory devices, including DVD-ROM discs. The processor and memory can be supplemented by or integrated with special purpose logic circuitry.

본 명세서에서 설명한 주제의 구현물은 예컨대 데이터 서버와 같은 백엔드 컴포넌트를 포함하거나, 예컨대 어플리케이션 서버와 같은 미들웨어 컴포넌트를 포함하거나, 예컨대 사용자가 본 명세서에서 설명한 주제의 구현물과 상호 작용할 수 있는 웹 브라우저나 그래픽 유저 인터페이스를 갖는 클라이언트 컴퓨터와 같은 프론트엔드 컴포넌트 혹은 그러한 백엔드, 미들웨어 혹은 프론트엔드 컴포넌트의 하나 이상의 모든 조합을 포함하는 연산 시스템에서 구현될 수 있다. 시스템의 컴포넌트는 예컨대 통신 통신망과 같은 디지털 데이터 통신의 어떠한 형태나 매체에 의해서도 상호 접속 가능하다.Implementations of the subject matter described herein may include, for example, a backend component such as a data server, or include a middleware component such as, for example, an application server, or a web browser or graphical user, for example, where a user may interact with the implementation of the subject matter described herein. It can be implemented in a computing system that includes a front end component such as a client computer having an interface or any combination of one or more of such back end, middleware or front end components. The components of the system may be interconnected by any form or medium of digital data communication such as, for example, a communication network.

본 명세서는 다수의 특정한 구현물의 세부사항들을 포함하지만, 이들은 어떠한 발명이나 청구 가능한 것의 범위에 대해서도 제한적인 것으로서 이해되어서는 안되며, 오히려 특정한 발명의 특정한 실시형태에 특유할 수 있는 특징들에 대한 설명으로서 이해되어야 한다. 개별적인 실시형태의 문맥에서 본 명세서에 기술된 특정한 특징들은 단일 실시형태에서 조합하여 구현될 수도 있다. 반대로, 단일 실시형태의 문맥에서 기술한 다양한 특징들 역시 개별적으로 혹은 어떠한 적절한 하위 조합으로도 복수의 실시형태에서 구현 가능하다. 나아가, 특징들이 특정한 조합으로 동작하고 초기에 그와 같이 청구된 바와 같이 묘사될 수 있지만, 청구된 조합으로부터의 하나 이상의 특징들은 일부 경우에 그 조합으로부터 배제될 수 있으며, 그 청구된 조합은 하위 조합이나 하위 조합의 변형물로 변경될 수 있다.Although the specification includes numerous specific implementation details, these should not be construed as limiting to any invention or the scope of the claims, but rather as a description of features that may be specific to a particular embodiment of a particular invention. It must be understood. Certain features that are described in this specification in the context of separate embodiments may be implemented in combination in a single embodiment. Conversely, various features that are described in the context of a single embodiment can also be implemented in multiple embodiments individually or in any suitable subcombination. Furthermore, while the features may operate in a particular combination and may be initially depicted as so claimed, one or more features from the claimed combination may in some cases be excluded from the combination, the claimed combination being a subcombination Or a combination of subcombinations.

마찬가지로, 특정한 순서로 도면에서 동작들을 묘사하고 있지만, 이는 바람직한 결과를 얻기 위하여 도시된 그 특정한 순서나 순차적인 순서대로 그러한 동작들을 수행하여야 한다거나 모든 도시된 동작들이 수행되어야 하는 것으로 이해되어서는 안 된다. 특정한 경우, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다. 또한, 상술한 실시형태의 다양한 시스템 컴포넌트의 분리는 그러한 분리를 모든 실시형태에서 요구하는 것으로 이해되어서는 안되며, 설명한 프로그램 컴포넌트와 시스템들은 일반적으로 단일의 소프트웨어 제품으로 함께 통합되거나 다중 소프트웨어 제품에 패키징될 수 있다는 점을 이해하여야 한다.Likewise, although the operations are depicted in the drawings in a specific order, it should not be understood that such operations must be performed in the specific order or sequential order shown in order to obtain desirable results or that all illustrated operations must be performed. In certain cases, multitasking and parallel processing may be advantageous. Moreover, the separation of the various system components of the above-described embodiments should not be understood as requiring such separation in all embodiments, and the described program components and systems will generally be integrated together into a single software product or packaged into multiple software products. It should be understood that it can.

따라서 본 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 특허청구범위에 의해 정하여져야 한다.Therefore, the scope of the present invention should be determined by the claims rather than by the described embodiments.

본 발명은 사용자의 웹 이용 정보를 수집하여 분석하기 위한 데이터 관리 시스템에 관련된 것으로서, 특히, 사용자가 서드 파티 쿠키의 사용을 차단하더라도, 사용자가 웹 페이지의 접속 시, 이미지 태그를 이용하여 사용자의 단말기가 퍼스트 파티측, 즉, 서비스 제공 서버의 웹 사이트 및 서드 파티 측, 즉, 데이터 관리 서버의 웹 사이트에 동시에 접속하여 접속 로그를 남기도록 한 후, 사기 서비스 제공 서버 및 데이터 관리 서버의 로그 정보를 수집하여 비교함에 의하여, 동일한 사용자에 의하여 동일한 조건으로 기록된 로그 정보를 기반으로 동일 사용자의 퍼스트 파티 쿠키값 및 서드 파티 쿠키값을 매칭시킬 수 있으며, 그 결과, 동일 사용자의 웹 이용 정보를 연속적으로 수집할 수 있게 한다.The present invention relates to a data management system for collecting and analyzing web usage information of a user. In particular, even if a user blocks the use of a third party cookie, the user's terminal is used by using an image tag when the user accesses a web page. Access the first party, that is, the website of the service providing server and the third party, that is, the data management server, simultaneously to log the access log, and then log information on the fraud service providing server and the data management server. By collecting and comparing, the first party cookie value and the third party cookie value of the same user can be matched based on log information recorded under the same condition by the same user. As a result, the web usage information of the same user can be continuously Allow collection.

10: 통신망
20: 단말기
30: 서비스 제공 서버
40: 데이터 관리 서버
50: 아이디 매칭 서버
10: network
20: terminal
30: service delivery server
40: data management server
50: ID matching server

Claims (7)

사용자의 접속 요청에 따라서 웹 기반 서비스를 제공하는 하나 이상의 서비스 제공 서버 및 상기 웹 기반 서비스에 대한 사용자의 웹 이용 정보를 수집하기 위한 데이터 관리 서버와 연동하는 아이디 매칭 서버에 의한 비식별 개인 정보 매칭 방법에 있어서,
상기 하나 이상의 서비스 제공 서버에서 제공하는 웹 페이지에, 해당 서비스 제공 서버를 접속하도록 설정된 제1 이미지 태그 및 상기 데이터 관리 서버에 접속하도록 설정된 제2 이미지 태그가 거의 동시에 구동하도록 적용하는 단계;
상기 하나 이상의 서비스 제공 서버로부터 제1 로그 정보 및 상기 데이터 관리 서버로부터 제2 로그 정보를 수집하는 단계;
상기 제1 로그 정보와 제2 로그 정보를 비교하여, 동일 시간대에 동일한 유저 에이전트 환경을 갖는 로그 정보를 추출하는 단계;
상기 추출한 제1 로그 정보의 퍼스트 파티 쿠키값과 제2 로그 정보의 서드 파티 쿠키값을 동일 사용자의 쿠키값으로 매칭시키는 단계를 포함하는 것을 특징으로 하는 비식별 개인 정보 매칭 방법.
Non-identified personal information matching method by at least one service providing server providing a web-based service according to a user's access request and an ID matching server interworking with a data management server for collecting the user's web usage information on the web-based service. To
Applying, to a web page provided by the at least one service providing server, a first image tag set to access the service providing server and a second image tag set to access the data management server at about the same time;
Collecting first log information from the at least one service providing server and second log information from the data management server;
Comparing the first log information with the second log information to extract log information having the same user agent environment in the same time zone;
And matching the first party cookie value of the extracted first log information and the third party cookie value of the second log information with a cookie value of the same user.
제1항에 있어서, 상기 제1,2 로그 정보는
접속 시간 정보, 유저의 IP 주소, 유저 에이전트 정보 중 하나 이상을 포함하고,
상기 유저 에이전트 정보는 단말 정보, OS 정보, 웹 브라우저 정보 중 하나 이상을 포함하는 것을 특징으로 하는 비식별 개인 정보 매칭 방법.
The method of claim 1, wherein the first and second log information is
One or more of access time information, a user's IP address, and user agent information;
And the user agent information comprises one or more of terminal information, OS information, and web browser information.
제2항에 있어서, 상기 추출하는 단계는
접속 시간 정보를 기준으로, 제2 로그 정보와 거의 동일 시간대에 기록된 제1 로그 정보를 추출하는 단계;
상기 제2 로그 정보의 유저 IP 주소와 상기 추출한 제1 로그 정보의 유저 IP 주소를 비교하는 단계;
상기 제2 로그 정보의 유저 에이전트 정보와 상기 추출한 제1 로그 정보의 유저 에이전트 정보를 비교하는 단계; 및
상기 유저 IP 주소와 유저 에이전트 정보 중 하나 이상이 일치하면, 상기 추출한 제1 로그 정보를 제2 로그 정보를 동일 사용자에 대한 접속 기록으로 판단하는 단계를 포함하는 것을 특징으로 하는 비식별 개인 정보 매칭 방법.
The method of claim 2, wherein the extracting step
Extracting first log information recorded at about the same time zone as the second log information based on the access time information;
Comparing the user IP address of the second log information with the user IP address of the extracted first log information;
Comparing the user agent information of the second log information with the user agent information of the extracted first log information; And
And determining whether the extracted first log information is the second log information as an access record for the same user, when at least one of the user IP address and the user agent information is identical. .
하나 이상의 서비스 제공 서버를 통해 사용자에게 제공되는 웹 기반 서비스에 대한 사용자의 웹 이용 정보를 수집하기 위한 데이터 관리 시스템에 있어서,
상기 하나 이상의 서비스 제공 서버로부터 사용자들의 웹 이용 정보를 수집하고, 상기 하나 이상의 서비스 제공에서 웹 기반 서비스의 사용자에게 제공되는 쿠키값을 이용하여 상기 수집한 웹 이용 정보를 사용자별로 구분하는 데이터 관리 서버; 및
상기 하나 이상의 서비스 제공 서버에서 제공하는 웹 페이지에, 해당 서비스 제공 서버를 접속하도록 설정된 제1 이미지 태그 및 상기 데이터 관리 서버에 접속하도록 설정된 제2 이미지 태그가 거의 동시에 구동하도록 적용한 후, 상기 하나 이상의 서비스 제공 서버로부터 제1 로그 정보 및 상기 데이터 관리 서버로부터 제2 로그 정보를 수집하고, 상기 수집한 제1 로그 정보와 제2 로그 정보를 비교하여, 동일 시간대에 동일한 유저 에이전트 환경을 갖는 로그 정보를 추출하여, 상기 추출한 제1 로그 정보의 퍼스트 파티 쿠키값과 제2 로그 정보의 서드 파티 쿠키값을 동일 사용자의 쿠키값으로 매칭시키는 아이디 매칭 서버를 포함하는 데이터 관리 시스템.
A data management system for collecting a user's web usage information about a web-based service provided to a user through at least one service providing server,
A data management server that collects web usage information of users from the at least one service providing server, and classifies the collected web usage information for each user by using a cookie value provided to the user of the web based service in the at least one service providing; And
The first image tag set to access the corresponding service providing server and the second image tag set to access the data management server are driven at substantially the same time to the web page provided by the one or more service providing servers, and then the one or more services Collecting first log information from the providing server and second log information from the data management server, and comparing the collected first log information and the second log information, extracts log information having the same user agent environment in the same time zone And an ID matching server for matching the extracted first party cookie value of the first log information and third party cookie value of the second log information with a cookie value of the same user.
제4항에 있어서, 상기 제1,2 로그 정보는
접속 시간 정보, 유저의 IP 주소, 유저 에이전트 정보 중 하나 이상을 포함하고,
상기 유저 에이전트 정보는 단말 정보, OS 정보, 웹 브라우저 정보 중 하나 이상을 포함하는 것을 특징으로 하는 데이터 관리 시스템.
The method of claim 4, wherein the first and second log information is
One or more of access time information, a user's IP address, and user agent information;
The user agent information includes one or more of terminal information, OS information, and web browser information.
제4항에 있어서, 상기 아이디 매칭 서버는
접속 시간 정보를 기준으로, 제2 로그 정보와 거의 동일 시간대에 기록된 제1 로그 정보를 추출하고, 상기 제2 로그 정보의 유저 IP 주소 및 유저 에이전트 정보중 하나 이상을 상기 추출한 제1 로그 정보의 유저 IP 주소 및 유저 에이전트 정보 중 하나 이상과 비교하여, 상기 유저 IP 주소와 유저 에이전트 정보 중 하나 이상이 일치하면, 상기 추출한 제1 로그 정보를 제2 로그 정보를 동일 사용자에 대한 접속 기록으로 판단하는 것을 특징으로 하는 데이터 관리 시스템.
The method of claim 4, wherein the ID matching server
Extracting the first log information recorded at about the same time zone as the second log information based on the access time information, and extracting one or more of the user IP address and the user agent information of the second log information of the extracted first log information. When the at least one of the user IP address and the user agent information is matched with the at least one of the user IP address and the user agent information, the extracted first log information is used to determine second log information as a connection record for the same user. Data management system, characterized in that.
제4항에 있어서,
상기 제1,2 이미지 태그가 삽입된 웹 페이지를 포함하는 웹 사이트를 구동하여, 사용자의 요청에 따라서 상기 웹 페이지를 제공하는 하나 이상의 서비스 제공 서버를 더 포함하는 것을 특징으로 하는 데이터 관리 시스템.
The method of claim 4, wherein
And at least one service providing server for driving a web site including a web page into which the first and second image tags are inserted to provide the web page in response to a user's request.
KR1020180043979A 2018-04-16 2018-04-16 Method for matching user identification information, and data management system KR20190120600A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180043979A KR20190120600A (en) 2018-04-16 2018-04-16 Method for matching user identification information, and data management system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180043979A KR20190120600A (en) 2018-04-16 2018-04-16 Method for matching user identification information, and data management system

Publications (1)

Publication Number Publication Date
KR20190120600A true KR20190120600A (en) 2019-10-24

Family

ID=68423500

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180043979A KR20190120600A (en) 2018-04-16 2018-04-16 Method for matching user identification information, and data management system

Country Status (1)

Country Link
KR (1) KR20190120600A (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160003810A (en) 2013-05-27 2016-01-11 케이피아이 솔루션즈 컴퍼니 리미티드 Information processing system and information processing method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160003810A (en) 2013-05-27 2016-01-11 케이피아이 솔루션즈 컴퍼니 리미티드 Information processing system and information processing method

Similar Documents

Publication Publication Date Title
JP7214795B2 (en) dynamic code management
US11961120B2 (en) Systems and methods for accessing first party cookies
US9166949B2 (en) Method and system of managing a captive portal with a router
KR102504075B1 (en) Matching and attributes of user device events
Mazel et al. A comparison of web privacy protection techniques
US11449637B1 (en) Systems and methods for providing web tracking transparency to protect user data privacy
US9530140B2 (en) Affiliate investigation system and method
CN116210017A (en) System and method for preventing misleading clicks on websites
CN109688094A (en) Suspicious IP configuration method, device, equipment and storage medium based on network security
US20140156723A1 (en) Redirecting Information
US20150193809A1 (en) Do Not Track / Advertise Functionality Based on User Identification Association
US20160343029A1 (en) Content presentation based on access point location
US10891648B1 (en) Systems and methods for tracking the flow of user information over a network
KR102565724B1 (en) Method, user device and computer program for determining property of a service executed in a user device based on packet analysis
US9197711B1 (en) Systems and methods for detecting the presence of web tracking
KR102617420B1 (en) Method and sever for colltecting offline stores information by using Wifi and for providing advertisement
US8893254B1 (en) Dynamic insertion of service specific privacy proxy elements
KR20190120600A (en) Method for matching user identification information, and data management system
US11641373B1 (en) Systems and methods for protecting user data privacy against web tracking during browsing sessions
CN113987474A (en) Detection data processing method and system of intelligent edge computing gatekeeper
EP3300335B1 (en) Device and method for data packet processing
KR20200030763A (en) Method and apparatus for targeting advertisement through personalization
US10652727B2 (en) Systems and methods for customizing network detection results
KR20190110299A (en) Advertising-id update method using user cookie, system and recording medium recording computer program therefore
US11610024B2 (en) Systems and methods for protecting search privacy

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X601 Decision of rejection after re-examination