KR20010109744A - Ranking appraisement method for website - Google Patents

Ranking appraisement method for website Download PDF

Info

Publication number
KR20010109744A
KR20010109744A KR1020000030327A KR20000030327A KR20010109744A KR 20010109744 A KR20010109744 A KR 20010109744A KR 1020000030327 A KR1020000030327 A KR 1020000030327A KR 20000030327 A KR20000030327 A KR 20000030327A KR 20010109744 A KR20010109744 A KR 20010109744A
Authority
KR
South Korea
Prior art keywords
website
evaluation
information
ranking
members
Prior art date
Application number
KR1020000030327A
Other languages
Korean (ko)
Inventor
이종헌
윤재민
Original Assignee
이종헌
윤재민
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이종헌, 윤재민 filed Critical 이종헌
Priority to KR1020000030327A priority Critical patent/KR20010109744A/en
Publication of KR20010109744A publication Critical patent/KR20010109744A/en

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 웹사이트순위평가방법에 관한 것이다. 본 발명은 웹사이트의 순위를 평가함에 있어서, 통계학적인 방법을 채용하여 웹사이트의 접속과 관련된 각종 항목별로 뿐만 아니라 이들 항목을 종합하여 평가할 수 있도록 한 것이다. 그리고 평가를 위한 정보를 수집함에 있어서, 능동적으로 웹서핑을 하는 평가회원(30,30')과 웹서핑의 대상이 되는 등록회원(40,40')으로부터 동시에 웹서핑관련정보, 예를 들면 접속수, 체류시간, 페이지뷰, 접속속도 및 신뢰도 등을 제공받게 된다. 한편 웹사이트(47,50,50')의 순위를 평가함에 있어서는 평가회원(30,30')으로부터 층화추출법과 할당추출법을 사용하여 표본집단을 추출하고, 각각의 항목에 대해 비회원 웹사이트(50,50')에 대한 항목별 값을 확률비례표본추출법으로 추출하고, 이를 사용하여 각 항목별로 각 웹사이트(47,50,50')에 대한 순위를 결정한다. 그리고 상기 각 항목별 값을 주성분분석법을 사용하여 종합하여 각 웹사이트(47,50,50')에 대한 순위를 평가하게 된다. 이와 같은 본 발명에 의하면 존재하는 각 웹사이트(47,50,50')에 대해 보다 정확하게 순위를 평가할 수 있게 된다.The present invention relates to a website ranking method. In order to evaluate the ranking of the website, the present invention employs a statistical method to evaluate not only the various items related to the access of the website but also these items in aggregate. In gathering information for evaluation, web surfing related information, for example, access, is simultaneously performed from an evaluation member (30,30 ') who actively surfs the web and a registered member (40,40') that is the target of web surfing. You will be provided with the number, dwell time, page views, connection speed and reliability. On the other hand, in evaluating the rankings of the websites 47, 50 and 50 ', a sample group is extracted from the evaluation members 30 and 30' by using stratification extraction and allocation extraction, and for each item, the non-member websites 50 , 50 ') is extracted by the probability proportional sampling method, and the ranking of each website (47, 50, 50') is used for each item. In addition, the value of each item is synthesized using principal component analysis to evaluate the ranking of each website (47, 50, 50 '). According to the present invention, it is possible to more accurately rank the respective websites 47, 50, and 50 'present.

Description

웹사이트 순위평가방법{Ranking appraisement method for website}Ranking appraisement method for website}

본 발명은 웹사이트 순위 평가방법에 관한 것으로, 더욱 상세하게는 능동적으로 웹사이트를 서핑하는 평가회원과 웹서핑의 대상이 되는 웹사이트인 등록회원으로부터 전달되는 웹서핑관련정보를 통계학적인 방법으로 처리하여 웹사이트의 순위를 평가하는 방법에 관한 것이다.The present invention relates to a website ranking method, and more particularly, web surfing related information delivered from an evaluation member who actively surfs a website and a registered member which is a web surfing target in a statistical method. How to evaluate your website's ranking.

현재 인터넷에서는 전세계 웹사이트들을 신뢰성있게 평가하는 기관이 없고, 웹사이트에 대한 선호도의 순위를 제시하는 웹사이트가 있으나 단순히 접속수를 기준으로 하여, 기존의 관련 웹사이트 링크(Link)를 재확장한 것으로 통계학적인 신뢰성을 바탕으로 하는 명확한 평가를 못하고 있는 실정이다. 즉 불특정 다수인 인터넷 사용자를 대상으로 단순한 접속수만을 기준으로 웹사이트의 순위를 조사한다는 것은 아무런 의미를 가지지 못하는 것이다.There are no institutions on the Internet that reliably evaluate websites around the world, and there are websites that rank ranking preferences for websites, but simply re-extend existing related website links based on access. As a result, there is no clear evaluation based on statistical reliability. In other words, it is not meaningful to survey the ranking of websites based on simple number of visits to unspecified Internet users.

일반적으로 대형 인터넷 웹사이트들은 자체 통계를 바탕으로 일정한 기간 동안의 인터넷 사용자의 접속수와 페이지뷰 등을 발표하고 있지만, 이는 그들 자신이 자신의 웹사이트에 관한 정보를 제공하는 것으로 신빙성이 떨어지는 문제점이 있다. 특히 인터넷상에서의 광고단가 책정이 주로 회원수나 접속수를 바탕으로 정해지는 것을 감안할 때, 인터넷을 통한 광고 등에 있어서 웹사이트에 대한 선호도를 조사한다는 것은 매우 의미있는 일이다.In general, large Internet web sites publish their own statistics based on the number of Internet users' access and pageviews over a certain period of time, but this is because they provide information about their own web sites. have. In particular, considering that the pricing of advertisements on the Internet is mainly based on the number of members and the number of connections, it is very meaningful to investigate the preferences of websites in advertisements on the Internet.

기존에 웹사이트 순위를 평가하는 방법은 크게 두가지로 구별되는데, 그중 하나는 웹사이트의 로그파일을 분석해 해당 웹사이트의 접속수만을 중심으로 사이트를 평가하는 것이다. 하지만 이와 같은 방식은 접속자에 관한 정보 없이 단순히 접속수만을 중심으로 웹사이트의 순위를 평가하는 것이므로 실제로 보다 다각화된 마케팅을 위한 자료로는 가치를 가지지 않으며, 해당 웹사이트에서 로그파일을 제공하여야만 하고, 제공받은 로그파일을 일일이 분석해야 하는 문제점이 있다.There are two main methods of evaluating website rankings. One of them is to analyze the log file of a website and evaluate the website based only on the number of visits to the website. However, since this method simply evaluates the ranking of websites based on the number of visitors without any information about the visitors, it is not really valuable as a material for more diversified marketing, and a log file must be provided on the website. There is a problem that the log files provided must be analyzed.

그리고 나머지 하나는 표본사용자들의 컴퓨터에 로그전송 소프트웨어를 설치하고, 전송된 사용자의 웹서핑 정보를 이용하는 것이다. 이와 같은 방식은 해당 사이트의 정확한 접속정보를 알지 못하고, 다만 통계학적으로 추출된 표본에만 의존하기 때문에 표본추출방법에 따라 각각의 조사기관마다 상당히 다른 결과가 나오는 문제점이 있다.The other is to install log transfer software on the sample users' computers and use the web surfing information of the transferred users. Since this method does not know the exact access information of the site, but depends only on the statistically extracted sample, there is a problem that results vary considerably for each research institute according to the sampling method.

따라서 본 발명의 목적은 상기한 바와 같은 종래 기술의 문제점을 해결하기 위한 것으로, 보다 정확한 웹사이트 순위를 각종 평가기준에 따라 제공할 수 있도록 하는 것이다.Accordingly, an object of the present invention is to solve the problems of the prior art as described above, and to provide a more accurate website ranking according to various evaluation criteria.

도 1은 본 발명에 의한 웹사이트 순위평가방법의 구현하는 시스템의 구성을 보인 구성도.1 is a block diagram showing the configuration of a system for implementing a website ranking method according to the present invention.

도 2는 본 발명 실시예에서 평가회원과 등록회원으로 등록하는 과정을 보인 흐름도.Figure 2 is a flow chart illustrating a process of registering as an evaluation member and a registered member in the embodiment of the present invention.

도 3은 본 발명 실시예에서 평가회원이 인터넷에 접속하여 웹서핑을 하면서 웹서핑관련정보를 얻어 제공하는 것을 보인 흐름도.3 is a flow chart showing that the evaluation member in the embodiment of the present invention to obtain the web surfing-related information while accessing the web to access the Internet.

도 4는 본 발명 실시예에서 평가회원이 웹서핑관련정보를 후킹하고 평가사이트와의 사이에서 상호정보를 주고받는 것을 보인 흐름도.Figure 4 is a flow chart showing an evaluation member hooking web surfing-related information in the embodiment of the present invention and exchange mutual information between the evaluation site.

도 5는 본 발명 실시예에서 웹사이트의 성격을 판단하기 위한 판별분석법을 설명하기 위한 설명도.5 is an explanatory diagram for explaining a discriminant analysis method for determining the characteristics of a website in an embodiment of the present invention.

* 도면의 주요 부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings

10: 평가사이트 12: 서버10: Evaluation Site 12: Server

14: 회원정보데이터베이스 15: 포획정보데이터베이스14: Member Information Database 15: Capture Information Database

16: 가공정보데이터베이스 20: 정보요구자16: Processing Information Database 20: Information Requester

30,30': 평가회원 32: 정보제공자30,30 ': Evaluation member 32: Information provider

34: 사용자프로그램 35: 개인데이터베이스34: User Program 35: Personal Database

40,40': 등록회원 41: 서버40,40 ': Registered Member 41: Server

42: 정보제공자 47: 웹사이트42: Information Provider 47: Website

50,50': 웹사이트50,50 ': Website

상기한 바와 같은 목적을 달성하기 위한 본 발명의 특징에 따르면, 본 발명은 네트워크 상에서 능동적으로 웹서핑을 하는 평가회원과 웹서핑의 대상이 되는등록회원을 서버에 등록하는 단계와, 웹서핑관련정보를 획득하여 전송하는 정보제공자를 상기 서버가 제공하여 상기 평가회원과 등록회원의 시스템에 설치하는 단계와, 네트워크에 접속된 상기 평가회원과 등록회원의 정보제공자를 통해 웹서핑관련정보를 서버가 전달받는 단계와, 상기 서버가 전달받은 웹서핑관련정보를 데이터베이스에 기록하는 단계와, 상기 데이터베이스화된 웹서핑관련정보를 상기 서버에서 통계학적 방법으로 가공하여 웹사이트의 순위를 결정하는 단계를 포함하여 구성된다.According to a feature of the present invention for achieving the object as described above, the present invention comprises the steps of registering an evaluation member actively web surfing on the network and a registered member that is the target of web surfing on the server, Web surfing related information The server provides the information provider to obtain and transmit the information to install in the system of the evaluation member and registered member, and the server delivers web surfing-related information through the information provider of the evaluation member and registered member connected to the network And receiving the web surfing related information received by the server in a database, and processing the databased web surfing related information in a statistical method at the server to determine the ranking of the web site. It is composed.

상기 웹서핑관련정보로는 상기 평가회원의 각 웹사이트에 대한 접속수, 체류시간, 페이지뷰, 접속속도 및 웹사이트신뢰도가 있으며, 상기 등록회원의 웹사이트에 접속한 사용자의 접속수, 체류시간, 페이지뷰 및 접속속도 등을 포함한다.The web surfing-related information includes the number of accesses, residence time, page view, access speed and website reliability of each website of the evaluation member, and the number and access times of users accessing the website of the registered member. , Page views and connection speeds.

상기 웹사이트의 순위를 결정하는 단계는, 판별분석법으로 성격이 구분된 웹사이트에 대해서, 평가회원으로부터 층화추출법이나 할당추출법을 이용하여 소정의 표본집단을 추출하는 단계와, 상기 표본집단으로부터 확률비례표본추출법을 이용하여 비회원 웹사이트의 접속수, 체류시간, 페이지뷰 등의 웹서핑관련정보를 추출하는 단계를 포함한다.The determining of the ranking of the website may include extracting a predetermined sample group from the evaluation member using a stratification extraction method or an allocation extraction method for the website classified by the discriminant analysis method, and the probability proportionality from the sample group. And extracting web surfing related information such as the number of visits, residence time, page view, etc. of the non-member website using sampling method.

상기 추출된 웹서핑관련정보 들을 주성분분석법으로 종합 분석하여 웹사이트의 순위를 결정하는 단계를 더 포함하여 구성됨을 특징으로 한다.And analyzing the extracted web surfing related information by a principal component analysis method to determine the ranking of the web site.

소정 표본집단에 해당되는 평가회원수를 기초로 상기 서버가 포획-재포획추출법을 이용하여 특정 사이트에 접속하는 소정 표본집단에 대응되는 전체 인터넷 이용자수를 추출하고, 인터넷 이용자의 경향을 판단함을 특징으로 한다.Based on the number of evaluation members corresponding to a predetermined sample group, the server extracts the total number of Internet users corresponding to a predetermined sample group accessing a specific site by using a capture-recapture extraction method, and determines the tendency of the Internet user. It is done.

본 발명에서는 판별분석법(Discriminant Analysis)으로 웹사이트의 성격을 분류하여 순위를 평가한다.In the present invention, the ranking is evaluated by classifying the characteristics of the website by discriminant analysis.

이와 같은 본 발명에 의하면 각각의 웹사이트에 대한 특정 항목별로의 순위를 보다 정확하게 평가할 수 있게 되는 이점이 있다.According to the present invention as described above there is an advantage that it is possible to more accurately evaluate the ranking for each specific item for each website.

이하 상기한 바와 같은 본 발명에 의한 웹사이트순위평가방법의 바람직한 실시예를 첨부된 도면을 참고하여 상세하게 설명한다.Hereinafter, a preferred embodiment of the website ranking method according to the present invention as described above will be described in detail with reference to the accompanying drawings.

도 1에는 본 발명에 의한 웹사이트순위평가방법을 구현하기 위한 시스템이 도시되어 있다. 이에 도시된 바에 따르면, 평가사이트(10), 평가회원(30,30'), 등록회원(40,40'), 비회원웹사이트(50,50')는 네트워크인 인터넷(1)으로 연결되어 있다.1 shows a system for implementing a website ranking method according to the present invention. As shown in the drawing, the evaluation site 10, evaluation members 30 and 30 ', registered members 40 and 40', and non-member websites 50 and 50 'are connected to the Internet 1, which is a network. .

상기 평가사이트(10)에는 서버(12)가 구비되고, 이에는 회원정보데이터베이스(14), 포획정보데이터베이스(15) 및 가공정보데이터베이스(16) 등이 연결된다. 상기 서버(12)는 이들 연결된 데이터베이스와 각종 정보를 주고받아 가공하는 등의 작업을 수행하게 된다.The evaluation site 10 is provided with a server 12, which is connected to the member information database 14, the capture information database 15 and the processing information database 16 and the like. The server 12 exchanges and processes various information with these connected databases.

상기 평가회원(30,30')은 인터넷(1)을 사용하는 개인 이용자로서 별도의 웹사이트를 가지지 않은 자이다. 평가회원(30,30')의 시스템에는 인터넷(1)을 서핑하기 위한 웹브라우저(31)가 구비되어 있고, 상기 웹브라우저(31) 자체 내 또는 별도로 정보제공자(32)가 구비된다. 상기 정보제공자(32)는 상기 웹브라우저(31) 및 시스템의 OS와 각종 정보를 주고 받고, 웹서핑관련정보를 후킹(hooking)하여 상기 평가사이트(10)의 서버(12)로 전달하는 일종의 프로그램이다. 여기서 웹서핑관련정보란 특정 웹사이트(47,50,50')에 대한 접속수, 체류시간, 페이지뷰, 접속속도, 신뢰도 등이 있다. 그리고 상기 정보제공자(32)는 OS인 윈도우와 웹브라우저(31)에서 송수신되는 모든 메시지(예를 들면 키보드메시지, 마우스메시지, 타이머메시지 등)와 웹브라우저(31)의 쿠키(Cookies)정보를 훅킹하여 전송할 수도 있다. 이와 같은 정보제공자(32)는 상기 평가사이트(10)의 서버(11)에서 제공하는 정보를 실시간으로 표시할 수 있는 기능도 가진다.The evaluation members 30 and 30 'are individual users who use the Internet 1 and do not have a separate website. The system of the evaluation members 30, 30 'is provided with a web browser 31 for surfing the Internet 1, and the information provider 32 is provided within or separately from the web browser 31 itself. The information provider 32 sends and receives various information with the web browser 31 and the OS of the system, and hooks the web surfing related information to the server 12 of the evaluation site 10. to be. Here, the web surfing related information includes the number of connections, residence time, page view, connection speed, and reliability of the specific website 47, 50, 50 '. In addition, the information provider 32 hooks all the messages (for example, a keyboard message, a mouse message, a timer message, etc.) transmitted and received from the Windows and the web browser 31 as the OS and the cookies of the web browser 31. Can also be sent. The information provider 32 also has a function of displaying in real time the information provided by the server 11 of the evaluation site 10.

상기와 같은 정보제공자(32)는 웹브라우저(31)에 패널형태로 설치되어 필요한 정보를 제공하도록 할 수 있도록 하는 것이 바람직하다. 그리고 상기 정보제공자(32)는 웹브라이저(31)에 아이콘화된 상태로 제공될 수도 있다.The information provider 32 as described above is preferably installed in the web browser 31 in the form of a panel so as to provide the necessary information. The information provider 32 may be provided in an iconized state on the web browser 31.

한편, 상기 평가회원(30,30')의 시스템에는 평가사이트(10)가 제공하는 사용자프로그램(34)이 설치될 수 있다. 사용자프로그램(34)은 평가회원(30,30')의 유치를 위한 목적으로 유익한 기능(예를 들면, 바탕화면(wall paper)관리, 방화벽관리)을 제공하게 된다. 이와 같은 사용자프로그램(34)은 정보제공자(32)와 유사한 정보수집기능을 가져, 수집된 정보를 상기 정보제공자(32)로 전달하도록 할 수 있고, 상기 정보제공자(32)와 일체로 될 수도 있다.Meanwhile, a user program 34 provided by the evaluation site 10 may be installed in the system of the evaluation members 30 and 30 '. The user program 34 provides useful functions (for example, wall paper management and firewall management) for the purpose of attracting the evaluation members 30 and 30 '. The user program 34 may have an information collection function similar to that of the information provider 32 to transmit the collected information to the information provider 32, or may be integrated with the information provider 32. .

그리고 상기 평가회원(30,30')의 시스템에는 개인데이터베이스(35)가 구비되어 상기 평가회원(30,30')의 각종 정보를 저장하게 된다. 예를 들면, 평가회원(30,30')의 신상정보나 평가회원(30,30')의 식별을 위한 식별자 등이 저장될 수 있다.In addition, the system of the evaluation members 30 and 30 'is provided with a personal database 35 to store various information of the evaluation members 30 and 30'. For example, personal information of the evaluation members 30 and 30 'or an identifier for identifying the evaluation members 30 and 30' may be stored.

상기 등록회원(40,40')은 웹사이트(47)를 가지고 있는 회원으로서, 예를 들면, 허브사이트, 포털사이트나 각종의 콘텐츠를 제공하는 사이트들을 말한다. 이와 같은 등록회원(40,40')의 웹사이트(47)를 제어하는 서버(41)에는 정보제공자(42)가 구비된다. 상기 정보제공자(42)는 상기 웹사이트(47)에 사용자들이 접속하는 것과 관련된 정보를 상기 평가사이트(10)의 서버(11)로 전달하는 역할을 하게 된다. 한편, 평가회원(30,30')이면서 동시에 등록회원(40,40')일 수도 있다.The registered members 40 and 40 'are members who have a website 47, for example, a hub site, a portal site, or a site providing various contents. The server 41 controlling the website 47 of the registered members 40 and 40 'is provided with an information provider 42. The information provider 42 is responsible for delivering information related to the users accessing the website 47 to the server 11 of the evaluation site 10. Meanwhile, the evaluation members 30 and 30 'may be registered members 40 and 40' at the same time.

도 1중 미설명 부호 20은 평가사이트(10)에서 평가된 정보를 사용하기를 원하는 정보요구자이고, 50, 50'은 인터넷(1)에 연결된 각종 웹사이트로서 특히 평가사이트(10)에 회원으로 가입하지 않은 웹사이트를 말한다.In FIG. 1, reference numeral 20 denotes an information requester who wants to use the information evaluated in the evaluation site 10, and 50 and 50 'are various websites connected to the Internet 1, in particular, as a member of the evaluation site 10. Refers to a website that is not subscribed.

상기와 같은 구성에서 본 발명에 의한 웹사이트순위평가방법이 수행되는 것을 간단하게 설명하면 다음과 같다.When the website ranking method according to the invention in the above configuration is briefly described as follows.

먼저, 평가회원(30,30')이나 등록회원(40,40')을 모집하고, 상기 평가회원(30,30')이 능동적으로 웹사이트(47,50,50')를 서핑하면서 얻은 웹서핑관련정보와, 일반 사용자나 평가회원(30,30')이 상기 등록회원(40,40')의 웹사이트(47)에 접속함에 의해 등록회원(40,40')의 정보제공자(42)가 얻을 수 있는 정보를 모아서 포획정보데이터베이스(15)에 임시저장하고, 이중에 통계학적 가치가 있는 것을 모아서 서버(12)가 가공하여 가공정보데이터베이스(16)에 저장하게 된다.First, a web obtained by recruiting evaluation members 30, 30 'or registered members 40, 40' and actively surfing websites 47, 50, 50 '. Information related to the registered member (40, 40 ') by surfing-related information and the general user or evaluation member (30, 30') accesses the registered member (40, 40 ')' s website (47). The information that can be obtained is collected and temporarily stored in the capture information database 15, and among them, the statistical value is collected and the server 12 processes and stores the processed information database 16.

여기서 상기 포획정보데이터베이스(15)에 저장되어 있는 정보를 가공함에 있어서 각종 통계학적인 방법이 수행된다.Here, various statistical methods are performed in processing the information stored in the capture information database 15.

먼저, 평가회원(30,30') 중에서 표본집단을 추출하는데, 여기서는 층화추출법이나 할당추출법을 이용하게 된다. 즉 상기 회원정보데이터베이스(14)에서 평가회원(30,30')에 관한 데이터를 참고하여 특정 집단을 추출하는데, 예를 들면 한국인 20대 남자와 같이 특정한 표본집단을 추출할 수 있게 된다.First, a sample group is extracted from the evaluation members 30 and 30 ', and the stratification extraction method or the allocation extraction method is used here. That is, the specific information is extracted from the member information database 14 by referring to the data about the evaluation members 30 and 30 ', and for example, a specific sample group such as a Korean 20s man can be extracted.

그리고 상기와 같이 추출된 표본집단이 수집한 웹서핑관련정보들, 예를 들면, 특정 웹사이트(47,50,50')에 대한 접속수, 체류시간, 페이지뷰 등의 정보를 선별하고, 확률비례표본추출법을 이용하여 웹사이트(50,50')에 관한 실제 상기 웹서핑관련정보를 추정하게 된다. 이때, 상기 표본집단이 수집하여 포획정보데이터베이스에 저장된 웹서핑관련정보 모두가 이용되는 것이 아니라 통계학적으로 의미가 있는 것만을 선별하여 사용하게 된다.In addition, the web surfing-related information collected by the sample group extracted as described above, for example, information such as the number of times, residence time, page view, etc. for a specific website (47, 50, 50 ') is selected, and the probability By using the proportional sampling method, the actual surfing related information about the websites 50 and 50 'is estimated. In this case, not all of the web surfing related information collected by the sample group and stored in the capture information database is used, but only statistically meaningful ones are used.

상기와 같이 추정된 웹서핑관련정보를 사용하면, 바로 각각의 웹사이트(50,50')에 대한 각각의 항목별, 예를 들면 접속수, 체류시간, 페이지뷰 별로의 순위가 결정된다.Using the estimated web surfing-related information as described above, the ranking for each item, for example, the number of accesses, residence time, and page views, is determined for each website 50, 50 '.

그리고 웹사이트의 순위를 결정함에 있어서, 어떤 한가지 요소 예를 들면, 접속수만을 가지고 판단하는 것은 원하는 특정한 용도로서 적합한 데이터라고 할 수 없다. 따라서, 다변량분석법(Multivariate Analysis)중 주성분분석(Principal Component Analysis)을 이용하여 각각의 웹사이트(47,50,50')에 대한 순위를 결정하게 된다.In determining the ranking of a website, it is not a data that is suitable for a specific purpose desired by determining with one element, for example, the number of connections. Therefore, the rank of each website 47, 50, 50 'is determined by using Principal Component Analysis among the multivariate analysis.

이제 상기와 같은 과정을 거쳐 웹사이트의 순위를 결정하는 것을 보다 상세하게 설명하기로 한다.Now, the ranking of the website through the above process will be described in more detail.

도 2를 참고하여 평가회원(30,30')과 등록회원(40,40')으로 가입하고, 상기정보제공자(32,42)와 사용자프로그램(34)을 설치하는 것을 설명한다. 먼저, 본 평가사이트(10)에 인터넷(1)을 통해 접속하면(101단계), 회원가입과 관련하여 약관. 기본사항을 제시한다.(102단계) 상기 약관을 숙지하고 이에 동의하는지를 판단하는 단계(103)를 거친다.Referring to FIG. 2, the evaluation members 30 and 30 ′ and the registered members 40 and 40 ′ are registered, and the information providers 32 and 42 and the user program 34 are described. First, when accessing the evaluation site 10 through the Internet (step 101), the terms and conditions relating to membership. The basics are presented. (Step 102) The mobile terminal is subjected to the step 103 of understanding the terms of the agreement and determining whether they agree with them.

만약 상기 약관등에 동의하지 않으면, 접속을 종료하게 된다.(104단계) 그리고 약관등에 동의하면 소정의 ID와 패스워드를 입력하는 창을 제공하여 회원인지를 확인하게 된다.(단계105)If the terms and conditions are not agreed, the access is terminated (step 104). If the terms and conditions are agreed to, the user is provided with a window for inputting a predetermined ID and password to confirm whether the user is a member (step 105).

회원일 경우 최신 정보제공자(32,42)나 사용자프로그램(34)을 다운로드받고, 필요하여 회원정보를 갱신하게 된다.(106단계) 만일 회원이 아닐 경우에는 소정의 양식으로 된 개인 신상명세서를 입력하고(107단계), 평가회원(30,30')(108단계)이나 등록회원(40,40')(109단계)으로 될 것인지를 판단하는 단계를 거치게 된다. 등록회원(40,40')일 경우 등록회원으로서 필요한 각종 정보를 기입하고(110단계), 정보관리자(32)를 다운로드받고(111단계) 접속을 종료한다. 여기서 상기 110단계에서 정보란 등록회원(40,40')의 웹사이트(47)에 대한 URL과 웹사이트(47)에 대한 상세설명 등을 말한다.If you are a member, you can download the latest information provider (32, 42) or user program (34), and update your membership information if necessary. (Step 106) If you are not a member, enter your personal details in the prescribed form. And (step 107), the evaluation member (30, 30 ') (step 108) or registered members (40, 40') (step 109) is to go through the step of determining. In the case of the registered members 40 and 40 ', various information required as registered members are entered (step 110), the information manager 32 is downloaded (step 111), and the connection is terminated. In this case, the information in step 110 refers to the URL of the website 47 of the registered members 40 and 40 'and a detailed description of the website 47.

그리고 평가회원(40,40')일 경우에는 정보관리자(32)와 사용자프로그램(34)을 다운로드받는다.(112) 물론 이때, 상기 사용자프로그램(34)은 평가회원(40,40')이 다운로드받을 것인지를 선택할 수 있다.In the case of the evaluation members 40 and 40 ', the information manager 32 and the user program 34 are downloaded. (112) Of course, the user program 34 is downloaded by the evaluation members 40 and 40'. You can choose whether to receive.

또한 평가회원(30,30')인 경우에 최신정보갱신(106단계) 다음 단계로 진행하여 프로그램설정을 바꾸고(113단계) 회원가입을 끝내게 된다.(115단계) 이때, 상기사용자의 시스템에는 개인데이터베이스(35)가 만들어져, 평가회원(40,40')의 평가사이트(10)의 서버(12)와 데이터를 주고받기 위한 기본데이터가 저장된다. 이와 같은 상태가 되면 평가회원(30,30')은 웹서핑을 하면서 각종 웹사이트(47,50,50')의 정보를 수집할 수 있게 된다.In addition, in the case of the evaluation members (30, 30 '), the latest information update (step 106) proceeds to the next step to change the program setting (step 113) and ends the membership registration (step 115). A database 35 is created to store basic data for exchanging data with the server 12 of the evaluation site 10 of the evaluation members 40 and 40 '. In this state, the evaluation members 30 and 30 'may collect information of various websites 47, 50 and 50' while surfing the web.

다음으로 도 3을 참고하여, 평가회원(30,30')의 시스템에서 정보관리자(32)와 사용자프로그램(34)이 동작되는 것을 설명하기로 한다.Next, the information manager 32 and the user program 34 in the system of the evaluation members 30 and 30 'will be described with reference to FIG. 3.

사용자인 평가회원(30,30')이 컴퓨터를 사용하기 시작하면, 정보관리자(32)와 사용자프로그램(34)이 동작하게 된다.(203단계) 그리고 인터넷(1)에의 접속이 이루어 졌는지를 판단한다.(204단계) 만약 인터넷(1)에의 접속이 이루어져 있지 않으면, 상기 사용자프로그램(34)이 소정의 기능을 수행하게 된다.(205단계) 이와 같은 상태에서 상기 사용자프로그램(34)은 계속하여 인터넷(1)에의 접속을 대기하고 있게 된다.When the evaluation members 30 and 30 ', which are users, start using the computer, the information manager 32 and the user program 34 are operated (step 203). It is determined whether access to the Internet 1 is established. (Step 204) If no connection to the Internet 1 is established, the user program 34 performs a predetermined function. (Step 205) In this state, the user program 34 continues. The connection to the Internet 1 is waiting.

한편, 인터넷(1)에의 접속이 이루어지면, ID와 비밀번호를 입력하여 회원인가를 판단하게 된다.(207단계) 이때, 비밀번호를 잊어버렸을 경우 이메일을 이용하여 회원에게 전송할 수 있다.On the other hand, when access to the Internet 1 is made, it is determined whether the member is entered by inputting an ID and a password (step 207). At this time, if the password is forgotten, it can be transmitted to the member by e-mail.

그리고 207단계에서는 실제로 그 시스템에서 인터넷(1)을 사용하는 자가 평가회원(30,30')인지를 물어보게 된다. 이는 그 시스템을 다수의 사용자가 공동으로 사용하는 경우에 평가회원(30,30')이 아니면 가입을 유도하기 위함이다.In step 207, the system asks whether it is a self-evaluating member (30, 30 ') using the Internet (1) in the system. This is to induce a subscription unless the evaluation members 30, 30 'are used by a plurality of users jointly.

일단 회원으로 판단되면, 정보제공자(32)나 사용자프로그램(34)을 업그레이드하게 된다.(208단계) 물론 업그레이드 사항이 없는 경우에는 이 단계를 그냥 지나게 된다.Once determined to be a member, the information provider 32 or the user program 34 is upgraded (step 208). Of course, if there are no upgrades, this step just passes.

다음으로는 평가회원(30,30')이 인터넷(1)을 서핑함에 따라 상기 정보제공자(32)에 의해 정보수집이 이루어진다.(220단계) 그리고 상기 수집된 웹서핑관련정보는 상기 정보제공자(32)에 의해 평가사이트(10)의 서버(12)로 전달된다. 이때 상기 서버(12)의 가공정보데이터베이스(16)에 있는 정보가 또한 상기 정보제공자(32)로 실시간으로 전달되어, 현재 접속하고 있는 웹사이트(47,50,50')와 관련된 정보가 평가회원(30,30')에게 제공된다.(230단계) 이와 같이 상기 서버(12)와 정보제공자(32) 사이에서 정보가 송수신되는 과정에서 상기 정보제공자(32)가 후킹한 정보는 상기 개인데이터베이스(35)에 임시로 저장된다.Next, as the evaluation members 30 and 30 'surf the Internet 1, information is collected by the information provider 32 (step 220). The collected web surfing-related information is stored in the information provider ( 32 is transmitted to the server 12 of the evaluation site (10). At this time, the information in the processing information database 16 of the server 12 is also delivered to the information provider 32 in real time, so that the information related to the website 47, 50, 50 'which is currently connected is evaluated. The information hooked by the information provider 32 in the process of transmitting and receiving information between the server 12 and the information provider 32 is stored in the personal database (30, 30 '). Is stored temporarily.

한편, 상기 정보제공자(32)에 의해 상기 서버(12)로 전달된 정보는 포획정보데이터베이스(15)에 저장된다. 상기 포획정보데이터베이스(15)에는 상기 평가회원(30,30')이나 등록회원(40,40')으로부터 전달되는 각종 정보가 임시로 저장된다. 그리고 상기 서버(12)는 상기 임시로 저장되어 있는 정보중 통계학적으로 가치가 있는 것을 선별하여 가공하고 이를 가공정보데이터베이스(16)에 저장하게 된다.(240단계)On the other hand, the information delivered by the information provider 32 to the server 12 is stored in the capture information database 15. The capture information database 15 temporarily stores various types of information transmitted from the evaluation members 30 and 30 'or the registered members 40 and 40'. The server 12 selects and processes statistically valuable information among the temporarily stored information and stores it in the processing information database 16 (step 240).

한편, 평가회원(30,30')이 웹서핑중에 방문한 웹사이트(47,50,50')에 대해 상기 가공정보데이터베이스(16)에 저장된 정보가 상기 정보제공자(32)에 전달되어 실시간으로 화면에 표시된다.(250단계)Meanwhile, information stored in the processing information database 16 is transmitted to the information provider 32 for the websites 47, 50, and 50 'visited by the evaluation members 30 and 30' while surfing the web. (Step 250)

상기 207단계에서 회원이 아닌 것으로 판단되면, 회원으로의 가입을 위한 과정을 수행하게 된다. 먼저 회원으로 가입할 것인가를 물어보고(209단계) 회원으로가입하기를 원하지 않으면 종료하여 회원이 아닌 상태로 인터넷(1)을 서핑할 수 있도록 한다.If it is determined in step 207 that the member is not a member, a process for joining as a member is performed. First, it asks whether or not to join as a member (step 209). If it is not desired to join as a member, it is terminated so that the user can surf the Internet 1 without being a member.

그리고 회원으로 가입하기를 원하면, 가입에 필요한 신상명세를 입력한다.(210단계) 다음으로는 평가회원(30,30')으로만 가입할 것인가를 판단하게 된다.(211단계) 이때, 평가회원(30,30')으로만 가입하기를 원하면 프로그램 업데이트를 수행하고(212단계) 220단계로 넘어가게 된다.And if you want to join as a member, enter the details of the membership required (step 210). Next, it is determined whether to join only the evaluation members (30, 30 ') (step 211). If you want to join only (30,30 '), the program is updated (step 212) and the process goes to step 220.

상기 211단계에서 등록회원(40,40')으로 가입하기를 원하면 214단계로 넘어가, 등록회원(40,40')의 가입에 필요한 정보를 기입하게 된다. 그리고는 등록회원(40,40')의 웹사이트(47)에 필요한 정보관리자(42)를 다운로드받아 설치하고(215단계) 종료하게 된다.If the user wants to join the registered members 40 and 40 'in step 211, the process proceeds to step 214, and the information necessary for the registration of the registered members 40 and 40' is entered. Then, it downloads and installs the information manager 42 necessary for the website 47 of the registered members 40 and 40 'and ends (step 215).

한편, 등록회원(40,40')중에 우수회원으로 선정된 경우에는 등록회원(40,40')의 웹사이트(47)에 평가사이트(10)에서 제공하는 인증마크와 소스코드를 제공하게 된다.On the other hand, in the case of being selected as an excellent member among the registered members (40, 40 '), the certification mark and source code provided by the evaluation site 10 will be provided on the website 47 of the registered members (40, 40'). .

도 4에는 평가회원이 웹서핑을 하면서 정보제공자를 이용하여 정보를 후킹하고, 평가사이트(10)의 서버(12)와 주고받는 과정이 설명되어 있다. 즉 도 3의 220단계서 250단계를 보다 상세하게 설명한다.4 illustrates a process in which an evaluation member hooks information using an information provider while surfing the web, and exchanges information with a server 12 of the evaluation site 10. That is, step 220 to step 250 of FIG. 3 will be described in more detail.

정보수집 단계에서는 먼저 평가회원(40,40')의 정보를 수집한다.(301단계) 즉 정보제공자(32)나 사용자프로그램(34)이 평가회원(40,40')의 레지스트리정보를 읽어 예를 들면, OS, CPU, 해상도, 메모리, 현재 사용중인 평가회원(40,40'), 하드웨어정보, 소프트웨어 에플리케이션, 환경설정 등을 수집한다.In the information collection step, information of the evaluation members 40 and 40 'is first collected (step 301). That is, the information provider 32 or the user program 34 reads the registry information of the evaluation members 40 and 40'. For example, it collects OS, CPU, resolution, memory, currently used evaluation members (40, 40 '), hardware information, software applications, environment settings, and the like.

다음으로는 웹브라우저(31)와 OS시스템을 감시해서 실시간으로 메시지 또는 URL변동사항을 체크한다.(302단계)Next, the web browser 31 and the OS system are monitored to check messages or URL changes in real time (step 302).

그리고 상기 단계에서 얻어진 URL로부터 호스트이름과 패스(Path)이름을 분리하는 과정을 수행하거나(303단계), URL로부터 IP를 얻거나 IP로부터 URL을 얻는 과정을 수행한다.(304단계) 또한 특정 URL에서 체류하는 시간을 카운트한다.(305단계)The host name and the path name are separated from the URL obtained in the step (step 303), or the IP is obtained from the URL or the URL is obtained from the IP (step 304). Count the time to stay at (step 305).

또한 마우스의 움직임으로 의미있는 체류시간을 얻어낸다. 즉, 마우스나 포인팅디바이스의 이동이 있는가는 판단하여(306단계), 마우스가 움직이면 체류시간을 카운트하고, 마우스가 일정 시간(예를 들면 1분)동안 움직이지 않으면 체류시간카운트를 중단한다.(307단계) 또한 마우스의 움직임을 기다리고 있다가, 움직임이 감지되면(308단계), 체류시간을 카운트(307단계)한다.In addition, meaningful retention times are obtained with the movement of the mouse. In other words, it is determined whether the mouse or the pointing device has moved (step 306). If the mouse moves, the dwell time is counted. If the mouse does not move for a predetermined time (for example, one minute), the dwell time count is stopped. In step 307, the mouse waits for the movement of the mouse. If the movement is detected (step 308), the dwell time is counted (step 307).

다음으로는 웹사이트(47,50,50')의 신뢰도를 평가하는 과정을 거치게 된다.(310단계) 이 단계는 웹사이트(47,50,50')에 대한 사용자의 신뢰도를 평가하는 항목을 제시하여 항목별로 점수를 매기도록 하여 평가한다. 평가항목으로는 웹사이트(47,50,50')의 전문성, 디자인, 완성도, 회원신뢰성 등이 있다.Next, the process of evaluating the reliability of the websites 47, 50, and 50 'is performed (step 310). Present and score by item. Evaluation items include professionalism, design, completeness, and membership reliability of the website (47, 50, 50 ').

한편, 현재 접속하고 있는 웹사이트(47,50,50')에 대해 평가사이트(10)의 가공정보데이터베이스(16)에 있는 각종 정보를 역으로 제공하여 평가회원(30,30')에게 제공한다.(312단계)On the other hand, the website 47, 50, 50 'currently connected to the processing information database 16 of the evaluation site 10 is provided in reverse to provide various information to the evaluation members 30, 30'. (Step 312)

그리고 상기 정보제공자(32)에 의해 후킹된 웹서핑관련정보는 평가사이트(10)의 서버(12)로 전송된다.(313단계)The web surfing related information hooked by the information provider 32 is transmitted to the server 12 of the evaluation site 10 (step 313).

여기서 상기 312단계와 313단계는 실시간으로 반복하여 수행될 수도 있고 일정 시간을 두고 반복하여 수행될 수도 있다.In this case, steps 312 and 313 may be repeatedly performed in real time or may be repeatedly performed for a predetermined time.

한편, 등록회원(40,40')의 정보제공자(42)는 그 웹사이트(47)에 접속하는 모든 사용자(평가회원(30,30')과 비회원을 포함하는 모든 접속자)와 관련된 웹서핑관련정보를 상기 서버(12)로 제공하게 된다.On the other hand, the information provider 42 of the registered members 40, 40 'is related to the web surfing associated with all users (evaluation members 30, 30') and all the users including non-members accessing the website 47. Information is provided to the server 12.

이제 상기와 같이 정보제공자(32)(42)에 의해 제공되는 웹서핑관련정보를 가공하여 각 웹사이트(47,50,50')의 순위를 평가하는 것을 보다 상세하게 설명한다.Now, the web surfing related information provided by the information providers 32 and 42 is processed as described above to evaluate the ranking of each website 47, 50, and 50 'in more detail.

먼저, 평가회원(30,30') 들이 제공하는 정보를 가공하여 웹사이트(47,50,50')의 순위를 결정함에 있어서는 평가회원(30,30') 중에 특정 표본집단을 추출하여야 한다. 이때에는 층화추출법과 할당추출법을 각각 사용하거나 이들을 조합하여 사용할 수 있다. 예를 들어 한국의 20대 남자와 관련하여 웹사이트의 순위를 결정하기 위해서는, 평가회원중에 한국의 20대 남자를 추출하여 표본집단을 만든다.First, in order to rank the websites 47, 50 and 50 'by processing the information provided by the evaluation members 30 and 30', a specific sample group must be extracted from the evaluation members 30 and 30 '. In this case, the stratified extraction method and the allocation extraction method may be used, respectively, or a combination thereof. For example, to determine the ranking of a website in relation to a man in his twenties, a sample group is created by extracting a man in his twenties from among the evaluation members.

다음으로는 상기와 같이 추출된 표본집단에서 제공하는 웹서핑관련정보를 이용하여 각각의 웹사이트(47,50,50')의 각각의 정보(예를 들면 접속수, 체류시간, 페이지뷰 등)의 실제량을 추정한다.Next, by using the web surfing-related information provided by the sample group extracted as described above, each piece of information (e.g., the number of connections, residence time, page view, etc.) of each website (47, 50, 50 ') Estimate the actual amount of.

여기서 확률비례표본추출법을 이용하여 각각의 웹사이트(50,50')의 실제 접속수, 체류시간 및 페이지뷰를 추정하는 것을 표 1를 참고하여 설명한다.Here, using the probability proportional sampling method, estimating the actual number of visits, residence time and page view of each website 50, 50 'will be described with reference to Table 1.

인터넷 전체 사용자중 회원 100명의 일정한 기간동안 정보량 1600번중Of the total 100 users of the Internet, the amount of information 1600 times 회원정보량Member Information 실제정보량Actual amount of information 회원사이트Member Site ABCDEABCDE 10번20번30번40번200번10 times 20 times 30 times 40 times 200 1200번2500번4200번5400번25000번1200 2500 4200 5400 25000 비회원사이트Non-member site FF 13001300 ??????

통계학적으로 의미가 있는 상위 몇 %의 웹사이트인 A,B,C,D,E,F에 대해서 등록회원(40,40')의 웹사이트(47)인 A,B,C,D,E에 대한 정확한 접속수를 알고 있을 경우 비등록회원의 웹사이트(50,50')인 F에 대한 접속수를 결정하는 것은 다음과 같다.A, B, C, D, E, the registered member (40, 40 ') website 47, A, B, C, D, E, F for the top few percentages of statistically significant websites If we know the exact number of visits to, then we determine the number of visits to the non-registered member's website (50,50 ') F

일단 평가사이트(10)의 등록회원(40,40')중 정보제공자(42)를 구비하는 웹사이트(47)인 A,B,C,D,E에 대해서는 이미 그 모든 로그정보(실제 해당 웹사이트(47)에 대한 접속수, 체류시간, 페이지뷰 등)를 알고 있다. 즉 표 1에 도시된 바와 같이 예를 들어, A사이트의 전체 접속수가 1200회 이고 A사이트에 대한 평가회원(30,30')의 접속수가 10회, B사이트의 전체 접속수가 2500회이고 A사이트에 대한 평가회원(30,30')의 접속수가 20회, C사이트에 대한 전체 접속수가 4200회이고 평가회원(30,30')의 접속수가 30회, D사이트에 대한 전체 접속수가 5400회이고 평가회원(30,30')의 접속수가 40회, E사이트에 대한 전체 접속수가 25000회이고 평가회원(30,30')의 접속수가 200회라고 한다. 이때, 비회원인 F사이트의 실제 접속수를 추출한다. 여기서 F사이트에 대한 평가회원(30,30')의 접속수는 1300회이다.Once all the log information (Act B, C, D, E, which is the website 47 having the information provider 42 among the registered members 40, 40 'of the evaluation site 10, is already available (the corresponding web) The number of connections to the site 47, residence time, page views, etc.). For example, as shown in Table 1, for example, the total number of accesses to site A is 1200, the number of evaluation members (30,30 ') to site A is 10, the total number of sites B is 2500 and 20 members of the evaluation member (30,30 '), 4,200 visitors to the C site, 30 members of the evaluation member (30,30'), and 5,400 users of the D site. It is assumed that the number of evaluation members 30 and 30 'is 40, the total number of accesses to the E-site is 25000 and the number of evaluation members 30 and 30' is 200. At this time, the actual number of connections of non-member F site is extracted. Here, the number of evaluation members 30 and 30 'connected to the F site is 1,300 times.

이와 같은 경우에 다음의 식을 이용하여 F사이트에 대한 실제 접속수를 구한다.In this case, use the following equation to find the actual number of connections to site F.

여기서 τ는 어느 일정한 기간동안의 평가회원(30,30')의 접속수 총계(여기서는 1600번), Xi는 어느 일정한 기간동안의 평가회원에 의해서 전달된 A,B,C,D,E,F 사이트에 대한 접속수, N은 일정기간 동안의 인터넷 사용자 접속수 총계, x는 일정 기간동안의 등록회원 웹사이트(47)에 대한 인터넷 사용자 접속수, F는 F웹사이트에 대한 평가회원 접속수이다.Where τ is the total number of connections (30,30 ') of the evaluation members (30,30') for a certain period, X i is A, B, C, D, E, F is the number of accesses to the site, N is the total number of Internet user accesses during the period, x is the number of Internet user accesses to the registered member website 47, F is the number of evaluation member accesses to the F website. to be.

상기 수학식 1에 수학식 2를 대입하여 확률비례표본추출법에서 실제 접속량 총계(N)는 167,166명이 구해지고, 따라서 구하고자 하는 F사이트의 실제 추정 접속수는 F/x에 일정 기간동안의 인터넷 사용자의 접속수 총계를 곱하면, 128,600이 된다. 이와 같은 방식으로 하게 되면 비회원 웹사이트(50,50')의 접속수를 추정할 수 있게 된다. 물론 이와 같은 방식은 접속수 만이 아니라, 페이지뷰 및 체류시간에 대해서도 동일하게 적용할 수 있다.Substituting Equation (2) into Equation (1), the total number of actual connections (N) is obtained by 167,166 persons in the probability proportional sampling method. If you multiply the total number of connections, you get 128,600. In this way it is possible to estimate the number of connections of non-member websites 50,50 '. Of course, the same method can be applied not only to the number of connections, but also to page views and residence time.

일단, 상기와 같은 확률비례표본추출법에 의하면 등록회원(40,40')의 웹사이트(47)뿐만 아니라 일반 웹사이트(50,50')에 대해서도 접속수, 페이지뷰 및 체류시간에 관한 정보를 알 수 있게 되고, 이에 따라 각 웹사이트(47,50,50')에 대한 각각의 항목에 대한 순위를 구할 수 있게 된다.First, according to the above probability proportional sampling method, information about the number of accesses, page views, and residence time is provided not only for the website 47 of the registered member 40, 40 'but also the general website 50, 50'. In this way, a ranking of each item for each website 47, 50, 50 'can be obtained.

한편, 상기와 같은 항목에 대한 웹사이트(47,50,50')의 순위를 구함에 있어서, 웹사이트(47,50,50')의 성격에 따라 분류하여 순위를 결정할 수 있다. 여기에 사용되는 것은 판별분석(Discriminant Analysis)이다.On the other hand, in order to obtain the ranking of the website 47, 50, 50 'for the above items, the ranking can be determined by classifying according to the characteristics of the website (47, 50, 50'). Used here is Discriminant Analysis.

판별분석이란 주로 평균치 차이에 많는 영향을 미치는 독립변수가 어떤 것인가를 찾거나 주어진 개체를 분류하거나 사전에 확정된 두개 이상의 집단에 대한 평균들의 차이가 존재하는 가를 보일 수 있는 것으로, 예를 들어 동.식물을 분류하는 문제나, 기업의 도산기업과 건전기업의 판별문제, 대학을 졸업한 학생을 대상으로 입학성적, IQ, 여자친구, 부모소득, 대학성적등을 대상으로 우등생과 낙제생을 구별하는 문제등을 다루는데, 여기서 본 발명자는 수많은 웹사이트의 성격을 구별하는데 이를 적용하였다. 도 5에 도시된 바와 같이, 두 분포함수가 있고 개체의 한 값 X0가 주어져 있다면, 이 개체는 두 분포 함수중에 어떤 분포함수에 가깝다고 판별할 수 있는가 라는 물음은 어떤 웹사이트가 제1모집단(예를 들면 쇼핑몰)과 제2모집단(예를 들면 게임몰)중 어느 웹사이트로 분류할 수 있는가 라는 문제와 일맥 상통하며 이때 판별분석을 통하여 판별함수를 유동하고 이 판별함수를 기준으로 개체를 분류할 수 있으므로 X0값을 두 분포함수에 대입하면 제1모집단의 확률값이 제2모집단의 확률값보다 크게 나오므로 이 개체는 제1모집단에 속하는 것으로 분류할 수 있는 것이다.Discriminant analysis can be used to find which independent variable has a large influence on the difference between the mean values, to classify a given individual, or to show whether there is a difference between means for two or more previously determined groups. Problems in classifying plants, discrimination between bankruptcy companies and healthy companies, and distinguishing honor students from failing students in terms of entrance grades, IQs, girlfriends, parents' income, college grades, etc. And the like, in which the present inventors applied this to distinguish the nature of numerous websites. As shown in FIG. 5, if two distribution functions are provided and a value X 0 of an entity is given, the question of which distribution function is close to which of the two distribution functions is a website is the first population ( For example, it is in line with the question of which website can be classified as a shopping mall) or a second group (for example, a game mall). At this time, a discrimination function is flowed through a discriminant analysis and an object is classified based on the discriminant function. Thus, substituting the X 0 value into two distribution functions yields a probability value of the first population larger than that of the second population, so that the entity can be classified as belonging to the first population.

한편, 각각의 웹사이트(47,50,50')의 순위를 결정함에 있어서, 예를 들어 접속수, 체류시간 및 페이지뷰와 같은 어느 한 항목에 한정하여 순위를 결정하지 않고 이들 각각의 항목들 모두를 기초로 하여 웹사이트(47,50,50')의 순위를 결정하는 것은 다음과 같다.On the other hand, in determining the ranking of each website 47, 50, 50 ', for example, each of these items is not determined by ranking only for one item such as the number of visits, residence time and page view. On the basis of all, ranking of websites 47, 50, and 50 'is as follows.

이때 예로든 각각의 항목들은 그 값의 기준이 모두 다른다. 예를 들면, 접속수는 정수단위, 체류시간은 시간단위, 페이지뷰를 정수단위 그리고 신뢰도는 백분율 등이다. 따라서 이들 각각의 항목의 값을 하나의 값으로 환산하여 웹사이트(47,50,50')의 순위를 결정하는 것이 필요하다. 이를 위해 본 발명자는 다변량분석법(Multivariate Analysis)중 주성분분석법(Principal Componen Analysis)을 사용하였다.In this case, each of the items has different criteria for the value. For example, the number of connections is an integer unit, the dwell time is an hour unit, the page view is an integer unit, and the reliability is a percentage. Therefore, it is necessary to convert the value of each of these items into one value to rank the websites 47, 50, and 50 '. To this end, the present inventors used Principal Componen Analysis among multivariate analysis methods.

평가사이트(10)의 서버(12)에서는 포획정보데이터베이스(15)의 정보중 통계학적으로 의미가 있는 것을 뽑아 사용한다. 즉 각각의 항목의 단위의 영향을 없애기 위해 평균을 0, 분산을 1로 하는 데이터표준화작업을 한 후, 변수와 변수간의 상관관계의 정도를 나타내는 상관행렬을 구하고, 고유치와 고유벡터를 어느 기여율 한도내에서 충분하게 설명할 수 있는 주성분(제1성분,제2성분,제3성분)을 선택한다. 여기서 얻은 변수간의 상관관계와 누적기여율에 미치는 영향을 평가하여 주성분관계식으로부터 주성분 득점을 구해 각각의 웹사이트(47,50,50')의 종합순위를 평가하게 된다.The server 12 of the evaluation site 10 extracts and uses statistically significant information from the information of the capture information database 15. In order to remove the influence of the unit of each item, the data is normalized with the mean as 0 and the variance as 1, and then the correlation matrix indicating the degree of correlation between the variables is obtained. The main component (1st component, 2nd component, 3rd component) which can fully explain inside is selected. By evaluating the correlation between the variables and the effect on the cumulative contribution rate, the principal component scores are obtained from the principal component relations equation, and the overall ranking of each website (47, 50, 50 ') is evaluated.

여기서 참고로 주성분분석법에 대해 간략하게 설명하기로 한다. 주성분분석이란 일반적으로 종합적 특성을 말하며, 그 크기를 재는 수단으로 다수의 항목(설명변수)에 내재되어 있는 공통적인 성분을 의미한다. 다수의 설명변수를 선형변화기법을 통하여 소수의 새로운 독립변수를 만들어 반응변수에 미치는 주된 영향력을 규명하고, 그 주된 영향력이 어떤 성분인가도 발견한다. 즉 많은 항목(변수)들을 설명변수로 하고 어떤 설명변수가 반응변수에 가장 많은 영향을 미치고 또 어떤 용인이 '+'요인으로 작용하고 어떤 요인이 '-'요인으로 작용하는 것인가 등을 규명할 수 있는 통계적 기법이다.Here, the principal component analysis method will be briefly described. Principal component analysis generally refers to a comprehensive characteristic, and means a common component inherent in many items (explanatory variables) as a means of sizing. Through the linear change technique of a large number of explanatory variables, a few new independent variables are created to identify the main influences on the response variables and to discover what the main influences are. That is, it is possible to identify many items (variables) as explanatory variables, which explanatory variables have the most influence on response variables, which factors act as '+' factors, and which factors act as '-' factors. Statistical technique.

여기서 평가항목으로는 접속수통계, 체류시간통계, 페이지뷰통계, 접속속도통계, 회원수통계(등록회원중 기업회원만 해당), 신뢰도(신용도)통계 등이 있으며, 이와 같은 자료의 단위가 평가항목간에 서로 달라서 직접적인 비교가 불가능하므로 상관행렬 방법에 의한 주성분 분석법(누적기여율 60%이상이 되도록 하고 고유치가 1.0이상인 것을 사용)을 이용한다.The evaluation items include connection statistics, dwell time statistics, page view statistics, connection speed statistics, membership statistics (only among corporate members among registered members), and reliability (credit level) statistics. Since it is different from each other, it is impossible to make a direct comparison, so the principal component analysis method using the correlation matrix method (using a cumulative contribution rate of 60% or more and using an eigenvalue of 1.0 or more) is used.

관련식으로는 다음의 식이 있다.Related equations are as follows.

여기서 Y는 주성분, ai는 반응변수(종속변수), Xi는 설명변수(평가항목)이다.Where Y is the principal component, a i is the response variable (dependent variable), and X i is the explanatory variable (evaluation item).

한편, 전세계, 각 국가, 각 지역의 실제 인터넷 사용자 또는 나이별, 관심별, 성별, 직업별, 종교별 숫자를 통계학적으로 추정하거나 경향(이동방향이나 이동하는데 걸린시간)을 파악하는 법으로 포획-재포획(Capture-Recapture Sampling)을 이용한다.On the other hand, the world's Internet, country, or region's actual Internet users, or age, interest, gender, occupation, religion, etc., by statistically estimating or identifying trends (travel direction or time taken) Use Capture-Recapture Sampling.

하지만 이와 같은 방법을 이용함에 있어서는 인터넷 사용자가 새로 생길수도 있고 인터넷 사용자중 회원이든 비회원이든 회원을 탈퇴하거나 인터넷 사용을 중지할 수 있고 인터넷 사용자마다 관심의 대상이 되는 사이트에 방문할 확률이 같다고 말할 수 없다. 하지만, 이와 같은 상황은 통계학적인 분석을 통하여 문제를 단순화시켜 극복하기로 한다.However, using this method may result in the creation of new Internet users, whether members of the Internet or non-members, can withdraw their membership or suspend their use of the Internet, and that each Internet user has the same probability of visiting a site of interest. none. However, this situation will be overcome by simplifying the problem through statistical analysis.

그리고, 해당 각 항목의 인터넷 사용자의 숫자를 추정하기 위해서는 각 항목에 해당하는 회원의 숫자가 각 항목의 대표가 되는 상위 몇 % 내 각 웹사이트에 어떤 일정한 기간 동안 방문한 인터넷 사용자 평균에서 확인된 회원의 평균 비율과 같다고 봄으로서 얻을 수 있다. 이때 해당 웹사이트는 전세계적인 사이트와 지역적인 사이트로 구분될 수 있으며, 구분 기준은 외국인 방문자/전체방문자 또는 외국인방문자/자국인방문자 비율의 몇 %로 제한하거나 각 국가 또는 지역의 인터넷 사용자에 대한 실제 해당 웹사이트 방문자비율의 몇 %이하로 제한할 수 있다.In order to estimate the number of Internet users of each item, the number of members identified in the average number of Internet users who visited each website for a certain period of time in the top few percent of the number of members corresponding to each item is represented by each item. It can be obtained as spring that is equal to the average ratio. The website can be divided into a global site and a local site, and the criteria for classification are limited to a few percent of the ratio of foreign visitors / total visitors or foreign visitors / local visitors, or to actual Internet users in each country or region. You can limit it to a few percent or less of the website visitor rate.

이와 같은 전제조건 하에서 전체 인터넷 사용자 중에서 본 웹사이트에 회원으로 가입한 사용자중 통계학적으로 의미 있는 사용자를 각 항목에 맞게 적절히 분류한다.Under these prerequisites, among the total internet users, statistically meaningful users among the users who have registered as members of this website are classified accordingly.

그리고 일정한 시간이 경과한 후에 각 항목에 해당하는 회원의 숫자가 각 항목의 대표가 되는 상위 몇 %내의 각 웹사이트에 어느 일정한 기간 동안 방문한 인터넷 사용자 평균과 방문이 확인된 회원의 평균을 어떤 일정한 오차의 한계 또는 신뢰구간(예, 99%,95%)으로 구한다.And after a certain period of time, the number of members corresponding to each item is equal to the average number of Internet users who visited each website within a certain period of time, and the average of the members whose visits were confirmed. To the limit or confidence interval (eg 99%, 95%).

마지막으로 알고 싶은 항목에 해당하는 모집단의 크기를 다음의 식에 의해계산하게 된다.Finally, the size of the population corresponding to the item you want to know is calculated by the following equation.

여기서 N은 각 항목에 해당하는 모집단의 크기, M은 각 항목에 해당하는 회원수, n은 어느 일정한 기간 동안 방문한 인터넷 사용자 평균, m은 어느 일정한 기간동안 방문이 확인된 각 항목의 회원의 평균이다.Where N is the size of the population corresponding to each item, M is the number of members corresponding to each item, n is the average number of Internet users who visited during a certain period, and m is the average of the members of each item identified for a certain period.

위에서 상세히 설명한 바와 같은 본 발명에 의한 웹사이트순위평가방법에 의하면, 인터넷에 연결되어 있는 각종 웹사이트의 순위를 통계학적으로 정리하여 평가할 수 있게 되어, 인터넷 사용자 들에게 보다 정확하면서도 객관적인 웹사이트 순위정보를 제공할 수 있게 된다.According to the website ranking method according to the present invention as described above in detail, it is possible to statistically summarize the ranking of various websites connected to the Internet, more accurate and objective website ranking information for Internet users Can be provided.

Claims (6)

네트워크 상에서 능동적으로 웹서핑을 하는 평가회원과 웹서핑의 대상이 되는 등록회원을 서버에 등록하는 단계와,Registering an evaluation member actively performing web surfing on the network and a registered member who is the target of web surfing on the server; 웹서핑관련정보를 획득하여 전송하는 정보제공자를 상기 서버가 제공하여 상기 평가회원과 등록회원의 시스템에 설치하는 단계와,Providing, by the server, an information provider for acquiring and transmitting web surfing related information to the evaluation member and the registered member's system; 네트워크에 접속된 상기 평가회원과 등록회원의 정보제공자를 통해 웹서핑관련정보를 서버가 전달받는 단계와,Receiving, by the server, web surfing related information through an information provider of the evaluation member and the registered member connected to the network; 상기 서버가 전달받은 웹서핑관련정보를 데이터베이스에 기록하는 단계와,Recording the web surfing related information received by the server in a database; 상기 데이터베이스화된 웹서핑관련정보를 상기 서버에서 통계학적 방법으로 가공하여 웹사이트의 순위를 결정하는 단계를 포함하여 구성됨을 특징으로 하는 웹사이트순위평가방법.And determining the rank of the web site by processing the databased web surfing related information in a statistical method at the server. 제 1 항에 있어서, 상기 웹서핑관련정보로는 상기 평가회원의 각 웹사이트에 대한 접속수, 체류시간, 페이지뷰, 접속속도 및 웹사이트신뢰도가 있으며, 상기 등록회원의 웹사이트에 접속한 사용자의 접속수, 체류시간, 페이지뷰 및 접속속도 등을 포함함을 특징으로 하는 웹사이트순위평가방법.According to claim 1, The web surfing related information includes the number of access to each website of the evaluation member, residence time, page view, access speed and website reliability, the user who accesses the website of the registered member Web site ranking method comprising the number of times of stay, the time of stay, page views and speed of connection. 제 1 항에 있어서, 상기 웹사이트의 순위를 결정하는 단계는,The method of claim 1, wherein ranking the website comprises: 판별분석법으로 성격이 구분된 웹사이트에 대해서, 평가회원으로부터 층화추출법이나 할당추출법을 이용하여 소정의 표본집단을 추출하는 단계와,Extracting a predetermined sample group from the evaluation members using the stratification extraction method or the allocation extraction method for websites classified by the discriminant analysis method; 상기 표본집단으로부터 확률비례표본추출법을 이용하여 비회원 웹사이트의 접속수, 체류시간, 페이지뷰 등의 웹서핑관련정보를 추출하는 단계를 포함함을 특징으로 하는 웹사이트 순위평가방법.And extracting web surfing related information such as the number of times of non-member website access, residence time, page view, etc. using the probability proportional sampling method from the sample group. 제 3 항에 있어서, 상기 추출된 웹서핑관련정보 들을 주성분분석법으로 종합 분석하여 웹사이트의 순위를 결정하는 단계를 더 포함하여 구성됨을 특징으로 하는 웹사이트 순위평가방법.4. The method of claim 3, further comprising the step of comprehensively analyzing the extracted web surfing related information by a principal component analysis method to determine the ranking of the web site. 제 3 항에 있어서, 소정 표본집단에 해당되는 평가회원수를 기초로 상기 서버가 포획-재포획추출법을 이용하여 특정 사이트에 접속하는 소정 표본집단에 대응되는 전체 인터넷 이용자수를 추출하고, 인터넷 이용자의 경향을 판단함을 특징으로 하는 웹사이트순위평가방법.4. The method of claim 3, wherein the server extracts the total number of Internet users corresponding to a predetermined sample group accessing a specific site by using the capture-recapture extraction method based on the number of evaluation members corresponding to the predetermined sample group. Website ranking method characterized by determining the trend. 제 1 항 내지 제 5 항중 어느 한 항에 있어서, 판별분석법(Discriminant Analysis)으로 웹사이트의 성격을 분류함을 특징으로 하는 웹사이트순위평가방법.The method according to any one of claims 1 to 5, characterized in that the characteristics of the websites are classified by discriminant analysis.
KR1020000030327A 2000-06-02 2000-06-02 Ranking appraisement method for website KR20010109744A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000030327A KR20010109744A (en) 2000-06-02 2000-06-02 Ranking appraisement method for website

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000030327A KR20010109744A (en) 2000-06-02 2000-06-02 Ranking appraisement method for website

Publications (1)

Publication Number Publication Date
KR20010109744A true KR20010109744A (en) 2001-12-12

Family

ID=45926243

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000030327A KR20010109744A (en) 2000-06-02 2000-06-02 Ranking appraisement method for website

Country Status (1)

Country Link
KR (1) KR20010109744A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040067587A (en) * 2003-01-24 2004-07-30 디엠엔 정보기술 주식회사 System and method for estimating web site

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040067587A (en) * 2003-01-24 2004-07-30 디엠엔 정보기술 주식회사 System and method for estimating web site

Similar Documents

Publication Publication Date Title
JP5606718B2 (en) Digital marketing optimization
US6631360B1 (en) Computer-implementable Internet prediction method
US8463919B2 (en) Process for associating data requests with site visits
US6882977B1 (en) Method and facility for displaying customer activity and value
US6934748B1 (en) Automated on-line experimentation to measure users behavior to treatment for a set of content elements
US7979544B2 (en) Computer program product and method for estimating internet traffic
US9578135B2 (en) Method of identifying remote users of websites
US20120296697A1 (en) Systems and methods for automated real time e-commerce marketing activities
US20020169875A1 (en) Web site, information communication terminal, robot search engine response system, robot search engine registration method, and storage medium and program transmission apparatus therefor
JP2001142907A (en) Internet profiling system
US20130018713A1 (en) System and methods for real time e-commerce promotional activities
US20120316902A1 (en) User interface for real time view of web site activity
Piccardi et al. On the Value of Wikipedia as a Gateway to the Web
KR100366772B1 (en) Method for Implementing Information and Knowledge Providing Service Through Internet
US20120290356A1 (en) Method for operating an online service for evaluating and awarding websites
US20160307223A1 (en) Method for determining a user profile in relation to certain web content
KR20010109744A (en) Ranking appraisement method for website
KR20010104579A (en) estimation method of website for the internet
Ho An exploratory study of using a user remote tracker to examine web users' personality traits
JP2002288216A (en) Sensitivity item search system and method therefor
US10311484B2 (en) Data processing device and data processing method
KR20010110554A (en) System and method for suppling start page in web browser
Arshad et al. Measuring effectiveness of library websites with user traffiffic analytics: A review
KR100373988B1 (en) Analysis method of log file, analysis system and computer-readable medium recording the method
JP2003345940A (en) Web analysis program, system, and data output method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application