KR20200134794A - Method for collecting data generated from an information communication terminal - Google Patents
Method for collecting data generated from an information communication terminal Download PDFInfo
- Publication number
- KR20200134794A KR20200134794A KR1020190060819A KR20190060819A KR20200134794A KR 20200134794 A KR20200134794 A KR 20200134794A KR 1020190060819 A KR1020190060819 A KR 1020190060819A KR 20190060819 A KR20190060819 A KR 20190060819A KR 20200134794 A KR20200134794 A KR 20200134794A
- Authority
- KR
- South Korea
- Prior art keywords
- data collection
- data
- processor
- keyword
- policy
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
본 발명은 정보 통신 단말기에서 발생하는 데이터를 수집하는 방법에 관한 것이다. The present invention relates to a method of collecting data generated in an information communication terminal.
인터넷을 통한 상거래의 규모가 커지면서, 개인의 취향을 파악하는 수단으로 인터넷 쇼핑몰 사이트에서 결제한 품목에 대한 정보의 중요성이 부각되었다. 결제 품목에 대한 정보의 정확성이 높을 수록, 수요자 맞춤형 광고가 실제 매출로 연계될 가능성이 높기 때문이다. 그러나 이러한 결제 품목에 대한 정보는 해당 쇼핑몰 사이트 운영사만 접근이 가능하여 제3자의 접근이 어려운 것이 사실이다. 또한, 특정인이 하나의 쇼핑몰 사이트에서 하나의 결제 수단만을 사용하여 물품을 구매하는 것이 보장되어 있지 않으므로, 해당 정보 역시 개인의 취향을 정확하게 파악하기 충분하지 않다.As the scale of commerce through the Internet has increased, the importance of information on items paid on an Internet shopping mall site has emerged as a means of grasping individual tastes. This is because the higher the accuracy of information on payment items, the more likely it is that consumer-tailored advertisements will be linked to actual sales. However, it is true that information on such payment items can only be accessed by the shopping mall site operator, making it difficult for a third party to access. In addition, since it is not guaranteed that a specific person purchases an item using only one payment method on one shopping mall site, the corresponding information is also not sufficient to accurately grasp an individual's taste.
본 명세서는 정보 통신 단말기에서 발생하는 데이터를 보다 효율적으로 수집할 수 있는 방법을 제공하는 것을 목적으로 한다.An object of the present specification is to provide a method for more efficiently collecting data generated in an information communication terminal.
본 명세서는 상기 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The present specification is not limited to the above-mentioned tasks, and other tasks that are not mentioned will be clearly understood by those skilled in the art from the following description.
상술한 과제를 해결하기 위한 본 명세서에 따른 데이터 수집 방법은, 프로세서에 의해 구동되는 정보 통신 단말기에서 발생하는 데이터를 수집하는 방법으로서, (a) 상기 프로세서가 데이터 수집 정책을 메모리에 저장하는 단계; (b) 상기 프로세서가 사용중인 화면에 표시된 콘텐츠가 상기 데이터 수집 정책에 따른 데이터 수집 대상에 해당하는지 모니터링하는 단계; (c) 상기 프로세서가 사용중인 화면에 표시된 콘텐츠가 상기 데이터 수집 정책에 따른 데이터 수집 대상에 해당할 때, 상기 데이터 수집 정책에 따라 화면에 표시된 콘텐츠에 포함된 데이터를 수집하고, 상기 메모리에 저장하는 단계; 및 (d) 상기 프로세서가 상기 수집 데이터를 가공하는 단계;를 포함할 수 있다. A data collection method according to the present specification for solving the above-described problem is a method of collecting data generated in an information communication terminal driven by a processor, the method comprising: (a) storing, by the processor, a data collection policy in a memory; (b) monitoring whether the content displayed on the screen being used by the processor corresponds to a data collection target according to the data collection policy; (c) When the content displayed on the screen being used by the processor corresponds to the data collection target according to the data collection policy, collecting data included in the content displayed on the screen according to the data collection policy and storing it in the memory step; And (d) processing the collected data by the processor.
본 명세서의 일 실시예에 따르면, 상기 (a) 단계는, 상기 프로세서가 대상 URL, 데이터 수집 시작 키워드 및 데이터 수집 종료 키워드를 포함할 수 있다.According to an embodiment of the present specification, in step (a), the processor may include a target URL, a data collection start keyword, and a data collection end keyword.
본 명세서의 일 실시예에 따르면, 상기 (c) 단계는, 상기 프로세서가 데이터 수집 시작 키워드 및 데이터 수집 종료 키워드 사이에 포함된 모든 텍스트 데이터를 수집하는 단계일 수 있다.According to an embodiment of the present specification, step (c) may be a step of collecting, by the processor, all text data included between the data collection start keyword and the data collection end keyword.
본 명세서의 일 실시예에 따르면, 상기 (a) 단계는, 상기 프로세서가 데이터 수집 기준 키워드를 더 포함하는 데이터 수집 정책을 설정하는 단계일 수 있다.According to an embodiment of the present specification, step (a) may be a step of setting, by the processor, a data collection policy further including a data collection reference keyword.
본 명세서의 일 실시예에 따르면, 상기 (c) 단계는, 상기 프로세서가 데이터 수집 시작 키워드 및 데이터 수집 종료 키워드 사이에 포함된 모든 텍스트 중 상기 데이터 수집 기준 키워드에 해당하는 텍스트 데이터를 수집하는 단계일 수 있다.According to an embodiment of the present specification, step (c) is a step of collecting, by the processor, text data corresponding to the data collection reference keyword among all texts included between the data collection start keyword and the data collection end keyword. I can.
본 명세서의 일 실시예에 따르면, 상기 (a) 단계는, 상기 프로세서가 데이터 추가 수집 기준을 더 포함하는 데이터 수집 정책을 정하는 단계일 수 있다.According to an embodiment of the present specification, step (a) may be a step of determining, by the processor, a data collection policy further including a data additional collection criterion.
본 명세서의 일 실시예에 따르면, 상기 (d) 단계는, 상기 프로세서가 미리 설정된 가공 키워드에 해당하는 데이터를 추출하는 방식으로 데이터를 가공하는 단계일 수 있다.According to an embodiment of the present specification, step (d) may be a step of processing data in a manner in which the processor extracts data corresponding to a preset processing keyword.
본 명세서의 일 실시예에 따르면, (e) 상기 프로세서가 상기 추출된 복수의 데이터 상호간에서 중복 항목을 식별하고, 하나의 기준 데이터를 제외한 나머지 데이터에서 상기 중복 항목을 삭제하는 추가 가공을 하는 단계;를 더 포함할 수 있다.According to an embodiment of the present specification, (e) performing, by the processor, an additional process of identifying a duplicate item among the extracted plurality of data and deleting the duplicate item from data other than one reference data; It may further include.
본 명세서의 일 실시예에 따르면, (f) 상기 프로세서가 상기 추가 가공된 데이터가 미리 설정된 용량 또는 미리 설정된 주기 중 어느 하나에 먼저 도달할 때 상기 추가 가공된 데이터를 데이터 수집 서버에 전송하는 단계;를 더 포함할 수 있다.According to an embodiment of the present specification, (f) transmitting, by the processor, the additionally processed data to a data collection server when the additionally processed data first reaches either a preset capacity or a preset period; It may further include.
본 명세서에 따른 데이터 수집 방법은 컴퓨터에서 각 단계들을 수행하도록 작성되어 컴퓨터로 독출 가능한 기록 매체에 기록된 컴퓨터프로그램의 형태로 구현될 수 있다.The data collection method according to the present specification may be implemented in the form of a computer program written in a computer to perform each step and recorded in a computer-readable recording medium.
본 발명의 기타 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.Other specific details of the present invention are included in the detailed description and drawings.
본 명세서에 따르면, 정보 통신 단말기에서 발생하는 데이터를 보다 효율적으로 수집할 수 있다.According to the present specification, it is possible to more efficiently collect data generated in an information communication terminal.
본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The effects of the present invention are not limited to the effects mentioned above, and other effects not mentioned will be clearly understood by those skilled in the art from the following description.
도 1은 본 명세서에 따른 데이터 수집 방법의 흐름도이다.
도 2는 본 명세서의 일 실시예에 따른 데이터 수집 예시도이다.
도 3은 본 명세서의 다른 실시예에 따른 데이터 수집 예시도이다.
도 4는 수집 데이터의 가공 예시도이다.
도 5는 스마트 폰에서의 결제 화면 예시도이다.
도 6은 프로세서가 접근 권한을 허용 받는 예시도이다.1 is a flowchart of a data collection method according to the present specification.
2 is an exemplary diagram of data collection according to an embodiment of the present specification.
3 is an exemplary diagram of data collection according to another exemplary embodiment of the present specification.
4 is an exemplary diagram of processing of collected data.
5 is an exemplary view of a payment screen in a smart phone.
6 is an exemplary diagram in which a processor is granted access rights.
본 명세서에 개시된 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 명세서가 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 명세서의 개시가 완전하도록 하고, 본 명세서가 속하는 기술 분야의 통상의 기술자(이하 '당업자')에게 본 명세서의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 명세서의 권리 범위는 청구항의 범주에 의해 정의될 뿐이다. Advantages and features of the invention disclosed in the present specification, and a method of achieving them will become apparent with reference to the embodiments described later in detail together with the accompanying drawings. However, the present specification is not limited to the embodiments disclosed below, but may be implemented in a variety of different forms, and only the present embodiments are intended to complete the disclosure of the present specification, and are common in the technical field to which the present specification belongs. It is provided to completely inform the scope of the present specification to a technician (hereinafter, "the person in charge"), and the scope of the rights of the present specification is only defined by the scope of the claims.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 명세서의 권리 범위를 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.The terms used in this specification are for describing exemplary embodiments and are not intended to limit the scope of the present specification. In this specification, the singular form also includes the plural form unless specifically stated in the phrase. As used in the specification, “comprises” and/or “comprising” do not exclude the presence or addition of one or more other elements other than the mentioned elements. Throughout the specification, the same reference numerals refer to the same elements, and “and/or” includes each and all combinations of one or more of the mentioned elements. Although "first", "second", and the like are used to describe various elements, it goes without saying that these elements are not limited by these terms. These terms are only used to distinguish one component from another component. Therefore, it goes without saying that the first component mentioned below may be the second component within the technical idea of the present invention.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 명세서가 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다. 이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다.Unless otherwise defined, all terms (including technical and scientific terms) used in the present specification may be used with meanings that can be commonly understood by those of ordinary skill in the art to which this specification belongs. In addition, terms defined in a commonly used dictionary are not interpreted ideally or excessively unless explicitly defined specifically. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
본 명세서는 프로세서(processor)에 의해 구동되는 정보 통신 단말기에서 발생하는 데이터를 수집하는 방법을 개시한다. 본 명세서에서 프로세서란, 이하에서 설명될 제어 로직을 실행하기 위해 본 발명이 속한 기술분야에 알려진 프로세서(processor), ASIC(application-specific integrated circuit), 다른 칩셋, 논리 회로, 레지스터, 통신 모뎀, 데이터 처리 장치 등을 포함하는 용어이다. 또한, 이하에서 설명될 제어 로직이 소프트웨어로 구현될 때, 각 단계는 프로그램 모듈의 집합으로 구현될 수 있다. 이 때, 프로그램 모듈은 상기 메모리부에 저장되고, 프로세서에 의해 실행될 수 있다.The present specification discloses a method of collecting data generated in an information communication terminal driven by a processor. In the present specification, a processor is a processor known in the art to execute control logic to be described below, an application-specific integrated circuit (ASIC), another chipset, a logic circuit, a register, a communication modem, and data. It is a term including a processing device and the like. In addition, when the control logic to be described below is implemented in software, each step may be implemented as a set of program modules. In this case, the program module may be stored in the memory unit and executed by a processor.
본 명세서에서 정보 통신 단말기란, 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등이 포함될 수 있다. In the present specification, an information communication terminal refers to a mobile phone, a smart phone, a laptop computer, a digital broadcasting terminal, a personal digital assistants (PDA), a portable multimedia player (PMP), a navigation system, and a slate PC. , Tablet PC (tablet PC), ultrabook (ultrabook), wearable device (wearable device, for example, smartwatch, glass-type terminal (smart glass), HMD (head mounted display)), etc. may be included. have.
이하 본 명세서에서 상세하게 설명될 데이터 수집 방법은 컴퓨터프로그램의 형태로 구현될 수 있다. 상기 컴퓨터프로그램은, 상기 정보 통신 단말기가 프로그램을 읽어 들여 프로그램으로 구현된 방법들을 실행시키기 위하여, 상기 프로세서(CPU)가 상기 컴퓨터의 장치 인터페이스를 통해 읽힐 수 있는 C/C++, C#, JAVA, Python, 기계어 등의 컴퓨터 언어로 코드화된 코드(Code)를 포함할 수 있다. 이러한 코드는 이하 방법들을 실행하는 필요한 기능들을 정의한 함수 등과 관련된 기능적인 코드(Functional Code)를 포함할 수 있고, 상기 기능들을 상기 프로세서가 소정의 절차대로 실행시키는데 필요한 실행 절차 관련 제어 코드를 포함할 수 있다. 또한, 이러한 코드는 상기 기능들을 상기 프로세서가 실행시키는데 필요한 추가 정보나 미디어가 상기 정보 통신 단말기의 내부 또는 외부 메모리의 어느 위치(주소 번지)에서 참조되어야 하는지에 대한 메모리 참조관련 코드를 더 포함할 수 있다. 또한, 상기 프로세서가 상기 기능들을 실행시키기 위하여 원격(Remote)에 있는 어떠한 다른 컴퓨터나 서버 등과 통신이 필요한 경우, 코드는 상기 정보 통신 단말기의 통신 모듈을 이용하여 원격에 있는 어떠한 다른 컴퓨터나 서버 등과 어떻게 통신해야 하는지, 통신 시 어떠한 정보나 미디어를 송수신해야 하는지 등에 대한 통신 관련 코드를 더 포함할 수 있다.The data collection method to be described in detail in the present specification may be implemented in the form of a computer program. The computer program includes C/C++, C#, JAVA, Python, which can be read by the processor (CPU) through a device interface of the computer, so that the information communication terminal reads the program and executes methods implemented as a program. It may include a code (Code) coded in a computer language such as machine language. This code may include a functional code related to a function defining necessary functions for executing the following methods, and a control code related to an execution procedure necessary for the processor to execute the functions according to a predetermined procedure. have. In addition, this code may further include a memory reference code for indicating at which location (address address) of the internal or external memory of the information communication terminal the additional information or media necessary for the processor to execute the functions. have. In addition, when the processor needs to communicate with any other computer or server in a remote location in order to execute the functions, the code uses the communication module of the information communication terminal to determine how It may further include a communication-related code for whether to communicate, what kind of information or media should be transmitted and received during communication.
상기 메모리는, 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상기 저장되는 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있지만, 이에 제한되지 않는다. 즉, 상기 프로그램은 상기 정보 통신 단말기가 접속할 수 있는 다양한 서버 상의 다양한 기록매체 또는 사용자의 상기 정보 통신 단말기상의 다양한 기록매체에 저장될 수 있다. 또한, 상기 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장될 수 있다.The memory is not a medium that stores data for a short moment, such as a register, cache, memory, etc., but a medium that stores data semi-permanently and can be read by a device. Specifically, examples of the storage medium include, but are not limited to, ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, and the like. That is, the program may be stored in various recording media on various servers to which the information communication terminal can access or on various recording media on the information communication terminal of the user. In addition, the medium may be distributed over a computer system connected through a network, and a code readable by a processor may be stored in a distributed manner.
도 1은 본 명세서에 따른 데이터 수집 방법의 흐름도이다.1 is a flowchart of a data collection method according to the present specification.
도 1을 참조하면, 먼저 단계 (a)에서, 상기 프로세서가 데이터 수집 정책을 메모리에 저장할 수 있다. 상기 데이터 수집 정책이란, 데이터를 수집하는 조건에 대한 설정을 의미한다.Referring to FIG. 1, first, in step (a), the processor may store a data collection policy in a memory. The data collection policy means setting conditions for collecting data.
본 명세서의 일 실시예에 따르면, 상기 (a) 단계는, 상기 프로세서가 대상 URL, 데이터 수집 시작 키워드 및 데이터 수집 종료 키워드를 포함하는 데이터 수집 정책을 설정할 수 있다. 상기 대상 URL은 쇼핑몰 사이트 내 결제 관련 URL 주소일 수 있다.According to an embodiment of the present specification, in step (a), the processor may set a data collection policy including a target URL, a data collection start keyword, and a data collection end keyword. The target URL may be a payment related URL address in the shopping mall site.
다음 단계 (b)에서, 상기 프로세서가 사용중인 화면에 표시된 콘텐츠가 상기 데이터 수집 정책에 따른 데이터 수집 대상에 해당하는지 모니터링할 수 있다.In the next step (b), it is possible to monitor whether the content displayed on the screen being used by the processor corresponds to a data collection target according to the data collection policy.
본 명세서의 일 실시예에 따르면, 상기 (b) 단계는, 상기 프로세서가 상기 데이터 수집 정책에 포함된 대상 URL에서 3번째 또는 4번째 구분자("/")까지의 동일한지 여부를 모니터링하는 단계일 수 있다. 예를 들어, 특정 쇼핑몰의 결제 페이지 URL이 "http://buy.11st.co.kr/cart/CartAction.tmall?method=get-CartList"라고 가정하겠다. 이 경우, 3번째 구분자인 "http://buy.11st.co.kr/" 또는 4번째 식별자인 "http://buy.11st.co.kr/pay/"까지 동일 여부를 모니터링하고, 이후 URL의 동일 여부는 판단하지 않을 수 있다.According to an embodiment of the present specification, the step (b) is a step of monitoring whether the processor is the same from the target URL included in the data collection policy to the third or fourth separator ("/"). I can. For example, assume that the URL of the payment page of a specific shopping mall is "http://buy.11st.co.kr/cart/CartAction.tmall?method=get-CartList". In this case, the 3rd identifier "http://buy.11st.co.kr/" or the 4th identifier "http://buy.11st.co.kr/pay/" is monitored for the same status, and thereafter, Whether the URLs are the same may not be determined.
단계 (b)에서 사용중인 화면에 표시된 콘텐츠가 상기 데이터 수집 정책에 따른 데이터 수집 대상에 해당하지 않으면, 상기 프로세서는 단계 (b)를 반복 수행한다. 반면, 사용중인 화면에 표시된 콘텐츠가 상기 데이터 수집 정책에 따른 데이터 수집 대상에 해당할 때, 상기 프로세서는 단계 (c) 이행한다. If the content displayed on the screen being used in step (b) does not correspond to the data collection target according to the data collection policy, the processor repeats step (b). On the other hand, when the content displayed on the screen being used corresponds to the data collection target according to the data collection policy, the processor performs step (c).
다음 단계 (c) 상기 프로세서가 사용중인 화면에 표시된 콘텐츠가 상기 데이터 수집 정책에 따른 데이터 수집 대상에 해당할 때, 상기 데이터 수집 정책에 따라 화면에 표시된 콘텐츠에 포함된 데이터를 수집하고, 상기 메모리에 저장할 수 있다.Next step (c) When the content displayed on the screen being used by the processor corresponds to the data collection target according to the data collection policy, the data included in the content displayed on the screen is collected according to the data collection policy, and stored in the memory. Can be saved.
본 명세서의 일 실시예에 따르면, 상기 (c) 단계는, 상기 프로세서가 데이터 수집 시작 키워드 및 데이터 수집 종료 키워드 사이에 포함된 모든 텍스트 데이터를 수집하는 단계일 수 있다.According to an embodiment of the present specification, step (c) may be a step of collecting, by the processor, all text data included between the data collection start keyword and the data collection end keyword.
도 2는 본 명세서의 일 실시예에 따른 데이터 수집 예시도이다.2 is an exemplary diagram of data collection according to an embodiment of the present specification.
도 2를 참조하면, 쇼핑몰의 결제 화면이 예시로 표시된 것을 확인할 수 있다. 도 2의 참조번호 "1"은 데이터 수집 정책에 포함된 대상 URL이다. 도 2의 참조번호 "2"는 데이터 수집 시작 키워드이다. 상기 데이터 수집 시작 키워드로서 "장바구니"라는 단어가 설정된 예시이다. 도 2의 참조번호 "4"는 데이터 수집 종료 키워드이다. 상기 데이터 수집 종료 키워드로서 "선택상품주문" 또는 "전체주문"이라는 단어가 설정된 예시이다. 따라서, 도 2의 참조번호 "2"와 "4" 사이에 위치하는 참조번호 "3"이 데이터 수집 대상이 된다.Referring to FIG. 2, it can be seen that a payment screen of a shopping mall is displayed as an example. Reference number "1" in FIG. 2 is a target URL included in the data collection policy. Reference number "2" in FIG. 2 is a data collection start keyword. This is an example in which the word "cart" is set as the data collection start keyword. Reference numeral "4" in FIG. 2 is a data collection end keyword. This is an example in which the word "selected product order" or "all order" is set as the data collection end keyword. Therefore, the reference number "3" located between the reference numbers "2" and "4" in FIG. 2 is a data collection object.
텍스트 데이터를 수집하는 과정에서, 특정 쇼핑몰의 경우 결제 페이지 내에 상대적으로 덜 중요한 데이터가 상기 데이터 수집 시작 키워드와 데이터 수집 종료 키워드 사이에 다수 포함될 수 있다. 이 경우, 불필요한 데이터를 수집하느라 프로세서의 자원을 사용하거나 이를 저장하기 위해 메모리를 할당하는 비효율성을 개선하기 위해 수집이 필요한 대상을 특정할 수 있다. 이를 위해 상기 (a) 단계는, 상기 프로세서가 데이터 수집 기준 키워드를 더 포함하는 데이터 수집 정책을 설정하는 단계일 수 있다. 그리고 상기 (c) 단계는, 상기 프로세서가 데이터 수집 시작 키워드 및 데이터 수집 종료 키워드 사이에 포함된 모든 텍스트 중 상기 데이터 수집 기준 키워드에 해당하는 텍스트 데이터를 수집하는 단계일 수 있다.In the process of collecting text data, in the case of a specific shopping mall, relatively less important data may be included between the data collection start keyword and the data collection end keyword in the payment page. In this case, in order to improve the inefficiency of using the resources of the processor to collect unnecessary data or allocating memory to store it, it is possible to specify an object that needs to be collected. To this end, step (a) may be a step of setting, by the processor, a data collection policy further including a data collection reference keyword. In addition, step (c) may be a step of the processor collecting text data corresponding to the data collection reference keyword among all texts included between the data collection start keyword and the data collection end keyword.
도 3은 본 명세서의 다른 실시예에 따른 데이터 수집 예시도이다.3 is an exemplary diagram of data collection according to another exemplary embodiment of the present specification.
도 3에 도시된 예시에서는, 참조번호 "1"은 데이터 수집 정책에 포함된 대상 URL, 참조번호 "2"는 데이터 수집 시작 키워드, 참조번호 "9"는 데이터 수집 종료 키워드이다. 따라서, 참조번호 3 내지 8은 데이터 수집 대상에 해당한다. 그러나 본 예시에서는 데이터 수집 기준 키워드로서, "결제 수단"이 설정된 것으로 가정하겠다. 따라서, 도 3에 도시된 예시에서 참조번호 3 내지 5는 수집되지 않고, 참조번호 6 내지 7이 수집될 수 있다.In the example shown in FIG. 3, reference number "1" is a target URL included in the data collection policy, reference number "2" is a data collection start keyword, and reference number "9" is a data collection end keyword. Therefore,
한편, 특정 쇼핑몰의 경우 결제 페이지 내에 상대적으로 더 중요한 데이터가 상기 데이터 수집 시작 키워드와 데이터 수집 종료 키워드 사이에 포함되지 않을 수 있다. 이 때, 상기 데이터 수집 시작 키워드와 데이터 수집 종료 키워드 사이에 포함되지 않은 데이터라도 수집할 수 있는 기준이 필요하다. 이를 위해, 상기 (a) 단계는, 상기 프로세서가 데이터 추가 수집 기준을 더 포함하는 데이터 수집 정책을 설정하는 단계일 수 있다.Meanwhile, in the case of a specific shopping mall, relatively more important data in the payment page may not be included between the data collection start keyword and the data collection end keyword. In this case, a criterion for collecting data that is not included between the data collection start keyword and the data collection end keyword is required. To this end, step (a) may be a step of setting, by the processor, a data collection policy further including a data additional collection criterion.
다시 도 2의 참조번호 5 및 도 3의 참조번호 10을 살펴보면, "선택상품주문"인지 "전체주문"인지 선택할 수 있는 인터페이스가 표시되어 있다. 수집된 데이터가 모두 실제 구매된 상품인지 아니면, 일부만 구매된 상품인지 판별하기 위한 데이터로서 사용자가 어느 인터페이스를 클릭하였는지 확인할 필요가 있다. 따라서, 상기 프로세서는 데이터 추가 수집 기준으로서 상기 "선택상품주문" 또는 "전체주문"의 클릭 여부에 대한 데이터를 수집할 수 있다.Referring back to
이후 단계 (d)에서, 상기 프로세서가 상기 수집 데이터를 가공할 수 있다.In a subsequent step (d), the processor may process the collected data.
상기 수집 데이터의 가공이란, 불필요한 정보를 제외시키고 필요한 정보만 정리하기 위한 과정을 의미한다. 본 명세서의 일 실시예에 따르면, 상기 (d) 단계는, 상기 프로세서가 미리 설정된 가공 키워드에 해당하는 데이터를 추출하는 방식으로 데이터를 가공하는 단계일 수 있다. 상기 미리 설정된 가공 키워드에 해당하지 않는 데이터는 메모리에서 삭제될 수 있다.The processing of the collected data refers to a process of excluding unnecessary information and arranging only necessary information. According to an embodiment of the present specification, step (d) may be a step of processing data in a manner in which the processor extracts data corresponding to a preset processing keyword. Data that does not correspond to the preset processing keyword may be deleted from the memory.
도 4는 수집 데이터의 가공 예시도이다.4 is an exemplary diagram of processing of collected data.
도 4를 참조하면, 텍스트 데이터 중 상대적으로 중요한 데이터는 붉은색으로 표시되고, 상대적으로 덜 중요한 데이터는 검정색으로 표시된 것으로 도시되었다. 상기 붉은색을 표시된 데이터는 데이터 수집 기준 키워드에 해당하는 텍스트 데이터이다. 따라서, 상기 프로세서는 붉은색을 표시된 데이터만 수집하여 데이터의 총 양을 줄일 수 있다.Referring to FIG. 4, relatively important data among text data are shown in red, and relatively less important data are shown in black. The red data is text data corresponding to a data collection reference keyword. Accordingly, the processor can reduce the total amount of data by collecting only the data displayed in red.
본 명세서에 따른 데이터 수집 방법은 단계 (e)를 더 포함할 수 있다. 상기 단계 (e)는, 상기 프로세서가 상기 추출된 복수의 데이터 상호간에서 중복 항목을 식별하고, 하나의 기준 데이터를 제외한 나머지 데이터에서 상기 중복 항목을 삭제하는 추가 가공을 하는 단계일 수 있다.The data collection method according to the present specification may further include step (e). The step (e) may be a step of performing, by the processor, an additional processing of identifying a duplicate item among the extracted plurality of data and deleting the duplicate item from the remaining data except for one reference data.
본 명세서에 따른 정보 통신 단말기가 이동 통신 단말기 예를 들어, 스마트 폰인 경우 해당 이동 통신 단말기를 사용하여 쇼핑몰에서 결제하는 사용자는 이동 통신 단말기의 소유자 1인일 가능성이 크다. 따라서, 매 결제마다 구매자의 이름, 연락처, 배송지 주소 등은 데이터를 수집하는 과정에서 반복적으로 중복될 수 있다. 이러한 사용자의 개인 정보는 1회만 수집되면 충분하고, 이후에는 중복하여 수집할 필요성이 낮을 수 있다. 따라서, 상기 (e) 단계에서 상기 프로세서가 미리 저장된 사용자의 기본 정보를 상기 수집된 데이터에서 제외시키고 나머지 데이터를 가공하는 단계일 수 있다.When the information communication terminal according to the present specification is a mobile communication terminal, for example, a smart phone, a user who pays at a shopping mall using the mobile communication terminal is likely to be one owner of the mobile communication terminal. Therefore, for each payment, the buyer's name, contact information, delivery address, etc. may be repeatedly duplicated in the process of collecting data. It is sufficient to collect such user's personal information only once, and there may be a low need for duplicate collection thereafter. Accordingly, in step (e), the processor may be a step of excluding basic information of the user previously stored from the collected data and processing the remaining data.
도 5는 스마트 폰에서의 결제 화면 예시도이다.5 is an exemplary view of a payment screen in a smart phone.
도 5를 참조하면, 스마트 폰에서 상품을 결제하는 순차적인 화면을 확인할 수 있다. 이때, 3번째 화면을 살펴보면, 배송지에 대한 데이터가 포함된 것을 확인할 수 있다. 이 경우, 앞서 수집된 데이터에 이미 구매자의 배송지 정보가 포함되어 있을 가능성이 높다. 따라서, 상기 프로세서는 배송지에 대한 정보를 제외하고 나머지 데이터를 가공할 수 있다.Referring to FIG. 5, a sequential screen for paying a product on a smart phone can be checked. At this time, looking at the third screen, it can be seen that data on the delivery destination is included. In this case, there is a high possibility that the previously collected data already includes information on the delivery address of the buyer. Accordingly, the processor can process the remaining data excluding information on the delivery destination.
한편, 본 명세서에 따른 정보 통신 단말기가 이동 통신 단말기인 경우, 도 5에 도시된 예시와 같이 데이터 수집 시작 키워드와 데이터 수집 종료 키워드가 하나의 화면에 동시에 표시되지 않을 수 있다. 따라서, 정보 통신 단말기가 이동 통신 단말기일 때, 상기 (c) 단계는 상기 프로세서가 데이터 수집 시작 키워드가 포함된 화면에서부터 데이터 수집 종료 키워드가 포함된 화면 사이에 포함된 모든 텍스트 데이터를 수집하는 단계일 수 있다.Meanwhile, when the information communication terminal according to the present specification is a mobile communication terminal, the data collection start keyword and the data collection end keyword may not be simultaneously displayed on one screen, as shown in the example illustrated in FIG. 5. Therefore, when the information communication terminal is a mobile communication terminal, step (c) is a step of the processor collecting all text data included between the screen including the data collection start keyword and the screen including the data collection end keyword. I can.
그리고 본 명세서에 따른 데이터 수집 방법은 단계 (f)를 더 포함할 수 있다. 상기 단계 (f)에서, 상기 프로세서가 상기 추가 가공된 데이터가 미리 설정된 용량 또는 미리 설정된 주기 중 어느 하나에 먼저 도달할 때 상기 추가 가공된 데이터를 데이터 수집 서버에 전송할 수 있다. 상기 데이터 수집 서버는 복수의 정보 통신 단말기로부터 수신된 상품 결제 정보를 다양한 방식으로 활용할 수 있다.And the data collection method according to the present specification may further include step (f). In the step (f), the processor may transmit the additionally processed data to a data collection server when the additionally processed data first reaches either a preset capacity or a preset period. The data collection server may utilize product payment information received from a plurality of information communication terminals in various ways.
한편, 상기 프로세서는 사용중인 화면에 표시된 콘텐츠의 메모리영역 접근 권한을 운영체제를 통해 사용자로부터 허용 받을 수 있다.Meanwhile, the processor may receive permission to access the memory area of the content displayed on the screen being used from the user through the operating system.
도 6은 프로세서가 접근 권한을 허용 받는 예시도이다.6 is an exemplary diagram in which a processor is granted access rights.
도 6을 참조하면, 운영체제의 일 예시로 안드로이드 OS의 설정 화면이 도시되어 있다. 도시된 예시에 따라 "설정 → 접근성 → 설치된 서비스 → SaleTrustGateway(어플레케이션의 가칭) → 사용 버튼 활성화 → 권한 요청에 대한 ‘확인’ → 사용 중 문구 확인" 순서로 사용자가 입력하면, 상기 프로세서는 화면에 표시된 콘텐츠의 메모리영역에 접근이 가능하다.Referring to FIG. 6, an Android OS setting screen is shown as an example of an operating system. According to the illustrated example, if the user inputs in the order of "Settings → Accessibility → Installed Services → SaleTrustGateway (tentative name of the application) → Activation of the use button →'Confirmation' for the permission request → Confirmation of the text during use", the processor screen You can access the memory area of the content displayed in.
이상, 첨부된 도면을 참조로 하여 본 명세서의 실시예를 설명하였지만, 본 명세서가 속하는 기술분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다. As described above, embodiments of the present specification have been described with reference to the accompanying drawings, but those of ordinary skill in the art to which the present specification pertains to that the present invention can be implemented in other specific forms without changing the technical spirit or essential features. You can understand. Therefore, the embodiments described above are illustrative in all respects, and should be understood as non-limiting.
Claims (10)
(a) 상기 프로세서가 데이터 수집 정책을 메모리에 저장하는 단계;
(b) 상기 프로세서가 사용중인 화면에 표시된 콘텐츠가 상기 데이터 수집 정책에 따른 데이터 수집 대상에 해당하는지 모니터링하는 단계;
(c) 상기 프로세서가 사용중인 화면에 표시된 콘텐츠가 상기 데이터 수집 정책에 따른 데이터 수집 대상에 해당할 때, 상기 데이터 수집 정책에 따라 화면에 표시된 콘텐츠에 포함된 데이터를 수집하고, 상기 메모리에 저장하는 단계; 및
(d) 상기 프로세서가 상기 수집 데이터를 가공하는 단계;를 포함하는 데이터 수집 방법.A method of collecting data generated in an information communication terminal driven by a processor,
(a) storing, by the processor, a data collection policy in a memory;
(b) monitoring whether the content displayed on the screen being used by the processor corresponds to a data collection target according to the data collection policy;
(c) When the content displayed on the screen being used by the processor corresponds to the data collection target according to the data collection policy, collecting data included in the content displayed on the screen according to the data collection policy and storing it in the memory step; And
(d) processing the collected data by the processor.
상기 (a) 단계는, 상기 프로세서가 대상 URL, 데이터 수집 시작 키워드 및 데이터 수집 종료 키워드를 포함하는 데이터 수집 정책을 설정하는 단계인 데이터 수집 방법.The method according to claim 1,
In the step (a), the processor sets a data collection policy including a target URL, a data collection start keyword, and a data collection end keyword.
상기 (c) 단계는, 상기 프로세서가 데이터 수집 시작 키워드 및 데이터 수집 종료 키워드 사이에 포함된 모든 텍스트 데이터를 수집하는 단계인 데이터 수집 방법.The method according to claim 2,
The step (c) is a step of collecting, by the processor, all text data included between the data collection start keyword and the data collection end keyword.
상기 (a) 단계는, 상기 프로세서가 데이터 수집 기준 키워드를 더 포함하는 데이터 수집 정책을 설정하는 단계인 데이터 수집 방법.The method of claim 3,
The step (a) is a data collection method in which the processor sets a data collection policy further including a data collection reference keyword.
상기 (c) 단계는, 상기 프로세서가 데이터 수집 시작 키워드 및 데이터 수집 종료 키워드 사이에 포함된 모든 텍스트 중 상기 데이터 수집 기준 키워드에 해당하는 텍스트 데이터를 수집하는 단계인 데이터 수집 방법.The method of claim 4,
The step (c) is a step of collecting, by the processor, text data corresponding to the data collection reference keyword among all texts included between the data collection start keyword and the data collection end keyword.
상기 (a) 단계는, 상기 프로세서가 데이터 추가 수집 기준을 더 포함하는 데이터 수집 정책을 정하는 단계인 데이터 수집 방법.The method of claim 5,
The step (a) is a data collection method wherein the processor determines a data collection policy further including a data additional collection criterion.
상기 (d) 단계는, 상기 프로세서가 미리 설정된 가공 키워드에 해당하는 데이터를 추출하는 방식으로 데이터를 가공하는 단계인 데이터 수집 방법.The method according to claim 1,
The step (d) is a data collection method in which the processor processes data by extracting data corresponding to a preset processing keyword.
(e) 상기 프로세서가 상기 추출된 복수의 데이터 상호간에서 중복 항목을 식별하고, 하나의 기준 데이터를 제외한 나머지 데이터에서 상기 중복 항목을 삭제하는 추가 가공을 하는 단계;를 더 포함하는 데이터 수집 방법.The method of claim 7,
(e) performing, by the processor, additional processing of identifying duplicate items among the extracted plurality of data and deleting the duplicate items from data other than one reference data.
(f) 상기 프로세서가 상기 추가 가공된 데이터가 미리 설정된 용량 또는 미리 설정된 주기 중 어느 하나에 먼저 도달할 때 상기 추가 가공된 데이터를 데이터 수집 서버에 전송하는 단계;를 더 포함하는 데이터 수집 방법.The method of claim 8,
(f) transmitting, by the processor, the additionally processed data to a data collection server when the additionally processed data first reaches one of a preset capacity or a preset period.
A computer program written in a computer to perform each step of the data collection method according to any one of claims 1 to 9 and recorded in a computer-readable recording medium.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190060819A KR20200134794A (en) | 2019-05-23 | 2019-05-23 | Method for collecting data generated from an information communication terminal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190060819A KR20200134794A (en) | 2019-05-23 | 2019-05-23 | Method for collecting data generated from an information communication terminal |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200134794A true KR20200134794A (en) | 2020-12-02 |
Family
ID=73791944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190060819A KR20200134794A (en) | 2019-05-23 | 2019-05-23 | Method for collecting data generated from an information communication terminal |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20200134794A (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100123502A (en) | 2009-05-15 | 2010-11-24 | 주식회사 케이티 | Point of service information based advertisement system and advertisement method thereof |
-
2019
- 2019-05-23 KR KR1020190060819A patent/KR20200134794A/en unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100123502A (en) | 2009-05-15 | 2010-11-24 | 주식회사 케이티 | Point of service information based advertisement system and advertisement method thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10748152B2 (en) | Providing history-based data processing | |
US10135804B2 (en) | Mobile application based account aggregation | |
US10546348B1 (en) | Cleaning noise words from transaction descriptions | |
CN110245069B (en) | Page version testing method and device and page display method and device | |
JP7414817B2 (en) | Inventory ingestion, image processing, and market descriptor pricing system | |
US20130246213A1 (en) | Using rate-sensitivities to price downloads | |
CN107784504B (en) | Method for generating return visit event of client and terminal equipment | |
US11615439B2 (en) | Method and apparatus for clustering platform sessions and user accounts associated with the platform sessions | |
US11978116B2 (en) | Data display method and apparatus, terminal device, and storage medium | |
CN111311294A (en) | Data processing method, device, medium and electronic equipment | |
WO2014110950A1 (en) | Method and device for pushing information | |
CN111768258A (en) | Method, device, electronic equipment and medium for identifying abnormal order | |
US20190164144A1 (en) | Systems and methods for one-tap buy order completion | |
CN110942392A (en) | Service data processing method, device, equipment and medium | |
US20130246312A1 (en) | Providing information prior to downloading resources | |
US11568479B2 (en) | Generating online auction listings | |
KR20200134794A (en) | Method for collecting data generated from an information communication terminal | |
US20130246413A1 (en) | Providing information prior to downloading resources | |
CN110163482B (en) | Method for determining safety scheme data of activity scheme, terminal equipment and server | |
CN108280139B (en) | POI data processing method, device, equipment and computer readable storage medium | |
CN112053236A (en) | Risk information identification method and device, computing equipment and medium | |
CN112507220A (en) | Information pushing method, device and medium | |
KR20220014486A (en) | Method and device for recommending real estate using machine learning | |
CA3036736C (en) | Data exchange processing method and apparatus | |
KR20200005248A (en) | Method and system for generating automatically personal online shopping mall using social network service |