KR20190072360A - System for Providing Arbeit Data - Google Patents

System for Providing Arbeit Data Download PDF

Info

Publication number
KR20190072360A
KR20190072360A KR1020170173646A KR20170173646A KR20190072360A KR 20190072360 A KR20190072360 A KR 20190072360A KR 1020170173646 A KR1020170173646 A KR 1020170173646A KR 20170173646 A KR20170173646 A KR 20170173646A KR 20190072360 A KR20190072360 A KR 20190072360A
Authority
KR
South Korea
Prior art keywords
data
time
user
analysis
user terminal
Prior art date
Application number
KR1020170173646A
Other languages
Korean (ko)
Inventor
김석준
김예지
장근호
Original Assignee
김석준
장근호
김예지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김석준, 장근호, 김예지 filed Critical 김석준
Priority to KR1020170173646A priority Critical patent/KR20190072360A/en
Publication of KR20190072360A publication Critical patent/KR20190072360A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

The present invention relates to a system for providing part-time job data. According to the present invention, the system comprises a service server, which includes: a data collection unit collecting part-time job data through the search of a web page by input from a user or data crawling; a data analysis unit analyzing the collected part-time job data in accordance with a function model analysis algorithm to generate part-time job statistical data; and a data output unit transmitting the generated part-time job statistical analysis data to a user terminal to be displayed on a screen of the user terminal. According to the present invention, the part-time job data is collected, analyzed, and visualized to be provided so that the user can select a part-time job suitable for him or her.

Description

아르바이트 데이터 제공 시스템{System for Providing Arbeit Data} [0001] System for Providing Arbeit Data [

본 발명은 아르바이트 데이터 제공 시스템에 관한 것으로, 보다 상세하게는 사용자에게 알맞은 아르바이트를 선택할 수 있도록 아르바이트 데이터를 수집, 분석 및 시각화하여 제공할 수 있는 아르바이트 데이터 제공 시스템에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a part-time data providing system, and more particularly, to a part-time data providing system capable of collecting, analyzing and visualizing part-time data so that a user can select a part-

최근 대부분의 대학생들의 경우 부모님의 도움을 받지 않는 이상 아르바이트를 하지 않으면 대학교 생활을 해나가기 어려운 상태이며, 대학교 등록금을 벌기 위하여 대학생들은 시간의 대부분을 아르바이트하는데 보내고 있다.Most college students are not able to live in college without a part-time job without the help of their parents. In order to earn college tuition, college students spend most of their time working part-time.

하지만, 대부분의 대학생들은 어떤 아르바이트가 자신의 성격과 환경에 맞을지 고려하지 않고 단순히 구인업체에서 제공하는 정보 제공 사이트에 접속하여 시급 및 근무지가 적정한 구인업체를 일일이 찾아서 입사 지원하는 형태로 이루어지고 있다.However, most college students do not consider which part-time job is suitable for their personality and environment, but simply go to an information-providing site provided by a job seeker to find job seekers who are appropriate for their time and place.

그리고 아르바이트에 관한 정보를 얻고자 하여도 웹상에서 펴져 있는 정보들은 가공되어 있지 않아 특정한 근무지의 영향을 많이 받기 때문에 객관성이 부족하여 신뢰도가 떨어지는 문제점이 있었다.In order to obtain information on part-time jobs, the information on the web is not processed, so it is affected by specific workplaces, so there is a lack of objectivity and low reliability.

이와 같이, 대학생들은 자신의 성격이나 재능을 고려하여 아르바이트를 선택하기가 쉽지 않으며, 해당 업종에 대한 노하우를 조언해줄 수 없는 사람이 존재하지 않다면 접해보기 어려운 경우가 많았다.In this way, it is not easy for college students to choose a part-time job considering their personality and talents, and it is often difficult to find out if there is no person who can not give advice on their know-how.

이러한 문제점을 해결하기 위하여 아르바이트에 대한 여러 가지 정보를 회귀 분석을 통해 다양한 속성에 따라 시급이 어떻게 오르거나 줄어드는지 그래프로 제공하여 사용자 자신에게 알맞은 아르바이트를 선택할 수 있게 도와주는 시스템이 요구되었다.In order to solve these problems, there is a need for a system that can help the user to select a suitable part-time job by providing various kinds of information about the part-time job by graphically showing how the hourly wage increases or decreases according to various attributes through regression analysis.

한국공개특허공보 제2015-0110010호 (공개일 2015. 10. 02.)Korean Published Patent Application No. 2015-0110010 (published on October 10, 2015)

따라서 본 발명이 해결하고자 하는 기술적 과제는 사용자가 자신에게 알맞은 아르바이트를 선택할 수 있도록 아르바이트 데이터를 수집, 분석 및 시각화하여 제공할 수 있는 아르바이트 데이터 제공 시스템을 제공하는 것이다.SUMMARY OF THE INVENTION Accordingly, it is an object of the present invention to provide a part-time data providing system capable of collecting, analyzing, and visualizing part-time data so that a user can select a part-

또한, 본 발명은 명시적으로 언급된 목적 이외에도, 후술하는 본 발명의 구성으로부터 달성될 수 있는 다른 목적도 포함한다.Further, the present invention includes other objects that can be achieved from the construction of the present invention described later, in addition to the objects explicitly mentioned.

상기한 기술적 과제를 해결하기 위한 본 발명의 실시예에 따른 아르바이트 데이터 제공 시스템은 사용자로부터 입력받거나 데이터 크롤링에 의한 웹 페이지의 탐색을 통해 아르바이트 데이터를 수집하는 데이터 수집부, 상기 수집된 아르바이트 데이터를 함수 모형 분석 알고리즘에 따라 분석하여 아르바이트 통계 분석 데이터를 생성하는 데이터 분석부, 그리고 상기 생성된 아르바이트 통계 분석 데이터를 사용자 단말에 전송하여 상기 사용자 단말의 화면에 표시되게 하는 데이터 출력부를 포함하는 서비스 서버를 포함한다.According to another aspect of the present invention, there is provided a part-time data providing system including a data collecting unit collecting part-time data by receiving input from a user or browsing a web page by data crawling, And a service server including a data analyzer for analyzing the statistical analysis data according to a model analysis algorithm to generate a statistical analysis data for a part of the work and a data output unit for transmitting the generated statistical analysis data to a user terminal and displaying the data on a screen of the user terminal do.

상기 데이터 분석부는 상기 수집된 아르바이트 데이터를 함수 모형 분석 알고리즘에 따라 분석하여 아르바이트의 변수에 대한 상관관계를 검출하고, 상기 아르바이트의 변수에 대한 상관관계가 포함된 상기 아르바이트 통계 분석 데이터를 생성할 수 있다.The data analysis unit may analyze the collected part-time data according to a function model analysis algorithm to detect a correlation with a variable of a part-time job and generate the part-time statistical analysis data including a correlation with a variable of the part-time job .

상기 데이터 분석부는 상기 수집된 아르바이트 데이터를 극값 데이터마이닝 알고리즘에 따라 분석하여 사용자의 아르바이트 예측 정보를 생성하고, 상기 데이터 출력부는 상기 생성된 사용자의 아르바이트 예측 정보를 상기 사용자 단말에 전송할 수 있다.The data analyzer may analyze the collected byte data according to an extreme value data mining algorithm to generate user's part prediction information, and the data output unit may transmit the generated part prediction information to the user terminal.

상기 수집된 아르바이트 데이터를 미리 정해진 기준에 따라 분류하여 데이터베이스에 저장하는 데이터 분류부를 더 포함할 수 있다. And a data classifier for classifying the collected part-time data according to a predetermined criterion and storing the classified part-time data in a database.

상기 데이터베이스는 캐싱 테이블이 구비되고, 상기 캐싱 테이블에 상기 분석된 아르바이트 통계 분석 데이터가 저장될 수 있다. The database may be provided with a caching table, and the analyzed analyzed statistics statistical data may be stored in the caching table.

이와 같이 본 발명의 실시예에 따른 아르바이트 데이터 제공 시스템에 따르면, 아르바이트에 대한 여러 정보를 제공하여 자신에게 알맞은 아르바이트를 선택할 수 있게 도와줄 수 있다. 즉 아르바이트의 변수에 대한 상관관계를 보여줘서 사용자의 생활환경에 맞는 아르바이트를 찾을 수 있도록 도와줄 수 있다. As described above, according to the part-time data providing system according to the embodiment of the present invention, it is possible to provide various pieces of information on the part-time job, thereby helping to select a part-time job suitable for the part-time job. In other words, it shows the correlation of the variables of the part-time job, so that it can help to find a part-time job that suits the living environment of the user.

더욱이, 임의의 데이터를 통계적 기법을 사용하여 분석함으로써 사용자의 요구에 대응하는 미래를 예측할 수 있는 장점이 있다.Moreover, there is an advantage that the future corresponding to the user's demand can be predicted by analyzing arbitrary data using a statistical technique.

그리고 아르바이트 사장의 경우 아르바이트생들의 시급을 얼마 정도 주어야 할지 가늠할 수 있게 도와주고, 근무지 환경의 고충을 소통할 수 있기 때문에 개선 가능한 장점이 있다. 즉 아르바이트생을 구하는 기업들의 시급 금액 측정 정보를 제공할 수 있고, 아르바이트생들의 정보 공유, 의사소통 및 데이터를 축적할 수 있다.In addition, the part-time president has the advantage of being able to improve his ability to measure how much time a part-time worker should be given and to communicate the grievance of the working environment. That is, it is possible to provide information on the urgent amount measurement of companies seeking part-time workers, and to accumulate information sharing, communication, and data of part-time workers.

게다가 작은 데이터 하나하나를 모아 적절하게 분류하여 큰 데이터를 추출함으로써 아르바이트 통계 분석 데이터가 필요한 사용자에게 제공해 줄 수 있다. 예시로 통계학과 또는 빅 데이터 공부 중인 학생들이 사용할 자료가 만들어질 수 있다.In addition, by collecting small data one by one and extracting large data by appropriately sorting it, it is possible to provide the user with the statistical data for the part-time statistics. For example, materials used by students studying statistics or Big Data can be created.

이와 더불어, 선형 회귀 외에 함수 모형 회귀 분석으로 더욱 다양한 분석이 가능해지며, 빅 데이터나 분석 알고리즘을 몰라도 사용자가 데이터를 삽입하여 분석할 수 있는 장점이 있다.In addition to this, it is possible to perform more various analysis by functional regression analysis besides the linear regression, and it is advantageous that the user can insert and analyze data without knowing big data or analysis algorithm.

그리고 구인 구직 사이트에 홍보 및 광고 효과를 가져올 수 있는 장점이 있다.It also has the advantage of bringing publicity and advertising effects to job search sites.

한편, 본 발명의 효과는 상술된 것에 국한되지 않고 후술하는 본 발명의 구성으로부터 도출될 수 있는 다른 효과도 본 발명의 효과에 포함된다.On the other hand, the effects of the present invention are not limited to those described above, and other effects that can be derived from the constitution of the present invention described below are also included in the effects of the present invention.

도 1은 본 발명의 일 실시예에 따른 아르바이트 데이터 제공 시스템의 구성도이다.
도 2 내지 도 11은 본 발명의 일 실시예에 따른 아르바이트 데이터 제공 서비스를 보여주는 화면들이다.
1 is a configuration diagram of a part-time data providing system according to an embodiment of the present invention.
2 to 11 are screens showing a service providing service according to an embodiment of the present invention.

그러면 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art can easily carry out the present invention.

도 1은 본 발명의 일 실시예에 따른 아르바이트 데이터 제공 시스템의 구성도를 나타낸다.1 is a block diagram of a part-time data providing system according to an embodiment of the present invention.

도 1에 도시한 바와 같이, 아르바이트 데이터 제공 시스템(1)은 서비스 서버(100), 데이터베이스(200) 및 사용자 단말(300)을 포함하여 여러 가지 아르바이트 분석 정보를 토대로 사용자에게 맞는 아르바이트를 선택할 수 있도록 지원하는 서비스를 제공할 수 있다.As shown in FIG. 1, the part-time data providing system 1 includes a service server 100, a database 200, and a user terminal 300 so that a user can select a part-time job based on various job analysis information And can provide services to support.

서비스 서버(100)는 데이터 수집부(110), 데이터 분류부(120), 데이터 분석부(130) 및 데이터 출력부(140)를 포함할 수 있다.The service server 100 may include a data collecting unit 110, a data classifying unit 120, a data analyzing unit 130, and a data output unit 140.

데이터 수집부(110)는 사용자로부터 입력받거나 데이터 크롤링에 의한 웹 페이지의 탐색을 통해 아르바이트 데이터를 수집할 수 있다. The data collecting unit 110 may collect input data by receiving input from a user or searching for a web page by data crawling.

보다 자세하게는, 데이터 수집부(110)는 사용자 단말(300)을 통해 사용자로부터 직접 아르바이트 데이터를 입력받을 수 있으며, 대량의 아르바이트 데이터를 수집하기 위하여 구인 구직업체에서 제공하는 정보 제공 사이트의 구인 구직 중인 정보들에서 데이터 크롤링 방식으로 아르바이트 데이터를 추출하여 수집할 수 있다. 데이터 크롤링 방식은 웹에 퍼져있는 데이터를 일정한 기준을 두고 텍스트 형태로 추출하여 모으는 것으로, 예컨대, ‘알바천국’의 데이터를 가져와 데이터베이스(200)에 맞게 가공할 수 있다.More specifically, the data collecting unit 110 can directly input byte data from the user through the user terminal 300, and can collect job data for collecting a large amount of part-time data. It is possible to extract and collect the part-time data from the information by the data crawling method. The data crawling method extracts and collects data spread on the web in a text form with a certain criterion, for example, data of 'Alba paradise' can be fetched and processed according to the database 200.

데이터 분류부(120)는 수집된 아르바이트 데이터를 미리 정해진 기준에 따라 분류하여 데이터베이스(200)에 저장할 수 있다. 아르바이트 데이터가 분류되어 있지 않으면 시각화 또는 분석에 문제가 생길 수 있으므로 예컨대, 구인 구직 공고를 올리는 사장님이 구인 구직 사이트에 올릴 때 “하루 일급”으로 적어야 하는 돈을 “시급”으로 잘못 체크할 경우 발생되는 문제점을 처리하기 위하여 데이터 분류 작업을 수행할 수 있다.The data classification unit 120 may classify the collected byte data according to a predetermined criterion and store the classified data in the database 200. [ If the part-time job data is not classified, there may be a problem in visualization or analysis. For example, if the boss who raises the job search notice incorrectly checks the money to be written as "first-class" You can perform data classification tasks to handle problems.

이에 따라 데이터 분류부(120)는 예컨대, 카페 아르바이트(레벨 1)= 시급 ~ 10000원, 대형마트 아르바이트(레벨 2)= 시급 ~ 15000원과 같이, 아르바이트별로 레벨을 두고 범위를 정하여 아르바이트 데이터를 걸러낼 수 있다.Accordingly, the data classification unit 120 sets the range for each byte, for example, cafe part (level 1) = hourly to 10,000 won, and large mart part-time (level 2) = hourly to 15000 won, You can.

데이터 분석부(130)는 아르바이트 데이터를 함수 모형 분석 알고리즘에 따라 분석하여 아르바이트 통계 분석 데이터를 생성할 수 있다. 즉 분석 기법 중 선형 회귀(Linear Regression) 문제를 모티브로 분석 알고리즘을 설계하였는데, 데이터 분석부(130)는 선형 회귀 분석 알고리즘을 2차 함수 모형, 3차 함수 모형으로 변형하여 아르바이트 데이터들의 분포에 가장 적합한 함수 모형을 자동으로 선정하도록 구현될 수 있다. 기존에는 단순히 key 값에 따른 value 값의 평균으로 분석하였다면, 본 발명의 일 실시예에서는 추가로 기계 학습을 통한 분석까지 이루어질 수 있다.The data analysis unit 130 may analyze the part-time data according to the function model analysis algorithm to generate the part-time statistical analysis data. In other words, a motive analysis algorithm is designed as a linear regression problem in the analysis technique. The data analysis unit 130 transforms the linear regression analysis algorithm into a quadratic function model and a cubic function model, And may be implemented to automatically select an appropriate function model. In the past, if the analysis is performed by simply averaging the value values according to the key value, an embodiment of the present invention can be further analyzed through machine learning.

데이터 분석부(130)는 아르바이트 변수에 대한 상관관계를 검출하기 위하여 함수 모형을 선정하여 분석을 수행할 수 있는데, 예컨대, 경력에 따른 시급 분석의 경우 경력에 따라 시급이 줄어들고 있는 구간이 발생한다면 데이터의 신뢰도가 매우 떨어질 수 있으므로 경력에 따라 시급이 지속적으로 증가 또는 그대로(단조 증가) 유지되도록 해야 한다. 따라서 데이터 분석부(130)는 아르바이트 변수 간의 관계를 추측하고 추측된 결과에 가장 적합한 함수 모형을 선정하여 분석함으로써 분석 결과의 신뢰성을 높일 수 있다.The data analysis unit 130 can perform analysis by selecting a function model in order to detect a correlation with a part time variable. For example, in the case of hourly analysis according to a career, , It is important to ensure that the hourly rate is constantly increased or maintained (monotonically increasing), depending on the career. Therefore, the data analysis unit 130 can increase the reliability of the analysis result by guessing the relationship between the variable variables and selecting and analyzing the function model best suited to the estimated result.

함수 모형 분석 알고리즘은 선형 함수 모형 외에 2차 함수 모형, 3차 함수 모형 또는 함수 모형 회귀 분석 알고리즘 등을 포함할 수 있다. 선형 함수 모형 분석 알고리즘은 일반적인 선형 회귀 분석을 기계 학습을 통해 구현한 방식이고, 2차 함수 모형 분석 알고리즘은 선형 회귀를 변형하여 2차 함수 모형으로 기계 학습시켜 분석하는 방식으로, 모든 데이터의 분포를 선형적으로만 분석하게 된다면 문제가 있다고 보기 때문에 비선형적인 모델로 분석하기 위해 정의역이 주어진 전사함수를 선정하게 되고 가장 일반적인 함수들을 채택하는 것이다. 3차 함수 모형 분석 알고리즘은 선형 회귀를 변형하여 단조 증가하는 3차 함수 모형으로 기계 학습시켜 분석하는 방식이고, 함수 모형 회귀 분석 알고리즘은 데이터들을 선형, 2차 모형, 단조 증가 3차 모형들로 각각 분석해보고 그 중에서 데이터 분포에 가장 적합하다고 판정되는 것을 출력하는 방식이다. The function model analysis algorithm can include a linear function model, a quadratic function model, a cubic function model, or a function model regression analysis algorithm. The linear function model analysis algorithm is a method in which a general linear regression analysis is implemented through machine learning. The quadratic function model analysis algorithm is a method in which a linear regression is modified to perform a machine learning with a quadratic function model. If we analyze only linearly, we consider that there is a problem, so we select the given transfer functions for domain nonlinear models and adopt the most general functions. The third-order function model analysis algorithm is a method of analyzing machine-learning by a monotone increasing cubic function model by modifying the linear regression. The function model regression analysis algorithm uses data of linear, quadratic, and monotone increasing cubic models Analyze and output the data that is determined to be most suitable for data distribution among them.

그리고 데이터 분석부(130)는 함수 모형 회귀 분석 알고리즘과 함께 극값 데이터마이닝 알고리즘을 이용한 분석을 통해 사용자의 아르바이트 예측 데이터를 생성할 수 있도록 한다. 예컨대, 사용자가 입력한 데이터를 기초로 분석 및 예측할 수 있는 기능을 제공할 수 있다. 즉 함수 모형 회귀 분석 알고리즘과 함께 극값을 이용한 데이터 분석 기법을 추가로 설계하여 자신이 임의의 데이터를 입력하여 분석할 수 있는 분석기를 제공할 수 있다. 극값 데이터마이닝 알고리즘에서 데이터 간의 “극값”이란 매우 중요한 정보로 사용이 가능하기 때문에 극값들의 주기를 분석하여 다음에 일어날 극값이 언제 일어날지 분석하는 기법을 말한다. 극값 데이터마이닝 알고리즘은 기울기를 이용한 극값 데이터마이닝과, 선형 회귀를 이용한 극값 데이터마이닝이 있는데, 기울기를 이용한 극값 데이터마이닝은 각 key 값에 따른 value 값들의 평균을 내어 그 평균값들 중 ‘극값’이라고 생각되는 평균값만 뽑아내 가장 최근 바로 전 구간의 기울기와 과거의 기울기를 통하여 유사한 구간을 찾아내고 다음번 극값이 언제 일어날지를 추측하여 추가한 뒤 3차 함수의 미적분을 통하여 연결한 모형이다. 선형 회귀를 이용한 극값 데이터마이닝은 각 key 값에 따른 value 값들의 평균을 내어 그 평균값들 중 ‘극값’이라고 생각되는 평균값만 뽑아내 가장 최근 바로 전 극값과 선형 회귀 분석과의 차이와 과거의 극값과 선형 회귀 분석과의 차이를 비교하여 유사한 위치를 찾아내고 다음 차례의 극값이 언제 일어날지를 추측하여 추가한 뒤 3차 함수의 미적분을 통하여 연결한 모형이다.The data analysis unit 130 can generate the user's part prediction data through analysis using the extreme value data mining algorithm together with the function model regression analysis algorithm. For example, it is possible to provide a function of analyzing and predicting based on data inputted by a user. In other words, it is possible to provide an analyzer that can input and analyze arbitrary data by designing a data analysis method using extreme values in addition to a function model regression analysis algorithm. Extreme Value In data mining algorithms, "extreme values" between data are used as very important information, so it is a technique of analyzing the period of extreme values and analyzing when extreme values will occur. The extreme value data mining algorithm uses extreme value data mining using slope and extreme value data mining using linear regression. The extreme value data mining using slope averages the value values according to each key value, And then finds a similar section through the slope of the most recent immediately preceding section and the past slope, adds a guess as to when the next extremum will occur, and connects it through the calculus of the third order function. The extreme value data mining using linear regression averages the value values according to each key value and extracts only the mean value which is considered as the 'extremum' among the average values. The difference between the most recent direct previous value and the linear regression analysis, It is a model that finds similar positions by comparing differences with linear regression analysis, adds guesses when the next extreme value will occur, and connects them through the calculus of the third order function.

한편, 대량의 아르바이트 데이터를 사용자들이 이용할 때마다 분석하게 되면 매우 비효율적이므로 캐싱 방식(Cashing, 영속화)을 이용하여 서비스 서버(100)에서 주기적으로 분석기를 실행하고 그 결과를 데이터베이스(200)의 캐싱 테이블에 저장하여 저장된 분석 결과만 사용자들에게 제공하는 방식을 이용하여 빠른 분석 결과를 제공할 수 있다. 분석기로는 예컨대, HeartbeatMessage 클래스(자바 어플리케이션과의 통신)를 이용하여 Threed로 사용자의 데이터를 받아내 체크하여 분석하고 결과를 저장하여 사용자가 들어올 때 테이블을 감량하여 하나의 함수 클래스로 변형하여 사용자들에게 보여줄 수 있다. 이는 최초 1회만 실시하여 서비스 서버의 과부하 부담을 매우 덜어줄 수 있다.On the other hand, it is very inefficient to analyze a large amount of part-time data every time a user uses the service. Therefore, the service server 100 periodically executes the analyzer by using a caching method (persistence) And provides the analysis result to the users only. Therefore, it is possible to provide quick analysis results. For example, the analyzer receives user data in Threed using the HeartbeatMessage class (communication with a Java application), checks and analyzes the result, stores the result, and transforms the table into a function class, . This can be done only once at the beginning, which can greatly alleviate the overload burden of the service server.

데이터 출력부(140)는 데이터 분석부(130)에서 생성된 아르바이트 통계 분석 데이터를 사용자 단말(300)에 전송하여 사용자 단말(300)의 화면에 표시되게 할 수 있다. 데이터 출력부(140)는 분석된 다양한 결과를 시각화하여 사용자 단말(300)에 전송함으로써 사용자가 확인할 수 있도록 한다.The data output unit 140 may transmit the statistics statistical analysis data generated by the data analysis unit 130 to the user terminal 300 to be displayed on the screen of the user terminal 300. The data output unit 140 visualizes various analyzed results and transmits them to the user terminal 300 so that the user can confirm the results.

데이터베이스(200)는 캐싱 테이블이 구비되고, 캐싱 테이블에 아르바이트 통계 분석 데이터가 저장될 수 있다. 예컨대, 캐싱 테이블은 수집된 아르바이트 데이터의 양이 1000000개라 하면 그것을 사용자들이 ‘새로 고침’할 때마다 알고리즘을 돌려 분석하고 시각화하게 되면 서비스 서버(100)의 과부하가 일어날 가능성이 높기 때문에 주기적으로 아르바이트 데이터를 분석하고 그 결과를 캐싱 테이블에 저장하여 과부하를 방지할 수 있다.The database 200 is provided with a caching table, and the statistical analysis data for the part can be stored in the caching table. For example, if the amount of the collected part-time data is 1,000,000, the service server 100 is likely to be overloaded by analyzing and visualizing the algorithm every time the users 'refresh' it, And stores the result in a caching table to prevent an overload.

사용자 단말(300)은 통신망(10)을 통해 서비스 서버(100)와 연결되어 각종 정보 및 데이터를 교환할 수 있다.The user terminal 300 is connected to the service server 100 through the communication network 10 to exchange various information and data.

여기서, 통신망(10)은 구내 정보 통신망(Local Area Network, LAN), 도시권 통신망(Metropolitan Area Network, MAN), 광역 통신망(Wide Area Network, WAN), 인터넷(internet), 3G(generation)/4G(generation) 이동통신망, 와이파이(Wi-Fi), WIBRO(Wireless Broadband Internet) 또는 LTE(Long Term Evolution) 등을 포함하는 각종 데이터 통신망을 포함할 수 있고, 유선과 무선을 가리지 않으며 어떠한 통신 방식을 사용하더라도 상관없다.Here, the communication network 10 may be a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), an internet, a 3G / generation wireless communication network, Wi-Fi, Wireless Broadband Internet (WIBRO), and Long Term Evolution (LTE), and may include any type of communication method Does not matter.

사용자 단말(300)은 스마트폰(Smart Phone), 태블릿(Tablet) PC, 개인 휴대 정보 단말기(Personal Digital Assistant, PDA)나 웹 패드(Web Pad) 등과 같이 메모리 수단을 구비하고 마이크로프로세서를 탑재하여 연산 능력을 갖춘 이동 통신 기능을 구비한 단말로 이루어질 수 있다. The user terminal 300 includes memory means such as a smart phone, a tablet PC, a personal digital assistant (PDA), a web pad, etc., And a terminal having a mobile communication function with capability.

특히, 본 발명의 일 실시예에 따른 사용자 단말(300)은 서비스 어플리케이션이 설치될 수 있다. 서비스 어플리케이션은 여러 가지 아르바이트 통계 분석 데이터를 토대로 사용자에게 맞는 아르바이트를 선택할 수 있는 서비스를 지원할 수 있다. In particular, the user terminal 300 according to an embodiment of the present invention may be installed with a service application. The service application can support a service that can select a part-time job for the user based on various job statistical analysis data.

사용자는 해당 서비스를 제공 받기 위하여 사용자 단말(300)을 통해 회원 가입 절차를 수행할 수 있다. 회원 가입 절차를 수행하거나 수행한 후에 사용자 단말(300)은 서비스 어플리케이션의 설치를 위한 URL(Uniform Resource Locator)을 제공 받고, 이를 이용하여 서비스 어플리케이션을 설치할 수 있다. 그런 후 서비스 어플리케이션을 실행한 후 로그인을 수행할 수 있다.The user can perform the membership subscription procedure through the user terminal 300 in order to receive the corresponding service. After performing or performing the membership subscription procedure, the user terminal 300 is provided with a URL (Uniform Resource Locator) for installing the service application, and can install the service application using the uniform resource locator. You can then run the service application and log in.

서비스 어플리케이션은 사용자가 자신의 아르바이트 데이터를 입력하기 위한 사용자 입력 화면을 사용자 단말(300)의 화면에 출력할 수 있다. 그리고 서비스 어플리케이션은 서비스 서버(100)에서 생성된 아르바이트 통계 분석 데이터를 사용자 단말(300)에 출력할 수 있으며, 사용자가 선택한 우선순위에 따라 정렬한 아르바이트 데이터를 보여줄 수 있도록 구성될 수 있다.The service application may output a user input screen for inputting the user's own job data to the screen of the user terminal 300. [ The service application can output the job statistical analysis data generated by the service server 100 to the user terminal 300 and can display the sorted byte data according to the priority selected by the user.

서비스 어플리케이션은 아르바이트 데이터를 극값 데이터마이닝 알고리즘에 따라 분석하여 생성된 사용자의 아르바이트 예측 데이터를 사용자 단말(300)에 출력할 수 있다. The service application can analyze the part-time data according to the extreme value data mining algorithm and output the generated part-time prediction data of the user to the user terminal 300.

이하에서는 본 발명의 일 실시예에 따른 아르바이트 데이터 제공 시스템의 동작 과정에 대하여 설명하도록 한다.Hereinafter, an operation procedure of a part-time data providing system according to an embodiment of the present invention will be described.

도 2 내지 도 11은 본 발명의 일 실시예에 따른 아르바이트 데이터 제공 서비스를 보여주는 화면들을 나타낸다.FIGS. 2 to 11 show screens illustrating a service providing service according to an embodiment of the present invention.

도 2를 참조하면, 대량의 아르바이트 데이터를 수집하기 위하여 구인 구직업체에서 제공하는 정보 제공 사이트에서 구인 구직 중인 정보들에서 데이터 크롤링 방식을 사용하여 아르바이트 데이터를 추출할 수 있다.Referring to FIG. 2, in order to collect a large amount of part-time data, it is possible to extract the part-time data by using the data crawling method in the information being searched for at the information providing site provided by the job seeking company.

도 3과 같이, 사용자로부터 아르바이트 데이터를 직접 입력받기 위하여 사용자 입력 화면이 제공될 수 있다. 이때 정보의 기각 범위를 설정하여 잘못된 정보라고 판단되면 기각 테이블에 별도로 저장될 수 있다.As shown in FIG. 3, a user input screen may be provided for directly inputting the byte data from the user. At this time, the rejection range of the information is set, and if it is judged to be erroneous information, it can be separately stored in the rejection table.

도 4와 같이, 다양한 변수에 대하여 다양한 함수 형태로 분석하고, 사용자의 정보를 입력받아 분석 결과와 비교할 수 있다. 이때 다양한 변수를 선택하여 시각화함으로써 두 변수 간의 상관관계도 도출할 수 있다.As shown in FIG. 4, various types of functions can be analyzed in various functional forms, and the user's information can be input and compared with the analysis result. In this case, the correlation between two variables can be derived by visualizing various variables.

도 5와 같이, 아르바이트별로 우선순위를 정하고 정렬하여 자신의 원하는 순서대로 아르바이트 데이터를 볼 수 있는데, 예컨대, 시급 순으로 정렬하게 되면 시급이 높은 아르바이트 순서대로 아르바이트 데이터를 출력할 수 있다. 즉 사용자가 우선순위로 두고 싶은 속성을 선택하면 그 속성을 기준으로 자동으로 아르바이트 데이터가 출력될 수 있다.As shown in FIG. 5, the user can view the byte data in the order of his / her preference by arranging and prioritizing them by the partitions. For example, if the words are sorted in order of urgency, byte data can be outputted in the order of high byte. That is, if the user selects an attribute to be prioritized, the part-time data can be automatically output based on the attribute.

도 6은 사용자들이 직접 체험할 수 있는 데이터 분석 화면으로서, 선형 회귀 문제를 토대로 데이터마이닝 기법을 분석하여 선형 함수 모형, 2차 함수 모형 또는 3차 함수 모형 등으로 각각 분석해보는 함수 모형 데이터마이닝 기법과 극값을 이용한 데이터마이닝 기법을 설계하여 사용자가 입력한 데이터로 분석할 수 있다. 예컨대, 자신의 매월 수익을 입력하여 다음 달에 얼마의 수익이 있을지 예측 가능하다. FIG. 6 is a data analysis screen that users can directly experience. Data mining techniques based on linear regression are analyzed and analyzed using a linear function model, a quadratic function model, or a cubic function model. Data mining techniques using extreme values can be designed and analyzed with user input data. For example, it is possible to predict how much profit will be made in the next month by inputting his or her monthly profit.

그리고 웹 페이지에서 작동하는 분석기를 설계할 때 서비스 서버(100)의 과부하 문제를 막기 위해 사용자가 데이터를 보내면 자바 어플리케이션인 HeartbeatMessage 클래스가 1초 간격으로 체크하며 대기하다가 사용자에게 데이터가 들어오면 최초 1회 알고리즘 계산을 하고 결과를 테이블에 저장하여 테이블 Reduce를 통해 함수로 바꾸어 결과만 출력해주는 방식을 사용할 수 있다.When designing an analyzer operating on a web page, in order to prevent an overload problem of the service server 100, when a user sends data, the Java application HeartbeatMessage class waits at 1 second intervals, You can use the algorithm to calculate the result, store the result in a table, convert it into a function through table reduction, and output the result only.

도 7은 사용자의 데이터를 텍스트로 구분자(,)로 데이터를 삽입하기 위한 기능을 제공하는 화면으로서, 예컨대, 통계학과 학생들 또는 빅 데이터를 공부하는 학생들은 보통 구분자(,)로 구분하는 파일을 가지고 있다. 따라서 속성을 구분자(,)로 구분하여 자신의 테이블에 삽입할 수 있는 기능을 제공할 수 있다.FIG. 7 is a screen for providing a function for inserting data into a text (for example, a user's data). For example, a student who studies statistics and students or big data usually has a file that is divided into delimiters . Therefore, it is possible to provide a function of inserting the attributes into their own tables by dividing them by delimiters (,).

도 8과 같이, 테이블에 저장된 결과를 Reduce하고 분석 결과 함수로 변형하여 f(x)의 x값에 숫자를 대입하면 자바 스크립트로 값을 추출할 수 있다. As shown in FIG. 8, if the result stored in the table is reduced and transformed into an analysis result function, a value can be extracted by JavaScript by assigning a number to the x value of f (x).

도 9와 같이, 최대 3개의 저장 테이블을 사용할 수 있으며 그것을 테이블로 시각화할 수 있다. 예시로 자신의 ‘매달 순수익’ 같은 데이터를 삽입하여 다음 달에는 얼마의 수익을 받을지 추측 가능하다.As shown in FIG. 9, a maximum of three storage tables can be used and it can be visualized as a table. For example, you can insert data such as your 'monthly net income' to estimate how much you will receive next month.

도 10과 같이, 자신의 데이터를 전체 비우거나 선택하여 삭제할 수 있는데, 이때 선택하여 삭제하였을 경우 남은 데이터로 분석을 다시 하여 결과를 저장할 수 있다.As shown in FIG. 10, it is possible to completely empty or select and delete the data. If the data is selected and deleted at this time, analysis can be performed again with the remaining data and the result can be stored.

도 11과 같이, 사용자들에게 수집된 데이터 파일을 공유할 수 있는데, 수집된 데이터 파일을 텍스트 파일로 저장하고 구분자로 두어 아르바이트 데이터를 사용해야 하는 사람들에게 제공할 수 있다.As shown in FIG. 11, the collected data files can be shared with users. The collected data files can be stored as a text file and can be provided as a separator to those who need to use the byte data.

게다가 아르바이트 구인 구직 사이트를 소개하거나 링크 연결할 수 있다. 그리고 댓글 창을 구현하여 종목에 따른 사용자들 간의 다양한 의견을 자유롭게 소통이 가능하며 분석 결과로는 얻을 수 없는 정보들을 얻을 수 있게 한다.In addition, you can introduce or link to a job site that is a part-time job. And by implementing the comment window, it is possible to freely communicate various opinions among the users according to the events, and to obtain information that can not be obtained from the analysis results.

이상에서 본 발명의 바람직한 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, Of the right.

1: 아르바이트 데이터 제공 시스템
100: 서비스 서버
110: 데이터 수집부
120: 데이터 분류부
130: 데이터 분석부
140: 데이터 출력부
200: 데이터베이스
300: 사용자 단말
1: Part time data providing system
100: service server
110: Data collecting unit
120:
130: Data analysis section
140: Data output section
200: Database
300: user terminal

Claims (5)

사용자로부터 입력받거나 데이터 크롤링에 의한 웹 페이지의 탐색을 통해 아르바이트 데이터를 수집하는 데이터 수집부,
상기 수집된 아르바이트 데이터를 함수 모형 분석 알고리즘에 따라 분석하여 아르바이트 통계 분석 데이터를 생성하는 데이터 분석부, 그리고
상기 생성된 아르바이트 통계 분석 데이터를 사용자 단말에 전송하여 상기 사용자 단말의 화면에 표시되게 하는 데이터 출력부를 포함하는 서비스 서버
를 포함하는 아르바이트 데이터 제공 시스템.
A data collecting unit for collecting part-time data by receiving input from a user or searching a web page by data crawling,
A data analysis unit for analyzing the collected part-time data according to a function model analysis algorithm to generate a part-time statistical analysis data, and
And a data output unit for transmitting the generated statistical analysis data to the user terminal and displaying the data on the screen of the user terminal.
And a part-time data providing system.
제 1 항에서,
상기 데이터 분석부는,
상기 수집된 아르바이트 데이터를 함수 모형 분석 알고리즘에 따라 분석하여 아르바이트의 변수에 대한 상관관계를 검출하고, 상기 아르바이트의 변수에 대한 상관관계가 포함된 상기 아르바이트 통계 분석 데이터를 생성하는 아르바이트 데이터 제공 시스템.
The method of claim 1,
The data analysis unit may include:
Analyzing the collected part-time data according to a function model analysis algorithm to detect a correlation with a variable of a part-time job, and generating the part-time statistical analysis data including a correlation with a variable of the part-time job.
제 2 항에서,
상기 데이터 분석부는,
상기 수집된 아르바이트 데이터를 극값 데이터마이닝 알고리즘에 따라 분석하여 사용자의 아르바이트 예측 데이터를 생성하고,
상기 데이터 출력부는,
상기 생성된 사용자의 아르바이트 예측 데이터를 상기 사용자 단말에 전송하는 아르바이트 데이터 제공 시스템.
3. The method of claim 2,
The data analysis unit may include:
Analyzing the collected byte data according to an extreme value data mining algorithm to generate user's part prediction data,
Wherein the data output unit comprises:
And transmitting the part-time predicted data of the user to the user terminal.
제 1 항에서,
상기 수집된 아르바이트 데이터를 미리 정해진 기준에 따라 분류하여 데이터베이스에 저장하는 데이터 분류부를 더 포함하는 아르바이트 데이터 제공 시스템.
The method of claim 1,
And a data classifier for classifying the collected part-time data according to a predetermined criterion and storing the classified part-time data in a database.
제 4 항에서,
상기 데이터베이스는,
캐싱 테이블이 구비되고,
상기 캐싱 테이블에 상기 분석된 아르바이트 통계 분석 데이터가 저장되는 아르바이트 데이터 제공 시스템.
5. The method of claim 4,
The database includes:
A caching table is provided,
And the analyzed parted statistical analysis data is stored in the caching table.
KR1020170173646A 2017-12-15 2017-12-15 System for Providing Arbeit Data KR20190072360A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170173646A KR20190072360A (en) 2017-12-15 2017-12-15 System for Providing Arbeit Data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170173646A KR20190072360A (en) 2017-12-15 2017-12-15 System for Providing Arbeit Data

Publications (1)

Publication Number Publication Date
KR20190072360A true KR20190072360A (en) 2019-06-25

Family

ID=67065666

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170173646A KR20190072360A (en) 2017-12-15 2017-12-15 System for Providing Arbeit Data

Country Status (1)

Country Link
KR (1) KR20190072360A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220141167A (en) * 2021-04-12 2022-10-19 오승용 Matching system for 24 hours part-time job

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150110010A (en) 2014-03-22 2015-10-02 원투씨엠 주식회사 Method for Managing Hourly Wage Arbeit by using Touch Module

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150110010A (en) 2014-03-22 2015-10-02 원투씨엠 주식회사 Method for Managing Hourly Wage Arbeit by using Touch Module

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220141167A (en) * 2021-04-12 2022-10-19 오승용 Matching system for 24 hours part-time job

Similar Documents

Publication Publication Date Title
Gozhyj et al. Web resources management method based on intelligent technologies
Lu et al. The emergence of opinion leaders in a networked online community: A dyadic model with time dynamics and a heuristic for fast estimation
Di Lorenzo et al. Allaboard: Visual exploration of cellphone mobility data to optimise public transport
Çavdar et al. Airline customer lifetime value estimation using data analytics supported by social network information
Wongcharoen et al. Twitter analysis of road traffic congestion severity estimation
Kaußen Landscape Perception and Construction in SocialMedia: An Analysis of User-generated Content
Thompson Modeling wildfire incident complexity dynamics
Bildosola et al. An approach for modelling and forecasting research activity related to an emerging technology
JP2015191333A (en) Detection device, detection method, and detection program
Karamoozian et al. Risk assessment of occupational safety in construction projects using uncertain information
KR20190072360A (en) System for Providing Arbeit Data
Fasel et al. A fuzzy data warehouse approach for web analytics
Brandl et al. AMICAI: a method based on risk analysis to integrate responsible research and innovation into the work of research and innovation practitioners
Fahmi et al. Mining social media (twitter) data for corporate image analysis: a case study in the indonesian mining industry
KR20160093489A (en) Content collection and recommendation system and method
KR101883314B1 (en) Apparatus and Method for Analyzing Data using R Association Rule and collaborative filtering
Cerone Process mining as a modelling tool: Beyond the domain of business process management
Algamdi et al. A trust evaluation method based on the distributed cloud trust protocol (CTP) and opinion sharing
Teixeira et al. Proposal for sustainable smart city indicators
KR102099560B1 (en) System for providing research paper consulting service with contents of surveying organization, survey conducting, and data analysis
Caylor et al. Preliminary evaluation of multi-criteria decision-making methodology for emergency management
Binatti et al. Latin American bike sharing ecosystem overview: from data collection to implementation model portraits
Ramanathan et al. Apply of sum of difference method to predict placement of students’ using educational data mining
Rath et al. Low-level event relationship discovery for knowledge work support
JP2006215798A (en) Task analysis/management support administrative device, task analysis/management support administrative method and task analysis/management support administrative program

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application