KR20190072360A - System for Providing Arbeit Data - Google Patents
System for Providing Arbeit Data Download PDFInfo
- Publication number
- KR20190072360A KR20190072360A KR1020170173646A KR20170173646A KR20190072360A KR 20190072360 A KR20190072360 A KR 20190072360A KR 1020170173646 A KR1020170173646 A KR 1020170173646A KR 20170173646 A KR20170173646 A KR 20170173646A KR 20190072360 A KR20190072360 A KR 20190072360A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- time
- user
- analysis
- user terminal
- Prior art date
Links
- 238000004458 analytical method Methods 0.000 claims abstract description 31
- 238000007405 data analysis Methods 0.000 claims abstract description 14
- 238000007619 statistical method Methods 0.000 claims abstract description 14
- 230000009193 crawling Effects 0.000 claims abstract description 7
- 238000000034 method Methods 0.000 claims description 21
- 238000007418 data mining Methods 0.000 claims description 12
- 238000013480 data collection Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 22
- 238000012417 linear regression Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 6
- 238000000611 regression analysis Methods 0.000 description 6
- 238000012887 quadratic function Methods 0.000 description 5
- 238000012888 cubic function Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000012886 linear function Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- VYQNWZOUAUKGHI-UHFFFAOYSA-N monobenzone Chemical compound C1=CC(O)=CC=C1OCC1=CC=CC=C1 VYQNWZOUAUKGHI-UHFFFAOYSA-N 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
본 발명은 아르바이트 데이터 제공 시스템에 관한 것으로, 보다 상세하게는 사용자에게 알맞은 아르바이트를 선택할 수 있도록 아르바이트 데이터를 수집, 분석 및 시각화하여 제공할 수 있는 아르바이트 데이터 제공 시스템에 관한 것이다.BACKGROUND OF THE
최근 대부분의 대학생들의 경우 부모님의 도움을 받지 않는 이상 아르바이트를 하지 않으면 대학교 생활을 해나가기 어려운 상태이며, 대학교 등록금을 벌기 위하여 대학생들은 시간의 대부분을 아르바이트하는데 보내고 있다.Most college students are not able to live in college without a part-time job without the help of their parents. In order to earn college tuition, college students spend most of their time working part-time.
하지만, 대부분의 대학생들은 어떤 아르바이트가 자신의 성격과 환경에 맞을지 고려하지 않고 단순히 구인업체에서 제공하는 정보 제공 사이트에 접속하여 시급 및 근무지가 적정한 구인업체를 일일이 찾아서 입사 지원하는 형태로 이루어지고 있다.However, most college students do not consider which part-time job is suitable for their personality and environment, but simply go to an information-providing site provided by a job seeker to find job seekers who are appropriate for their time and place.
그리고 아르바이트에 관한 정보를 얻고자 하여도 웹상에서 펴져 있는 정보들은 가공되어 있지 않아 특정한 근무지의 영향을 많이 받기 때문에 객관성이 부족하여 신뢰도가 떨어지는 문제점이 있었다.In order to obtain information on part-time jobs, the information on the web is not processed, so it is affected by specific workplaces, so there is a lack of objectivity and low reliability.
이와 같이, 대학생들은 자신의 성격이나 재능을 고려하여 아르바이트를 선택하기가 쉽지 않으며, 해당 업종에 대한 노하우를 조언해줄 수 없는 사람이 존재하지 않다면 접해보기 어려운 경우가 많았다.In this way, it is not easy for college students to choose a part-time job considering their personality and talents, and it is often difficult to find out if there is no person who can not give advice on their know-how.
이러한 문제점을 해결하기 위하여 아르바이트에 대한 여러 가지 정보를 회귀 분석을 통해 다양한 속성에 따라 시급이 어떻게 오르거나 줄어드는지 그래프로 제공하여 사용자 자신에게 알맞은 아르바이트를 선택할 수 있게 도와주는 시스템이 요구되었다.In order to solve these problems, there is a need for a system that can help the user to select a suitable part-time job by providing various kinds of information about the part-time job by graphically showing how the hourly wage increases or decreases according to various attributes through regression analysis.
따라서 본 발명이 해결하고자 하는 기술적 과제는 사용자가 자신에게 알맞은 아르바이트를 선택할 수 있도록 아르바이트 데이터를 수집, 분석 및 시각화하여 제공할 수 있는 아르바이트 데이터 제공 시스템을 제공하는 것이다.SUMMARY OF THE INVENTION Accordingly, it is an object of the present invention to provide a part-time data providing system capable of collecting, analyzing, and visualizing part-time data so that a user can select a part-
또한, 본 발명은 명시적으로 언급된 목적 이외에도, 후술하는 본 발명의 구성으로부터 달성될 수 있는 다른 목적도 포함한다.Further, the present invention includes other objects that can be achieved from the construction of the present invention described later, in addition to the objects explicitly mentioned.
상기한 기술적 과제를 해결하기 위한 본 발명의 실시예에 따른 아르바이트 데이터 제공 시스템은 사용자로부터 입력받거나 데이터 크롤링에 의한 웹 페이지의 탐색을 통해 아르바이트 데이터를 수집하는 데이터 수집부, 상기 수집된 아르바이트 데이터를 함수 모형 분석 알고리즘에 따라 분석하여 아르바이트 통계 분석 데이터를 생성하는 데이터 분석부, 그리고 상기 생성된 아르바이트 통계 분석 데이터를 사용자 단말에 전송하여 상기 사용자 단말의 화면에 표시되게 하는 데이터 출력부를 포함하는 서비스 서버를 포함한다.According to another aspect of the present invention, there is provided a part-time data providing system including a data collecting unit collecting part-time data by receiving input from a user or browsing a web page by data crawling, And a service server including a data analyzer for analyzing the statistical analysis data according to a model analysis algorithm to generate a statistical analysis data for a part of the work and a data output unit for transmitting the generated statistical analysis data to a user terminal and displaying the data on a screen of the user terminal do.
상기 데이터 분석부는 상기 수집된 아르바이트 데이터를 함수 모형 분석 알고리즘에 따라 분석하여 아르바이트의 변수에 대한 상관관계를 검출하고, 상기 아르바이트의 변수에 대한 상관관계가 포함된 상기 아르바이트 통계 분석 데이터를 생성할 수 있다.The data analysis unit may analyze the collected part-time data according to a function model analysis algorithm to detect a correlation with a variable of a part-time job and generate the part-time statistical analysis data including a correlation with a variable of the part-time job .
상기 데이터 분석부는 상기 수집된 아르바이트 데이터를 극값 데이터마이닝 알고리즘에 따라 분석하여 사용자의 아르바이트 예측 정보를 생성하고, 상기 데이터 출력부는 상기 생성된 사용자의 아르바이트 예측 정보를 상기 사용자 단말에 전송할 수 있다.The data analyzer may analyze the collected byte data according to an extreme value data mining algorithm to generate user's part prediction information, and the data output unit may transmit the generated part prediction information to the user terminal.
상기 수집된 아르바이트 데이터를 미리 정해진 기준에 따라 분류하여 데이터베이스에 저장하는 데이터 분류부를 더 포함할 수 있다. And a data classifier for classifying the collected part-time data according to a predetermined criterion and storing the classified part-time data in a database.
상기 데이터베이스는 캐싱 테이블이 구비되고, 상기 캐싱 테이블에 상기 분석된 아르바이트 통계 분석 데이터가 저장될 수 있다. The database may be provided with a caching table, and the analyzed analyzed statistics statistical data may be stored in the caching table.
이와 같이 본 발명의 실시예에 따른 아르바이트 데이터 제공 시스템에 따르면, 아르바이트에 대한 여러 정보를 제공하여 자신에게 알맞은 아르바이트를 선택할 수 있게 도와줄 수 있다. 즉 아르바이트의 변수에 대한 상관관계를 보여줘서 사용자의 생활환경에 맞는 아르바이트를 찾을 수 있도록 도와줄 수 있다. As described above, according to the part-time data providing system according to the embodiment of the present invention, it is possible to provide various pieces of information on the part-time job, thereby helping to select a part-time job suitable for the part-time job. In other words, it shows the correlation of the variables of the part-time job, so that it can help to find a part-time job that suits the living environment of the user.
더욱이, 임의의 데이터를 통계적 기법을 사용하여 분석함으로써 사용자의 요구에 대응하는 미래를 예측할 수 있는 장점이 있다.Moreover, there is an advantage that the future corresponding to the user's demand can be predicted by analyzing arbitrary data using a statistical technique.
그리고 아르바이트 사장의 경우 아르바이트생들의 시급을 얼마 정도 주어야 할지 가늠할 수 있게 도와주고, 근무지 환경의 고충을 소통할 수 있기 때문에 개선 가능한 장점이 있다. 즉 아르바이트생을 구하는 기업들의 시급 금액 측정 정보를 제공할 수 있고, 아르바이트생들의 정보 공유, 의사소통 및 데이터를 축적할 수 있다.In addition, the part-time president has the advantage of being able to improve his ability to measure how much time a part-time worker should be given and to communicate the grievance of the working environment. That is, it is possible to provide information on the urgent amount measurement of companies seeking part-time workers, and to accumulate information sharing, communication, and data of part-time workers.
게다가 작은 데이터 하나하나를 모아 적절하게 분류하여 큰 데이터를 추출함으로써 아르바이트 통계 분석 데이터가 필요한 사용자에게 제공해 줄 수 있다. 예시로 통계학과 또는 빅 데이터 공부 중인 학생들이 사용할 자료가 만들어질 수 있다.In addition, by collecting small data one by one and extracting large data by appropriately sorting it, it is possible to provide the user with the statistical data for the part-time statistics. For example, materials used by students studying statistics or Big Data can be created.
이와 더불어, 선형 회귀 외에 함수 모형 회귀 분석으로 더욱 다양한 분석이 가능해지며, 빅 데이터나 분석 알고리즘을 몰라도 사용자가 데이터를 삽입하여 분석할 수 있는 장점이 있다.In addition to this, it is possible to perform more various analysis by functional regression analysis besides the linear regression, and it is advantageous that the user can insert and analyze data without knowing big data or analysis algorithm.
그리고 구인 구직 사이트에 홍보 및 광고 효과를 가져올 수 있는 장점이 있다.It also has the advantage of bringing publicity and advertising effects to job search sites.
한편, 본 발명의 효과는 상술된 것에 국한되지 않고 후술하는 본 발명의 구성으로부터 도출될 수 있는 다른 효과도 본 발명의 효과에 포함된다.On the other hand, the effects of the present invention are not limited to those described above, and other effects that can be derived from the constitution of the present invention described below are also included in the effects of the present invention.
도 1은 본 발명의 일 실시예에 따른 아르바이트 데이터 제공 시스템의 구성도이다.
도 2 내지 도 11은 본 발명의 일 실시예에 따른 아르바이트 데이터 제공 서비스를 보여주는 화면들이다.1 is a configuration diagram of a part-time data providing system according to an embodiment of the present invention.
2 to 11 are screens showing a service providing service according to an embodiment of the present invention.
그러면 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art can easily carry out the present invention.
도 1은 본 발명의 일 실시예에 따른 아르바이트 데이터 제공 시스템의 구성도를 나타낸다.1 is a block diagram of a part-time data providing system according to an embodiment of the present invention.
도 1에 도시한 바와 같이, 아르바이트 데이터 제공 시스템(1)은 서비스 서버(100), 데이터베이스(200) 및 사용자 단말(300)을 포함하여 여러 가지 아르바이트 분석 정보를 토대로 사용자에게 맞는 아르바이트를 선택할 수 있도록 지원하는 서비스를 제공할 수 있다.As shown in FIG. 1, the part-time
서비스 서버(100)는 데이터 수집부(110), 데이터 분류부(120), 데이터 분석부(130) 및 데이터 출력부(140)를 포함할 수 있다.The
데이터 수집부(110)는 사용자로부터 입력받거나 데이터 크롤링에 의한 웹 페이지의 탐색을 통해 아르바이트 데이터를 수집할 수 있다. The
보다 자세하게는, 데이터 수집부(110)는 사용자 단말(300)을 통해 사용자로부터 직접 아르바이트 데이터를 입력받을 수 있으며, 대량의 아르바이트 데이터를 수집하기 위하여 구인 구직업체에서 제공하는 정보 제공 사이트의 구인 구직 중인 정보들에서 데이터 크롤링 방식으로 아르바이트 데이터를 추출하여 수집할 수 있다. 데이터 크롤링 방식은 웹에 퍼져있는 데이터를 일정한 기준을 두고 텍스트 형태로 추출하여 모으는 것으로, 예컨대, ‘알바천국’의 데이터를 가져와 데이터베이스(200)에 맞게 가공할 수 있다.More specifically, the
데이터 분류부(120)는 수집된 아르바이트 데이터를 미리 정해진 기준에 따라 분류하여 데이터베이스(200)에 저장할 수 있다. 아르바이트 데이터가 분류되어 있지 않으면 시각화 또는 분석에 문제가 생길 수 있으므로 예컨대, 구인 구직 공고를 올리는 사장님이 구인 구직 사이트에 올릴 때 “하루 일급”으로 적어야 하는 돈을 “시급”으로 잘못 체크할 경우 발생되는 문제점을 처리하기 위하여 데이터 분류 작업을 수행할 수 있다.The
이에 따라 데이터 분류부(120)는 예컨대, 카페 아르바이트(레벨 1)= 시급 ~ 10000원, 대형마트 아르바이트(레벨 2)= 시급 ~ 15000원과 같이, 아르바이트별로 레벨을 두고 범위를 정하여 아르바이트 데이터를 걸러낼 수 있다.Accordingly, the
데이터 분석부(130)는 아르바이트 데이터를 함수 모형 분석 알고리즘에 따라 분석하여 아르바이트 통계 분석 데이터를 생성할 수 있다. 즉 분석 기법 중 선형 회귀(Linear Regression) 문제를 모티브로 분석 알고리즘을 설계하였는데, 데이터 분석부(130)는 선형 회귀 분석 알고리즘을 2차 함수 모형, 3차 함수 모형으로 변형하여 아르바이트 데이터들의 분포에 가장 적합한 함수 모형을 자동으로 선정하도록 구현될 수 있다. 기존에는 단순히 key 값에 따른 value 값의 평균으로 분석하였다면, 본 발명의 일 실시예에서는 추가로 기계 학습을 통한 분석까지 이루어질 수 있다.The
데이터 분석부(130)는 아르바이트 변수에 대한 상관관계를 검출하기 위하여 함수 모형을 선정하여 분석을 수행할 수 있는데, 예컨대, 경력에 따른 시급 분석의 경우 경력에 따라 시급이 줄어들고 있는 구간이 발생한다면 데이터의 신뢰도가 매우 떨어질 수 있으므로 경력에 따라 시급이 지속적으로 증가 또는 그대로(단조 증가) 유지되도록 해야 한다. 따라서 데이터 분석부(130)는 아르바이트 변수 간의 관계를 추측하고 추측된 결과에 가장 적합한 함수 모형을 선정하여 분석함으로써 분석 결과의 신뢰성을 높일 수 있다.The
함수 모형 분석 알고리즘은 선형 함수 모형 외에 2차 함수 모형, 3차 함수 모형 또는 함수 모형 회귀 분석 알고리즘 등을 포함할 수 있다. 선형 함수 모형 분석 알고리즘은 일반적인 선형 회귀 분석을 기계 학습을 통해 구현한 방식이고, 2차 함수 모형 분석 알고리즘은 선형 회귀를 변형하여 2차 함수 모형으로 기계 학습시켜 분석하는 방식으로, 모든 데이터의 분포를 선형적으로만 분석하게 된다면 문제가 있다고 보기 때문에 비선형적인 모델로 분석하기 위해 정의역이 주어진 전사함수를 선정하게 되고 가장 일반적인 함수들을 채택하는 것이다. 3차 함수 모형 분석 알고리즘은 선형 회귀를 변형하여 단조 증가하는 3차 함수 모형으로 기계 학습시켜 분석하는 방식이고, 함수 모형 회귀 분석 알고리즘은 데이터들을 선형, 2차 모형, 단조 증가 3차 모형들로 각각 분석해보고 그 중에서 데이터 분포에 가장 적합하다고 판정되는 것을 출력하는 방식이다. The function model analysis algorithm can include a linear function model, a quadratic function model, a cubic function model, or a function model regression analysis algorithm. The linear function model analysis algorithm is a method in which a general linear regression analysis is implemented through machine learning. The quadratic function model analysis algorithm is a method in which a linear regression is modified to perform a machine learning with a quadratic function model. If we analyze only linearly, we consider that there is a problem, so we select the given transfer functions for domain nonlinear models and adopt the most general functions. The third-order function model analysis algorithm is a method of analyzing machine-learning by a monotone increasing cubic function model by modifying the linear regression. The function model regression analysis algorithm uses data of linear, quadratic, and monotone increasing cubic models Analyze and output the data that is determined to be most suitable for data distribution among them.
그리고 데이터 분석부(130)는 함수 모형 회귀 분석 알고리즘과 함께 극값 데이터마이닝 알고리즘을 이용한 분석을 통해 사용자의 아르바이트 예측 데이터를 생성할 수 있도록 한다. 예컨대, 사용자가 입력한 데이터를 기초로 분석 및 예측할 수 있는 기능을 제공할 수 있다. 즉 함수 모형 회귀 분석 알고리즘과 함께 극값을 이용한 데이터 분석 기법을 추가로 설계하여 자신이 임의의 데이터를 입력하여 분석할 수 있는 분석기를 제공할 수 있다. 극값 데이터마이닝 알고리즘에서 데이터 간의 “극값”이란 매우 중요한 정보로 사용이 가능하기 때문에 극값들의 주기를 분석하여 다음에 일어날 극값이 언제 일어날지 분석하는 기법을 말한다. 극값 데이터마이닝 알고리즘은 기울기를 이용한 극값 데이터마이닝과, 선형 회귀를 이용한 극값 데이터마이닝이 있는데, 기울기를 이용한 극값 데이터마이닝은 각 key 값에 따른 value 값들의 평균을 내어 그 평균값들 중 ‘극값’이라고 생각되는 평균값만 뽑아내 가장 최근 바로 전 구간의 기울기와 과거의 기울기를 통하여 유사한 구간을 찾아내고 다음번 극값이 언제 일어날지를 추측하여 추가한 뒤 3차 함수의 미적분을 통하여 연결한 모형이다. 선형 회귀를 이용한 극값 데이터마이닝은 각 key 값에 따른 value 값들의 평균을 내어 그 평균값들 중 ‘극값’이라고 생각되는 평균값만 뽑아내 가장 최근 바로 전 극값과 선형 회귀 분석과의 차이와 과거의 극값과 선형 회귀 분석과의 차이를 비교하여 유사한 위치를 찾아내고 다음 차례의 극값이 언제 일어날지를 추측하여 추가한 뒤 3차 함수의 미적분을 통하여 연결한 모형이다.The
한편, 대량의 아르바이트 데이터를 사용자들이 이용할 때마다 분석하게 되면 매우 비효율적이므로 캐싱 방식(Cashing, 영속화)을 이용하여 서비스 서버(100)에서 주기적으로 분석기를 실행하고 그 결과를 데이터베이스(200)의 캐싱 테이블에 저장하여 저장된 분석 결과만 사용자들에게 제공하는 방식을 이용하여 빠른 분석 결과를 제공할 수 있다. 분석기로는 예컨대, HeartbeatMessage 클래스(자바 어플리케이션과의 통신)를 이용하여 Threed로 사용자의 데이터를 받아내 체크하여 분석하고 결과를 저장하여 사용자가 들어올 때 테이블을 감량하여 하나의 함수 클래스로 변형하여 사용자들에게 보여줄 수 있다. 이는 최초 1회만 실시하여 서비스 서버의 과부하 부담을 매우 덜어줄 수 있다.On the other hand, it is very inefficient to analyze a large amount of part-time data every time a user uses the service. Therefore, the
데이터 출력부(140)는 데이터 분석부(130)에서 생성된 아르바이트 통계 분석 데이터를 사용자 단말(300)에 전송하여 사용자 단말(300)의 화면에 표시되게 할 수 있다. 데이터 출력부(140)는 분석된 다양한 결과를 시각화하여 사용자 단말(300)에 전송함으로써 사용자가 확인할 수 있도록 한다.The
데이터베이스(200)는 캐싱 테이블이 구비되고, 캐싱 테이블에 아르바이트 통계 분석 데이터가 저장될 수 있다. 예컨대, 캐싱 테이블은 수집된 아르바이트 데이터의 양이 1000000개라 하면 그것을 사용자들이 ‘새로 고침’할 때마다 알고리즘을 돌려 분석하고 시각화하게 되면 서비스 서버(100)의 과부하가 일어날 가능성이 높기 때문에 주기적으로 아르바이트 데이터를 분석하고 그 결과를 캐싱 테이블에 저장하여 과부하를 방지할 수 있다.The
사용자 단말(300)은 통신망(10)을 통해 서비스 서버(100)와 연결되어 각종 정보 및 데이터를 교환할 수 있다.The
여기서, 통신망(10)은 구내 정보 통신망(Local Area Network, LAN), 도시권 통신망(Metropolitan Area Network, MAN), 광역 통신망(Wide Area Network, WAN), 인터넷(internet), 3G(generation)/4G(generation) 이동통신망, 와이파이(Wi-Fi), WIBRO(Wireless Broadband Internet) 또는 LTE(Long Term Evolution) 등을 포함하는 각종 데이터 통신망을 포함할 수 있고, 유선과 무선을 가리지 않으며 어떠한 통신 방식을 사용하더라도 상관없다.Here, the
사용자 단말(300)은 스마트폰(Smart Phone), 태블릿(Tablet) PC, 개인 휴대 정보 단말기(Personal Digital Assistant, PDA)나 웹 패드(Web Pad) 등과 같이 메모리 수단을 구비하고 마이크로프로세서를 탑재하여 연산 능력을 갖춘 이동 통신 기능을 구비한 단말로 이루어질 수 있다. The
특히, 본 발명의 일 실시예에 따른 사용자 단말(300)은 서비스 어플리케이션이 설치될 수 있다. 서비스 어플리케이션은 여러 가지 아르바이트 통계 분석 데이터를 토대로 사용자에게 맞는 아르바이트를 선택할 수 있는 서비스를 지원할 수 있다. In particular, the
사용자는 해당 서비스를 제공 받기 위하여 사용자 단말(300)을 통해 회원 가입 절차를 수행할 수 있다. 회원 가입 절차를 수행하거나 수행한 후에 사용자 단말(300)은 서비스 어플리케이션의 설치를 위한 URL(Uniform Resource Locator)을 제공 받고, 이를 이용하여 서비스 어플리케이션을 설치할 수 있다. 그런 후 서비스 어플리케이션을 실행한 후 로그인을 수행할 수 있다.The user can perform the membership subscription procedure through the
서비스 어플리케이션은 사용자가 자신의 아르바이트 데이터를 입력하기 위한 사용자 입력 화면을 사용자 단말(300)의 화면에 출력할 수 있다. 그리고 서비스 어플리케이션은 서비스 서버(100)에서 생성된 아르바이트 통계 분석 데이터를 사용자 단말(300)에 출력할 수 있으며, 사용자가 선택한 우선순위에 따라 정렬한 아르바이트 데이터를 보여줄 수 있도록 구성될 수 있다.The service application may output a user input screen for inputting the user's own job data to the screen of the
서비스 어플리케이션은 아르바이트 데이터를 극값 데이터마이닝 알고리즘에 따라 분석하여 생성된 사용자의 아르바이트 예측 데이터를 사용자 단말(300)에 출력할 수 있다. The service application can analyze the part-time data according to the extreme value data mining algorithm and output the generated part-time prediction data of the user to the
이하에서는 본 발명의 일 실시예에 따른 아르바이트 데이터 제공 시스템의 동작 과정에 대하여 설명하도록 한다.Hereinafter, an operation procedure of a part-time data providing system according to an embodiment of the present invention will be described.
도 2 내지 도 11은 본 발명의 일 실시예에 따른 아르바이트 데이터 제공 서비스를 보여주는 화면들을 나타낸다.FIGS. 2 to 11 show screens illustrating a service providing service according to an embodiment of the present invention.
도 2를 참조하면, 대량의 아르바이트 데이터를 수집하기 위하여 구인 구직업체에서 제공하는 정보 제공 사이트에서 구인 구직 중인 정보들에서 데이터 크롤링 방식을 사용하여 아르바이트 데이터를 추출할 수 있다.Referring to FIG. 2, in order to collect a large amount of part-time data, it is possible to extract the part-time data by using the data crawling method in the information being searched for at the information providing site provided by the job seeking company.
도 3과 같이, 사용자로부터 아르바이트 데이터를 직접 입력받기 위하여 사용자 입력 화면이 제공될 수 있다. 이때 정보의 기각 범위를 설정하여 잘못된 정보라고 판단되면 기각 테이블에 별도로 저장될 수 있다.As shown in FIG. 3, a user input screen may be provided for directly inputting the byte data from the user. At this time, the rejection range of the information is set, and if it is judged to be erroneous information, it can be separately stored in the rejection table.
도 4와 같이, 다양한 변수에 대하여 다양한 함수 형태로 분석하고, 사용자의 정보를 입력받아 분석 결과와 비교할 수 있다. 이때 다양한 변수를 선택하여 시각화함으로써 두 변수 간의 상관관계도 도출할 수 있다.As shown in FIG. 4, various types of functions can be analyzed in various functional forms, and the user's information can be input and compared with the analysis result. In this case, the correlation between two variables can be derived by visualizing various variables.
도 5와 같이, 아르바이트별로 우선순위를 정하고 정렬하여 자신의 원하는 순서대로 아르바이트 데이터를 볼 수 있는데, 예컨대, 시급 순으로 정렬하게 되면 시급이 높은 아르바이트 순서대로 아르바이트 데이터를 출력할 수 있다. 즉 사용자가 우선순위로 두고 싶은 속성을 선택하면 그 속성을 기준으로 자동으로 아르바이트 데이터가 출력될 수 있다.As shown in FIG. 5, the user can view the byte data in the order of his / her preference by arranging and prioritizing them by the partitions. For example, if the words are sorted in order of urgency, byte data can be outputted in the order of high byte. That is, if the user selects an attribute to be prioritized, the part-time data can be automatically output based on the attribute.
도 6은 사용자들이 직접 체험할 수 있는 데이터 분석 화면으로서, 선형 회귀 문제를 토대로 데이터마이닝 기법을 분석하여 선형 함수 모형, 2차 함수 모형 또는 3차 함수 모형 등으로 각각 분석해보는 함수 모형 데이터마이닝 기법과 극값을 이용한 데이터마이닝 기법을 설계하여 사용자가 입력한 데이터로 분석할 수 있다. 예컨대, 자신의 매월 수익을 입력하여 다음 달에 얼마의 수익이 있을지 예측 가능하다. FIG. 6 is a data analysis screen that users can directly experience. Data mining techniques based on linear regression are analyzed and analyzed using a linear function model, a quadratic function model, or a cubic function model. Data mining techniques using extreme values can be designed and analyzed with user input data. For example, it is possible to predict how much profit will be made in the next month by inputting his or her monthly profit.
그리고 웹 페이지에서 작동하는 분석기를 설계할 때 서비스 서버(100)의 과부하 문제를 막기 위해 사용자가 데이터를 보내면 자바 어플리케이션인 HeartbeatMessage 클래스가 1초 간격으로 체크하며 대기하다가 사용자에게 데이터가 들어오면 최초 1회 알고리즘 계산을 하고 결과를 테이블에 저장하여 테이블 Reduce를 통해 함수로 바꾸어 결과만 출력해주는 방식을 사용할 수 있다.When designing an analyzer operating on a web page, in order to prevent an overload problem of the
도 7은 사용자의 데이터를 텍스트로 구분자(,)로 데이터를 삽입하기 위한 기능을 제공하는 화면으로서, 예컨대, 통계학과 학생들 또는 빅 데이터를 공부하는 학생들은 보통 구분자(,)로 구분하는 파일을 가지고 있다. 따라서 속성을 구분자(,)로 구분하여 자신의 테이블에 삽입할 수 있는 기능을 제공할 수 있다.FIG. 7 is a screen for providing a function for inserting data into a text (for example, a user's data). For example, a student who studies statistics and students or big data usually has a file that is divided into delimiters . Therefore, it is possible to provide a function of inserting the attributes into their own tables by dividing them by delimiters (,).
도 8과 같이, 테이블에 저장된 결과를 Reduce하고 분석 결과 함수로 변형하여 f(x)의 x값에 숫자를 대입하면 자바 스크립트로 값을 추출할 수 있다. As shown in FIG. 8, if the result stored in the table is reduced and transformed into an analysis result function, a value can be extracted by JavaScript by assigning a number to the x value of f (x).
도 9와 같이, 최대 3개의 저장 테이블을 사용할 수 있으며 그것을 테이블로 시각화할 수 있다. 예시로 자신의 ‘매달 순수익’ 같은 데이터를 삽입하여 다음 달에는 얼마의 수익을 받을지 추측 가능하다.As shown in FIG. 9, a maximum of three storage tables can be used and it can be visualized as a table. For example, you can insert data such as your 'monthly net income' to estimate how much you will receive next month.
도 10과 같이, 자신의 데이터를 전체 비우거나 선택하여 삭제할 수 있는데, 이때 선택하여 삭제하였을 경우 남은 데이터로 분석을 다시 하여 결과를 저장할 수 있다.As shown in FIG. 10, it is possible to completely empty or select and delete the data. If the data is selected and deleted at this time, analysis can be performed again with the remaining data and the result can be stored.
도 11과 같이, 사용자들에게 수집된 데이터 파일을 공유할 수 있는데, 수집된 데이터 파일을 텍스트 파일로 저장하고 구분자로 두어 아르바이트 데이터를 사용해야 하는 사람들에게 제공할 수 있다.As shown in FIG. 11, the collected data files can be shared with users. The collected data files can be stored as a text file and can be provided as a separator to those who need to use the byte data.
게다가 아르바이트 구인 구직 사이트를 소개하거나 링크 연결할 수 있다. 그리고 댓글 창을 구현하여 종목에 따른 사용자들 간의 다양한 의견을 자유롭게 소통이 가능하며 분석 결과로는 얻을 수 없는 정보들을 얻을 수 있게 한다.In addition, you can introduce or link to a job site that is a part-time job. And by implementing the comment window, it is possible to freely communicate various opinions among the users according to the events, and to obtain information that can not be obtained from the analysis results.
이상에서 본 발명의 바람직한 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, Of the right.
1: 아르바이트 데이터 제공 시스템
100: 서비스 서버
110: 데이터 수집부
120: 데이터 분류부
130: 데이터 분석부
140: 데이터 출력부
200: 데이터베이스
300: 사용자 단말1: Part time data providing system
100: service server
110: Data collecting unit
120:
130: Data analysis section
140: Data output section
200: Database
300: user terminal
Claims (5)
상기 수집된 아르바이트 데이터를 함수 모형 분석 알고리즘에 따라 분석하여 아르바이트 통계 분석 데이터를 생성하는 데이터 분석부, 그리고
상기 생성된 아르바이트 통계 분석 데이터를 사용자 단말에 전송하여 상기 사용자 단말의 화면에 표시되게 하는 데이터 출력부를 포함하는 서비스 서버
를 포함하는 아르바이트 데이터 제공 시스템.
A data collecting unit for collecting part-time data by receiving input from a user or searching a web page by data crawling,
A data analysis unit for analyzing the collected part-time data according to a function model analysis algorithm to generate a part-time statistical analysis data, and
And a data output unit for transmitting the generated statistical analysis data to the user terminal and displaying the data on the screen of the user terminal.
And a part-time data providing system.
상기 데이터 분석부는,
상기 수집된 아르바이트 데이터를 함수 모형 분석 알고리즘에 따라 분석하여 아르바이트의 변수에 대한 상관관계를 검출하고, 상기 아르바이트의 변수에 대한 상관관계가 포함된 상기 아르바이트 통계 분석 데이터를 생성하는 아르바이트 데이터 제공 시스템.
The method of claim 1,
The data analysis unit may include:
Analyzing the collected part-time data according to a function model analysis algorithm to detect a correlation with a variable of a part-time job, and generating the part-time statistical analysis data including a correlation with a variable of the part-time job.
상기 데이터 분석부는,
상기 수집된 아르바이트 데이터를 극값 데이터마이닝 알고리즘에 따라 분석하여 사용자의 아르바이트 예측 데이터를 생성하고,
상기 데이터 출력부는,
상기 생성된 사용자의 아르바이트 예측 데이터를 상기 사용자 단말에 전송하는 아르바이트 데이터 제공 시스템.
3. The method of claim 2,
The data analysis unit may include:
Analyzing the collected byte data according to an extreme value data mining algorithm to generate user's part prediction data,
Wherein the data output unit comprises:
And transmitting the part-time predicted data of the user to the user terminal.
상기 수집된 아르바이트 데이터를 미리 정해진 기준에 따라 분류하여 데이터베이스에 저장하는 데이터 분류부를 더 포함하는 아르바이트 데이터 제공 시스템. The method of claim 1,
And a data classifier for classifying the collected part-time data according to a predetermined criterion and storing the classified part-time data in a database.
상기 데이터베이스는,
캐싱 테이블이 구비되고,
상기 캐싱 테이블에 상기 분석된 아르바이트 통계 분석 데이터가 저장되는 아르바이트 데이터 제공 시스템.
5. The method of claim 4,
The database includes:
A caching table is provided,
And the analyzed parted statistical analysis data is stored in the caching table.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170173646A KR20190072360A (en) | 2017-12-15 | 2017-12-15 | System for Providing Arbeit Data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170173646A KR20190072360A (en) | 2017-12-15 | 2017-12-15 | System for Providing Arbeit Data |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190072360A true KR20190072360A (en) | 2019-06-25 |
Family
ID=67065666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170173646A KR20190072360A (en) | 2017-12-15 | 2017-12-15 | System for Providing Arbeit Data |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20190072360A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220141167A (en) * | 2021-04-12 | 2022-10-19 | 오승용 | Matching system for 24 hours part-time job |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150110010A (en) | 2014-03-22 | 2015-10-02 | 원투씨엠 주식회사 | Method for Managing Hourly Wage Arbeit by using Touch Module |
-
2017
- 2017-12-15 KR KR1020170173646A patent/KR20190072360A/en not_active Application Discontinuation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150110010A (en) | 2014-03-22 | 2015-10-02 | 원투씨엠 주식회사 | Method for Managing Hourly Wage Arbeit by using Touch Module |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220141167A (en) * | 2021-04-12 | 2022-10-19 | 오승용 | Matching system for 24 hours part-time job |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gozhyj et al. | Web resources management method based on intelligent technologies | |
Lu et al. | The emergence of opinion leaders in a networked online community: A dyadic model with time dynamics and a heuristic for fast estimation | |
Di Lorenzo et al. | Allaboard: Visual exploration of cellphone mobility data to optimise public transport | |
Çavdar et al. | Airline customer lifetime value estimation using data analytics supported by social network information | |
Wongcharoen et al. | Twitter analysis of road traffic congestion severity estimation | |
Kaußen | Landscape Perception and Construction in SocialMedia: An Analysis of User-generated Content | |
Thompson | Modeling wildfire incident complexity dynamics | |
Bildosola et al. | An approach for modelling and forecasting research activity related to an emerging technology | |
JP2015191333A (en) | Detection device, detection method, and detection program | |
Karamoozian et al. | Risk assessment of occupational safety in construction projects using uncertain information | |
KR20190072360A (en) | System for Providing Arbeit Data | |
Fasel et al. | A fuzzy data warehouse approach for web analytics | |
Brandl et al. | AMICAI: a method based on risk analysis to integrate responsible research and innovation into the work of research and innovation practitioners | |
Fahmi et al. | Mining social media (twitter) data for corporate image analysis: a case study in the indonesian mining industry | |
KR20160093489A (en) | Content collection and recommendation system and method | |
KR101883314B1 (en) | Apparatus and Method for Analyzing Data using R Association Rule and collaborative filtering | |
Cerone | Process mining as a modelling tool: Beyond the domain of business process management | |
Algamdi et al. | A trust evaluation method based on the distributed cloud trust protocol (CTP) and opinion sharing | |
Teixeira et al. | Proposal for sustainable smart city indicators | |
KR102099560B1 (en) | System for providing research paper consulting service with contents of surveying organization, survey conducting, and data analysis | |
Caylor et al. | Preliminary evaluation of multi-criteria decision-making methodology for emergency management | |
Binatti et al. | Latin American bike sharing ecosystem overview: from data collection to implementation model portraits | |
Ramanathan et al. | Apply of sum of difference method to predict placement of students’ using educational data mining | |
Rath et al. | Low-level event relationship discovery for knowledge work support | |
JP2006215798A (en) | Task analysis/management support administrative device, task analysis/management support administrative method and task analysis/management support administrative program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |