KR102543428B1 - System and method for providing average salary information of each company using public data - Google Patents
System and method for providing average salary information of each company using public data Download PDFInfo
- Publication number
- KR102543428B1 KR102543428B1 KR1020210140209A KR20210140209A KR102543428B1 KR 102543428 B1 KR102543428 B1 KR 102543428B1 KR 1020210140209 A KR1020210140209 A KR 1020210140209A KR 20210140209 A KR20210140209 A KR 20210140209A KR 102543428 B1 KR102543428 B1 KR 102543428B1
- Authority
- KR
- South Korea
- Prior art keywords
- average annual
- annual salary
- data
- company
- age
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000012937 correction Methods 0.000 claims abstract description 32
- 238000004364 calculation method Methods 0.000 claims description 26
- 238000004891 communication Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000007639 printing Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
- G06Q10/1057—Benefits or employee welfare, e.g. insurance, holiday or retirement packages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
- G06Q10/06375—Prediction of business process outcome or impact based on a proposed change
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
공공기관 데이터를 활용하여 기업별 평균 연봉 정보를 제공하는 방법에 관한 기술이 개시된다. 데이터베이스에 해당 기업의 공시데이터가 있는 경우 공시데이터로부터 평균 연봉을 추출하고, 공시데이터가 없는 경우 국민연금데이터로부터 평균연봉을 계산한다. 평균 연봉 계산시 보정함수를 적용하여 정확한 평균 연봉 정보를 제공할 수 있다. 공공기관과 이력서에서 얻은 통계데이터를 이용하여 연령별, 직종별 평균 연봉 정보를 추가로 제공할 수 있다.Disclosed is a technique for providing average annual salary information for each company using public institution data. If there is disclosure data of the company in the database, the average annual salary is extracted from the disclosure data, and if there is no disclosure data, the average annual salary is calculated from the national pension data. When calculating the average annual salary, a correction function may be applied to provide accurate average annual salary information. Using statistical data obtained from public institutions and resumes, average annual salary information by age and occupation can be additionally provided.
Description
데이터 처리 기술, 특히 공공기관 데이터를 활용하여 기업별 평균 연봉 정보를 제공하는 방법에 관한 데이터 처리 기술이 개시된다.Data processing technology, in particular, a data processing technology related to a method of providing average annual salary information for each company by using public institution data is disclosed.
정보통신 기술의 발달에 따라, 구인구직을 위한 정보를 제공하는 서비스도 증가하고 있다. 구인구직 사이트에서는 채용 공고 정보뿐만 아니라, 해당 기업의 기본 정보를 추가로 제공하여 구직자들이 해당 채용 공고에 지원할지 여부를 선택하는데 활용되도록 하고 있다. With the development of information and communication technology, services providing information for job seekers are also increasing. Job search sites provide not only information on job postings, but also basic information about the company so that job seekers can use them to choose whether or not to apply for the job posting.
구직자들이 취업할 기업을 선택할 때 중요하게 고려하는 항목 중의 하나가 해당 기업의 평균 연봉이다. 따라서 대부분의 구인구직 사이트에서는 취업 공고시 해당 기업의 연봉 정보도 함께 제공하고 있다. 공시대상 기업의 경우 평균 연봉이 공시되기 때문에 각 기업별 평균 연봉 데이터를 구할 수 있다. One of the most important items that job seekers consider when choosing a company to work for is the average annual salary of the company. Therefore, most job search sites also provide information on the company's annual salary when posting a job. In the case of companies subject to disclosure, since the average annual salary is disclosed, average annual salary data for each company can be obtained.
공시되지 않는 기업의 경우, 구직자 또는 재직자들이 입력한 이력서 정보 등에서 평균 연봉을 산출할 수 있다. 그러나, 입력된 데이터가 적은 경우 또는 연봉 변동이 심한 경우에는 정확한 연봉을 산출하는 것이 어렵다. In the case of companies that are not publicly disclosed, the average annual salary can be calculated from resume information entered by job seekers or current employees. However, it is difficult to calculate an accurate annual salary when the input data is small or when the annual salary fluctuates greatly.
2001.11.08.에 공개된 공개특허 특2001-0097430호는 인터넷상에서 개인의 경력을 중심으로 능력과 가치를 측정하고 연봉을 산출하여 회원에게 서비스하는 연봉평가 시스템에 관한 것으로, 입력 항목별 가중치를 적용하여 연봉을 구하는 방법을 개시하고 있다.Patent Publication No. 2001-0097430, published on November 8, 2001, relates to a salary evaluation system that measures skills and values based on individual careers on the Internet, calculates annual salary, and provides service to members. It shows you how to calculate your salary.
2020.11.12.에 공고된 등록특허 제10-2177604호는 연봉 예측 장치 및 방법에 관한 것으로, 제1 연봉 산출 자료를 입력받아 산출한 제1 예측 연봉을 제1 신뢰도와 함께 사용자에게 제시하고, 추가로 제2 연봉 산출자료를 입력받아 제2 예측 연봉을 산출하여 제공하는 방법을 개시하고 있다.Registered Patent No. 10-2177604 published on November 12, 2020 relates to an annual salary prediction device and method, and presents the first predicted annual salary calculated by receiving the first annual salary calculation data to the user along with the first reliability, and adds A method of receiving second annual salary calculation data as input and calculating and providing a second predicted annual salary is disclosed.
그러나, 상기 선행기술들은 각 개인의 경력 등의 정보를 입력 받아 각 개인에 대한 연봉을 예측하는 것으로, 구직자들에게 필요한 기업별 평균 연봉 정보를 제공하지 않고 있다.However, the prior art predicts the annual salary of each individual by receiving information such as the career of each individual, and does not provide job seekers with the average annual salary information for each company.
제안된 발명은 공공기관의 데이터를 이용하여 각 기업별 평균 연봉을 정확하게 예측하는 시스템 및 방법을 제공하는 것을 목적으로 한다. The proposed invention aims to provide a system and method for accurately predicting the average annual salary for each company using data from public institutions.
나아가 제안된 발명은 각 기업의 연령별 평균 연봉 정보와, 직종별 평균 연봉 정보를 함께 제공할 수 있는 시스템 및 방법을 제공하는 것을 목적으로 한다.Furthermore, an object of the proposed invention is to provide a system and method capable of providing information on average annual salary by age of each company and information on average annual salary by job category together.
제안된 발명의 일 양상에 따르면, 공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 방법은, 공공기관 데이터가 저장된 데이터베이스와 통신 인터페이스를 통해 연결되는 프로세서에서 실행 가능하다. 상기 방법은, 입력 장치로부터 평균 연봉 정보를 제공받기 원하는 기업의 기업정보를 입력 받는 단계와, 상기 데이터베이스에서 상기 기업에 대한 공시데이터를 조회하는 단계와, 상기 공시데이터가 존재하는 경우 상기 공시데이터로부터 상기 기업의 공시데이터 기반 평균 연봉을 추출하는 단계와, 상기 공시데이터가 존재하지 않는 경우 상기 데이터베이스에서 상기 기업에 대한 국민연금데이터를 조회하는 단계와, 상기 국민연금데이터 조회결과 국민연금데이터가 존재하는 경우 상기 국민연금데이터로부터 상기 기업의 국민연금 기반 평균 연봉을 계산하는 단계와, 출력장치로 상기 기업에 대한 공시데이터 기반 평균 연봉 또는 국민연금 기반 평균 연봉을 포함하는 평균 연봉 정보를 출력하는 단계를 포함한다.According to one aspect of the proposed invention, a method of providing average annual salary information for each company using public institution data can be executed in a processor connected to a database in which public institution data is stored through a communication interface. The method includes the steps of receiving corporate information of a company for which average annual salary information is to be provided from an input device, retrieving public announcement data about the company from the database, and, if the public announcement data exists, from the public announcement data. Extracting the average annual salary based on the company's public data; and, if the public data does not exist, searching for national pension data for the company in the database, and as a result of the national pension data inquiry, national pension data exists In this case, calculating the average annual salary based on the national pension of the company from the national pension data, and outputting average annual salary information including the average annual salary based on the public data for the company or the average annual salary based on the national pension to an output device. do.
추가적인 양상에 따르면, 상기 기업의 국민연금 기반 평균 연봉을 계산하는 단계는, 상기 국민연금데이터로부터 가입자수 정보와 당월 고지금액 정보를 추출하는 단계와, 상기 당월 고지금액에 해당하는 임금을 상기 가입자수로 나누어 상기 기업의 추정 평균 연봉을 계산하는 단계와, 상기 기업의 추정 평균 연봉에 보정함수를 적용하여 상기 기업의 국민연금 기반 평균 연봉을 구하는 단계를 포함할 수 있다.According to an additional aspect, the step of calculating the average annual salary based on the national pension of the company includes: extracting information on the number of subscribers and information on the amount of notice for the current month from the national pension data; Calculating an estimated average annual salary of the company by dividing by , and obtaining a national pension-based average annual salary of the company by applying a correction function to the estimated average annual salary of the company.
추가적인 양상에 따르면, 상기 방법은, 복수 기업들에 대하여, 공시데이터에서 추출한 공시데이터 기반 평균 연봉과 국민연금데이터로부터 계산된 국민연금 기반 추정 평균 연봉을 매칭시켜, 상기 복수 기업들의 평균 연봉 데이터 쌍의 집합을 구하는 단계와, 상기 복수 기업들의 평균 연봉 데이터 쌍의 집합을 이용하여 공시데이터 기반 평균 연봉과 국민연금 기반 추정 평균 연봉의 상관관계에서 상기 보정함수를 구하는 단계를 더 포함할 수 있다.According to an additional aspect, the method matches the average annual salary based on the public announcement data extracted from the public announcement data and the estimated average annual salary based on the national pension calculated from the national pension data for the plurality of companies, The method may further include obtaining a set and obtaining the correction function from a correlation between an average annual salary based on public announcement data and an estimated average annual salary based on the national pension using the set of average annual salary data pairs of the plurality of companies.
추가적인 양상에 따르면, 상기 보정함수를 구하는 단계는, 상기 복수 기업들의 평균 연봉 데이터 쌍의 집합에서 이상치를 제거하는 단계와, 상기 이상치가 제거된 복수 기업들의 평균 연봉 데이터 쌍의 집합에서 국민연금 기반 추정 평균 연봉이 공시데이터 기반 평균 연봉보다 큰 데이터를 삭제하여 복수 기업의 트리밍된 평균 연봉 데이터 쌍의 집합을 구하는 단계와, 상기 복수 기업의 트리밍된 평균 연봉 데이터 쌍의 집합에서 회귀함수를 구하는 단계를 포함할 수 있다.According to an additional aspect, the obtaining of the correction function may include removing an outlier from the average annual salary data pair set of the plurality of companies, and estimating the national pension based on the average annual salary data pair set of the plurality of companies from which the outlier has been removed. Deleting data whose average annual salary is greater than the average annual salary based on published data to obtain a set of trimmed average annual salary data pairs of multiple companies, and obtaining a regression function from the set of trimmed average annual salary data pairs of multiple companies can do.
추가적인 양상에 따르면, 상기 기업정보는 사업자등록번호를 포함하고, 상기 방법은 상기 사업자등록번호로부터 법인사업자 여부 판단하는 단계를 더 포함할 수 있다.According to a further aspect, the business information may include a business registration number, and the method may further include determining whether the business is a corporate business from the business registration number.
추가적인 양상에 따르면, 상기 방법은, 상기 데이터베이스에서 상기 기업이 속하는 산업의 연령별 근로자수 및 임금총액 통계데이터를 조회하는 단계와, 상기 기업의 각 연령()별 평균 연봉()을 다음 수학식 1에 따라 구하는 단계를 더 포함할 수 있다.According to a further aspect, the method comprises the steps of: querying statistical data on the number of workers and total wages by age of the industry to which the company belongs, in the database; and each age of the company ( ) average annual salary by ( ) may be further included according to Equation 1 below.
[수학식 1][Equation 1]
여기에서, 는 연령이고, 은 통계데이터의 최저 연령이고, 는 통계데이터의 최고 연령이고, 는 상기 기업의 연령의 평균 연봉이고, 는 상기 기업의 평균 연봉이고, 는 상기 통계데이터의 연령의 월임금 총액이고, 는 상기 통계데이터의 연령의 근로자수이다.From here, is the age, is the minimum age of statistical data, is the highest age of statistical data, is the company's is the average annual salary for the age is the average annual salary of the company, is the statistical data is the total monthly wage for the age, is the statistical data is the number of workers by age.
추가적인 양상에 따르면, 상기 방법은, 상기 데이터베이스에서 상기 기업에 대한 이력서 정보를 조회하여 상기 기업의 연령별 직종별 평균 연봉 및 인원수에 대한 통계데이터를 추출하는 단계와, 상기 기업의 각 연령()별 직종()별 평균 연봉()을 다음 수학식 2에 따라 구하는 단계를 더 포함할 수 있다.According to a further aspect, the method includes the steps of: querying resume information about the company from the database and extracting statistical data on the average annual salary and number of employees by age and occupation of the company; each age of the company ( ) by job type ( ) average annual salary by ( ) may be further included according to Equation 2 below.
[수학식 2][Equation 2]
여기에서, 는 연령이고, 은 통계데이터의 최저 연령이고, 는 통계데이터의 최고 연령이고, 는 직종이고, 는 상기 기업의 연령 직종의 평균 연봉이고, 는 상기 기업의 평균 연봉이고, 는 상기 통계데이터의 연령 직종의 평균 연봉이고, 는 상기 통계데이터의 연령 직종의 인원수이다.From here, is the age, is the minimum age of statistical data, is the highest age of statistical data, is the occupation, is the company's age The average salary for the occupation is is the average annual salary of the company, is the statistical data age The average salary for the occupation is is the statistical data age is the number of people in the occupation.
제안된 발명에 따라, 공시데이터가 없는 기업의 경우에도 국민연금데이터를 이용하여 평균 연봉을 정확히 예측할 수 있다. 특히 공시데이터 기반 평균 연봉과 국민연금 기반 추정 평균 연봉 사이의 상관관계를 이용한 보정함수를 적용하여 보다 정확하게 국민연금 기반 평균 연봉을 계산할 수 있다.According to the proposed invention, the average annual salary can be accurately predicted using the national pension data even in the case of a company without public data. In particular, the average annual salary based on the national pension can be calculated more accurately by applying a correction function using the correlation between the average annual salary based on the public information and the estimated average annual salary based on the national pension.
각 기업의 연도별 평균 연봉 정보와 통계데이터를 이용하여 각 기업의 연령별, 직종별 평균 연봉 정보를 생성하여, 기업별 평균 연봉 정보를 다양한 형태로 제공할 수 있다.Average annual salary information for each company by year and statistical data are used to generate average annual salary information for each company by age and job category, and the average annual salary information for each company can be provided in various forms.
도 1은 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템과 공공기관 데이터 서버가 네트워크에 연결된 상태를 나타내는 구성도이다.
도 2는 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 기업정보를 처리하는 방법을 나타내는 순서도이다.
도 3은 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 기업별 평균 연봉을 결정하는 방법을 나타내는 순서도이다.
도 4는 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 기업별 평균 연봉을 이용하여 다양한 평균 연봉 정보를 생성하는 방법을 나타내는 순서도이다.
도 5는 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 국민연금 기반 평균 연봉을 계산하는 방법을 나타내는 순서도이다.
도 6은 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 국민연금 기반 추정 평균 연봉을 보정하는 보정함수를 구하는 방법을 나타내는 순서도이다.
도 7은 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 보정함수를 구하는 방법에 따른 복수 기업들의 평균 연봉 데이터 쌍의 집합과 회귀곡선을 나타내는 그래프이다.
도 8은 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 연령별 평균 연봉을 구하기 위한 통계데이터와 계산 결과를 나타내는 도면이다.
도 9는 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 직종별 평균 연봉을 구하기 위한 통계데이터와 계산 결과를 나타내는 도면이다.
도 10은 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템의 각 구성요소간 데이터의 흐름을 나타내는 구성도이다.1 is a configuration diagram illustrating a state in which a system for providing average annual salary information for each company and a public institution data server are connected to a network according to an embodiment.
2 is a flowchart illustrating a method of processing company information in a system for providing average annual salary information for each company according to an exemplary embodiment.
3 is a flowchart illustrating a method of determining an average annual salary for each company in a system for providing average annual salary information for each company according to an exemplary embodiment.
4 is a flowchart illustrating a method of generating various average annual salary information using the average annual salary per company in a system for providing average annual salary information for each company according to an exemplary embodiment.
5 is a flowchart illustrating a method of calculating a national pension-based average annual salary in a system for providing average annual salary information for each company according to an exemplary embodiment.
6 is a flowchart illustrating a method of obtaining a correction function for correcting an estimated average annual salary based on national pension in a system for providing average annual salary information for each company according to an exemplary embodiment.
7 is a graph showing a regression curve and a set of average annual salary data pairs of a plurality of companies according to a method for obtaining a correction function in the average annual salary information providing system for each company according to an embodiment.
8 is a diagram illustrating statistical data and calculation results for obtaining an average annual salary by age in a system for providing average annual salary information by company according to an exemplary embodiment.
9 is a diagram illustrating statistical data and calculation results for obtaining an average annual salary for each job category in the system for providing average annual salary information for each company according to an exemplary embodiment.
10 is a configuration diagram illustrating a flow of data between components of a system for providing average annual salary information for each company according to an exemplary embodiment.
전술한, 그리고 추가적인 양상들은 첨부된 도면을 참조하여 설명하는 실시예들을 통해 구체화된다. 각 실시예들의 구성 요소들은 다른 언급이나 상호간에 모순이 없는 한 실시예 내에서 또는 타 실시예의 구성 요소들과 다양한 조합이 가능한 것으로 이해된다. 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 명세서 및 청구범위에 사용된 용어는 기재 내용 혹은 제안된 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다.The foregoing and additional aspects are embodied through embodiments described with reference to the accompanying drawings. It is understood that the elements of each embodiment can be combined in various ways within one embodiment or with elements of another embodiment without contradiction with each other or other references. Based on the principle that the inventor can properly define the concept of terms in order to explain his/her invention in the best way, the terms used in this specification and claims have meanings consistent with the description or proposed technical idea. and should be interpreted as a concept. Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템과 공공기관 데이터 서버가 네트워크에 연결된 상태를 나타내는 구성도이다.1 is a configuration diagram illustrating a state in which a system for providing average annual salary information for each company and a public institution data server are connected to a network according to an embodiment.
일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템은 데이터베이스(150)와 프로세서(130)를 포함한다. 데이터베이스(150)에는 공공기관 데이터가 저장된다. 프로세서(130)는 통신 인터페이스를 통해 데이터베이스(150)와 연결된다. 프로세서는 프로그램 명령을 실행할 수 있는 컴퓨터 시스템으로 구현할 수 있다. A system for providing average annual salary information for each company according to an embodiment includes a
통신 인터페이스는 프로세서가 데이터베이스에 접속할 수 있도록 한다. 프로세서와 데이터베이스가 서로 원격으로 떨어져 있는 경우, 유선 혹은 무선 네트워크 접속 인터페이스를 이용하여 통신 인터페이스를 구현할 수 있다. 데이터베이스가 프로세서에 연결된 저장장치로 구현되는 경우 통신 인터페이스를 버스 구조를 이용하여 구현할 수 있다.The communication interface allows the processor to access the database. When the processor and the database are remotely separated from each other, the communication interface may be implemented using a wired or wireless network access interface. When a database is implemented as a storage device connected to a processor, a communication interface may be implemented using a bus structure.
공공기관 데이터는 공공기관 서버(110)에 연결된 공공기관 데이터베이스(120)에 저장되어 있다. 프로세서(130)는 공공기관 서버(110)에 네트워크를 통해서 접속하여, 공공기관 데이터베이스(120)에 저장되어 있는 공공기관 데이터를 다운받아 데이터베이스(150)에 저장할 수 있다.Public institution data is stored in the
기업별 평균 연봉 정보를 생성하기 위해, 직원 1인 평균 급여액이 수록된 사업보고서 등의 공시데이터를 활용할 수 있다. 공시데이터는 금융감독원에서 운영하는 전자공시 시스템(DART)으로 부터 다운로드 받을 수 있다. 한편, 공공데이터 포탈(Data Portal)로부터 법인 사업장의 국민연금 가입내역이 포함된 국민연금데이터를 다운로드 받을 수 있다. 공시데이터와 국민연금데이터는 적절한 주기로 다운받아 데이터베이스(150)에 저장한다.In order to generate average annual salary information for each company, public data such as business reports containing the average annual salary per employee can be used. Disclosure data can be downloaded from the Electronic Disclosure System (DART) operated by the Financial Supervisory Service. On the other hand, it is possible to download national pension data including details of national pension subscriptions of corporate workplaces from public data portals. Public announcement data and national pension data are downloaded at appropriate intervals and stored in the
한편, 다양한 기업별 평균 연봉 정보를 제공하기 위하여, 통계청에서 운영하는 국가통계포털(KOSIS)에서 노무관련 통계데이터를 다운받아 활용할 수 있다. 그 밖에 이력서 데이터 등의 자료로부터 통계데이터를 추출하여 다양한 기업별 평균 연봉 정보를 생성하는데 활용할 수 있다.On the other hand, in order to provide average annual salary information for various companies, labor-related statistical data can be downloaded and utilized from the National Statistics Portal (KOSIS) operated by the National Statistical Office. In addition, statistical data can be extracted from data such as resume data and used to generate average annual salary information for various companies.
프로세서(130)는 데이터베이스(150)에 저장되어 있는 공공기관 데이터를 이용하여 각 기업별 평균 연봉 정보를 추출하거나, 예측 또는 보정 등의 계산과정을 통해 각 기업별 평균 연봉 정보를 생성한다. 각 기업별 평균 연봉 정보는 데이터베이스(150)에 저장하거나 디스플레이 장치를 통해 표시할 수 있다.The
사용자 단말(170, 190)에서 네트워크를 통해 프로세서로 각 기업별 평균 연봉 정보를 요청할 수 있다. 이 경우 프로세서(130)는 데이터베이스(150)에 저장되어 있는 각 기업별 평균 연봉 정보를 사용자 단말(170, 190)로 전송할 수 있다.The
도 2는 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 기업정보를 처리하는 방법을 나타내는 순서도이다.2 is a flowchart illustrating a method of processing company information in a system for providing average annual salary information for each company according to an exemplary embodiment.
일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서, 프로세서(130)가 데이터베이스(150)에 저장되어 있는 공공기관 데이터를 이용하여 각 기업별 평균 연봉 정보를 생성하기 위해, 먼저 프로세서(130)는 입력장치로부터 평균 연봉 정보를 제공받기 원하는 기업의 기업정보를 입력 받는다(S210). 기업정보로는 기업명, 사업자등록번호 등을 입력 받을 수 있으나, 법인여부 판단이 용이한 사업자등록번호를 입력 받는 것이 바람직하다.In the system for providing average annual salary information for each company according to an embodiment, in order for the
공시데이터는 공시의무가 있는 상장법인에 대해서만 존재하고, 국민연금데이터도 2인 이상의 법인 사업장에 대해서만 데이터가 존재한다. 따라서, 사업자등록번호의 개인 법인 구분코드 2자리를 통해서 평균 연봉 정보를 생성하려는 기업이 법인 사업자인지 판단하여(S230), 법인 사업자에 해당하는 경우에 다음 단계(도 3의 A)로 진행한다. 입력 받은 기업정보에서 평균 연봉 정보 생성을 요청 받은 기업이 법인사업자가 아닌 경우, 데이터가 존재하지 않으므로 실행을 종료하거나, 기업정보를 다시 입력 받는다.Disclosure data exists only for listed corporations with disclosure obligations, and national pension data only exists for corporate workplaces with two or more employees. Therefore, it is determined whether the company to generate the average annual salary information is a corporate entrepreneur through the two-digit individual corporation identification code of the business registration number (S230), and proceeds to the next step (A in FIG. 3) if it corresponds to the corporate entrepreneur. If the company requested to generate average annual salary information from the input company information is not a corporate operator, the execution is terminated or the company information is re-entered because data does not exist.
도 3은 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 기업별 평균 연봉을 결정하는 방법을 나타내는 순서도이다. 3 is a flowchart illustrating a method of determining an average annual salary for each company in a system for providing average annual salary information for each company according to an exemplary embodiment.
일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서, 프로세서는 데이터베이스에서 평균 연봉 정보를 제공받기 원하는 기업에 대한 공시데이터를 조회한다(S310). 조회 결과 공시데이터가 존재하는 경우, 공시데이터로부터 기업의 공시데이터 기반 평균 연봉을 추출한다(S330). 공시데이터에는 기업의 평균 연봉 정보가 포함되어 있으므로, 해당 데이터를 추출하여 공시데이터 기반 평균 연봉으로 설정할 수 있다. In the system for providing average annual salary information for each company according to an exemplary embodiment, the processor searches the database for disclosure data for companies that want to receive average annual salary information (S310). As a result of the inquiry, if public disclosure data exists, an average annual salary based on the company's public disclosure data is extracted from the disclosure data (S330). Since the public data includes the company's average annual salary information, the data can be extracted and set as the average annual salary based on the public data.
평균 연봉 정보를 제공받기 원하는 기업에 대한 공시데이터를 조회한 결과, 공시데이터가 존재하지 않는 경우, 평균 연봉 정보를 제공받기 원하는 기업에 대한 국민연금데이터를 데이터베이스에서 조회한다(S350). 국민연금데이터에는 각 사업장의 국민연금 가입 및 납부 정보가 포함되어 있다.As a result of searching for public data for companies desiring to receive average annual salary information, if there is no public data, national pension data for companies desiring to receive average annual salary information is retrieved from the database (S350). The national pension data includes information on joining and paying the national pension at each workplace.
국민연금데이터 조회결과, 평균 연봉 정보를 제공받기 원하는 기업의 국민연금데이터가 존재하는 경우, 국민연금데이터로부터 해당 기업의 국민연금 기반 평균 연봉을 계산할 수 있다(S370). 도 3의 A 내지 B까지의 과정을 통해, 평균 연봉 정보를 제공받기 원하는 기업에 대해, 특정 년도의 평균 연봉을 공시데이터 기반 평균 연봉 또는 국민연금 기반 평균 연봉을 이용하여 구할 수 있다. 이후에 도 4의 B단계로 진행할 수 있다.As a result of searching the national pension data, if there is national pension data of a company that wants to receive average annual salary information, the national pension-based average annual salary of the corresponding company can be calculated from the national pension data (S370). Through the process from A to B of FIG. 3, for a company that wants to receive average annual salary information, the average annual salary of a specific year can be obtained using the average annual salary based on public announcement data or the average annual salary based on the national pension. Thereafter, step B of FIG. 4 may be performed.
공시데이터가 존재하는 경우, 평균 연봉 정보를 제공받기 원하는 기업의 정확한 평균 연봉 정보를 추출할 수 있고, 공시데이터가 존재하지 않는 경우에는 국민연금데이터를 이용하여 평균 연봉 정보를 계산하여 비교적 정확하게 예측할 수 있다.If public data exists, accurate average annual salary information can be extracted from companies that want to receive average annual salary information, and if public data does not exist, average annual salary information can be calculated using national pension data and predicted relatively accurately. there is.
도 4는 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 기업별 평균 연봉을 이용하여 다양한 평균 연봉 정보를 생성하는 방법을 나타내는 순서도이다.4 is a flowchart illustrating a method of generating various average annual salary information using the average annual salary per company in a system for providing average annual salary information for each company according to an exemplary embodiment.
복수 년도에 대해 도 3의 A 내지 B 과정을 반복하면, 평균 연봉 정보를 제공받기 원하는 기업에 대해, 복수 년도의 평균 연봉을 구해, 해당 기업의 연도별 평균 연봉 정보를 생성할 수 있다(S410).If processes A to B of FIG. 3 are repeated for multiple years, average annual salary information for each year of the company can be generated by obtaining an average annual salary for multiple years for a company that wants to receive average annual salary information (S410). .
한편, 복수 년도에 대해 평균 연봉을 구하는 경우, 특정 년도에만 공시데이터가 존재하지 않는 경우가 있다. 이러한 경우에는 데이터베이스에서 해당 기업에 대한 특정 년도의 이전 년도 또는 이후 년도의 공시데이터와, 국민연금데이터를 활용하여 복수 년도의 평균 연봉을 구할 수 있다. On the other hand, when calculating the average annual salary for multiple years, there are cases in which disclosure data does not exist only in a specific year. In this case, the average annual salary for multiple years can be obtained by using public disclosure data and national pension data of the year before or after the specific year in the database and the national pension data.
즉, 해당 기업에 대한 특정 년도의 이전 년도 또는 이후 년도의 공시데이터가 존재하는 경우, 특정 년도의 이전 년도 또는 이후 년도의 공시데이터로부터 해당 기업의 특정 년도의 이전 년도 또는 이후 년도의 공시데이터 기반 평균 연봉을 추출한다. 그리고, 해당 기업에 대한 특정 년도 및 특정 년도의 이전 년도 또는 이후 년도의 국민연금데이터로부터 국민연금 기반 평균 연봉을 계산하고, 특정 년도의 이전 년도 또는 이후 년도의 국민연금 기반 평균 연봉에 대한 특정 년도의 국민연금 기반 평균 연봉의 변화율을 계산한다. 특정 년도의 이전 년도 또는 이후 년도의 공시데이터 기반 평균 연봉에 국민연금 기반 평균 연봉 정보의 변화율을 곱하여 특정 년도의 평균 연봉으로 설정할 수 있다.In other words, if there is disclosure data of the year before or after the specific year for the company, the disclosure data-based average of the year before or after the specific year of the company from the disclosure data of the year before or after the specific year extract salary In addition, the national pension-based average annual salary is calculated from the national pension data of the specific year and the year before or after the specific year for the company, and the average annual salary based on the national pension in the year before or after the specific year Calculate the rate of change in the average annual salary based on the national pension. The average annual salary of a specific year can be set as the average annual salary of a specific year by multiplying the average annual salary based on public information in the year before or after the specific year by the change rate of the average annual salary information based on the national pension.
평균 연봉 정보를 제공받기 원하는 기업의 연도별 평균 연봉 정보와 연령별 임금관련 통계데이터 등을 활용하면, 해당 기업의 연령별 평균 연봉 정보를 생성할 수 있다(S430). 연령별 평균 연봉 정보는 도 8에 나타난 방법을 사용하여 구할 수 있다.Average annual salary information for each age of the company may be generated by using the average annual salary information for each year and wage-related statistical data for each age group of the company to which average annual salary information is requested (S430). Average annual salary information by age can be obtained using the method shown in FIG. 8 .
평균 연봉 정보를 제공받기 원하는 기업의 연령별 평균 연봉 정보와 이력서의 연봉 정보 등의 통계데이터를 활용하면, 해당 기업의 직종별 평균 연봉 정보를 생성할 수 있다(S470). 직종별 평균 연봉 정보는 도 9에 나타난 방법을 사용하여 구할 수 있다.Using statistical data, such as average annual salary information by age and annual salary information of a resume of a company that wants to receive average annual salary information, it is possible to generate average annual salary information by job type of the corresponding company (S470). Average annual salary information for each job category can be obtained using the method shown in FIG. 9 .
평균 연봉 정보를 제공받기 원하는 기업의, 공시데이터 기반 평균 연봉 또는 국민연금 기반 평균 연봉을 포함하는 연도별 평균 연봉 정보, 연령별 평균 연봉 정보, 직종별 평균 연봉 정보 등을 출력장치로 출력할 수 있다(S470). 출력장치로는 데이터베이스와 같은 저장장치, 인쇄장치, 또는 디스플레이 장치 등을 사용할 수 있다.Average annual salary information by year, average annual salary information by age, average annual salary information by occupational category, etc., including the average annual salary based on public announcement data or the average annual salary based on national pension, of a company that wants to receive average annual salary information can be output to an output device (S470). ). As an output device, a storage device such as a database, a printing device, or a display device may be used.
도 5는 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 국민연금 기반 평균 연봉을 계산하는 방법을 나타내는 순서도이다. 5 is a flowchart illustrating a method of calculating a national pension-based average annual salary in a system for providing average annual salary information for each company according to an exemplary embodiment.
국민연금데이터에는 국민연금 가입 및 납부 정보가 포함되어 있다. 평균 연봉 정보를 제공받기 원하는 기업의 국민연금 기반 평균 연봉을 계산하기(S370) 위해서는, 먼저 해당 기업의 국민연금 데이터로부터 가입자수 정보와 당월 고지금액 정보를 추출한다(S510). 당월 고지금액은 당월 임금과 관련이 있으므로, 추출된 당월 고지금액에 해당하는 임금을 가입자수로 나누어 해당 기업의 국민연금 기반 추정 평균 연봉을 계산할 수 있다(S530). National pension data includes information about joining and paying the national pension. In order to calculate the average annual salary based on the national pension of a company that wants to receive average annual salary information (S370), first, information on the number of subscribers and information on the billing amount for the current month are extracted from the national pension data of the corresponding company (S510). Since the notice amount for the current month is related to the wage for the current month, the estimated average annual salary based on the national pension of the corresponding company can be calculated by dividing the extracted wage corresponding to the notice amount for the current month by the number of subscribers (S530).
국민연금에는 상한액과 하한액이 존재하므로, 해당 범위를 벗어나는 근로자가 많을 경우, 국민연금 기반 추정 평균 연봉은 부정확해질 수 있다. 따라서, 해당 기업의 국민연금 기반 추정 평균 연봉에 보정함수를 적용하여 해당 기업의 국민연금 기반 평균 연봉을 구한다(S550).Since the national pension has upper and lower limits, if there are many workers outside the range, the average annual salary based on the national pension may be inaccurate. Therefore, a correction function is applied to the estimated average annual salary based on the national pension of the company to obtain the average annual salary based on the national pension of the company (S550).
도 6은 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 국민연금 기반 추정 평균 연봉을 보정하는 방법을 나타내는 순서도이다. 6 is a flowchart illustrating a method of correcting an estimated average annual salary based on national pension in a system for providing average annual salary information for each company according to an exemplary embodiment.
보정함수는 공시데이터 기반 평균 연봉과 국민연금 기반 추정 평균 연봉 간의 관계를 분석하여 생성할 수 있다. 공시대상 기업은 국민연금 가입 대상에도 해당되므로, 공시데이터와 국민연금데이터가 모두 존재하고, 공시데이터 기반 평균 연봉과 국민연금 기반 추정 평균 연봉 사이에 서로 강한 양의 상관관계를 가지고 있으므로 보정함수 생성이 가능하다. The correction function can be created by analyzing the relationship between the average annual salary based on public disclosure data and the estimated average annual salary based on the national pension. Since companies subject to disclosure are also subject to subscription to the national pension, both disclosure data and national pension data exist, and there is a strong positive correlation between the average annual salary based on the disclosure data and the average annual salary estimated based on the national pension, so it is difficult to create a correction function. possible.
우선, 특정 년도의 보정함수를 구하기 위해, 복수 기업들에 대하여, 공시데이터에서 추출한 공시데이터 기반 평균 연봉과, 공시데이터 기반 평균 연봉을 구한 복수 기업들에 대해 국민연금데이터로부터 계산된 국민연금 기반 추정 평균 연봉을 구한다. 그리고, 공시데이터 기반 평균 연봉과 국민연금 기반 추정 평균 연봉을 매칭시켜, 복수 기업들의 평균 연봉 데이터 쌍의 집합을 구한다(S610). First, in order to obtain the correction function for a specific year, for multiple companies, the average annual salary based on the disclosure data extracted from the disclosure data and the national pension-based estimation calculated from the national pension data for the multiple companies for which the average annual salary based on the disclosure data was obtained Find the average annual salary. Then, a set of average annual salary data pairs of a plurality of companies is obtained by matching the average annual salary based on public announcement data with the estimated average annual salary based on the national pension (S610).
복수 기업들의 평균 연봉 데이터 쌍의 집합을 이용하여, 공시데이터 기반 평균 연봉과 국민연금 기반 추정 평균 연봉의 상관관계를 이용하여 국민연금 기반 추정 평균 연봉을 보정할 수 있는 보정함수를 구할 수 있다(S630). A correction function capable of correcting the estimated average annual salary based on the national pension can be obtained by using the correlation between the average annual salary based on public disclosure data and the estimated average annual salary based on the national pension using a set of average annual salary data pairs of multiple companies (S630). ).
보정함수를 구하는 과정을 구체적으로 살펴보면, 먼저 복수 기업들의 평균 연봉 데이터 쌍의 집합에서, 이상치를 제거한다(S650). 이상치가 있는 경우 기계학습시 잘못된 패턴을 학습하게 되는 등의 문제가 발생할 수 있으므로, 사분위수 범위(IQR) 등을 이용하여 이상치를 제거하는 것이 바람직하다.Looking at the process of obtaining the correction function in detail, first, an outlier is removed from a set of average annual salary data pairs of a plurality of companies (S650). If there is an outlier, problems such as learning an incorrect pattern may occur during machine learning, so it is desirable to remove the outlier using an interquartile range (IQR) or the like.
상여금 등에 대해서는 당해 년도에 국민연금에 반영되지 않으므로, 공시데이터 기반 평균 연봉이 국민연금 기반 추정 평균 연봉보다 큰 것이 통상적이다. 따라서, 이상치가 제거된 복수 기업들의 평균 연봉 데이터 쌍의 집합에서, 국민연금 기반 추정 평균 연봉이 공시데이터 기반 평균 연봉보다 큰 데이터를 삭제하여 복수 기업의 트리밍된 평균 연봉 데이터 쌍의 집합을 구한다(S670).As for bonuses, etc., they are not reflected in the national pension for that year, it is common for the average annual salary based on public data to be greater than the average annual salary estimated based on the national pension. Therefore, from the set of average annual salary data pairs of multiple companies from which the outliers have been removed, data in which the estimated average annual salary based on the national pension is greater than the average annual salary based on the public announcement data are deleted to obtain a set of data pairs of trimmed average annual salaries of multiple companies (S670). ).
복수 기업의 트리밍된 평균 연봉 데이터 쌍의 집합에서 기계학습 등을 이용하여 회귀함수를 구할 수 있다(S690). 구해진 회귀함수를 국민연금 기반 추정 평균 연봉의 보정함수로 사용할 수 있다. 즉, 보정함수에서 국민연금 기반 추정 평균 연봉에 해당하는 공시데이터 기반 평균 연봉 데이터를 구하면, 보정된 국민연금 기반 평균 연봉을 구할 수 있다.A regression function may be obtained from a set of trimmed average annual salary data pairs of a plurality of companies by using machine learning or the like (S690). The obtained regression function can be used as a correction function for the estimated average annual salary based on the national pension. That is, if average annual salary data based on public information corresponding to the estimated average annual salary based on the national pension is obtained from the correction function, the corrected average annual salary based on the national pension can be obtained.
보정된 국민연금 기반 평균 연봉을 이용하면, 공시데이터가 없는 기업에 대해서도 평균 연봉을 보다 정확히 예측할 수 있으므로, 사용자 단말로 해당 기업에 대한 정확한 평균 연봉 정보를 제공할 수 있다.Using the corrected average annual salary based on the national pension, it is possible to more accurately predict the average annual salary even for companies that do not have publicly disclosed data, so that the user terminal can provide accurate average annual salary information for the corresponding company.
도 7은 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 보정함수를 구하는 방법에 따른 복수 기업들의 평균 연봉 데이터 쌍의 집합과 회귀곡선을 나타내는 그래프이다.7 is a graph showing a regression curve and a set of average annual salary data pairs of a plurality of companies according to a method for obtaining a correction function in the average annual salary information providing system for each company according to an embodiment.
도면에서 세로축은 공시데이터 기반 평균 연봉을 나타내고, 가로축은 국민연금 기반 추정 평균 연봉을 나타낸다. 도 7(a)는 복수 기업들의 평균 연봉 데이터 쌍의 집합을 나타내는 그래프이다. 도 7(b)는 이상치 데이터를 제거한 후의, 복수 기업들의 평균 연봉 데이터 쌍의 집합을 나타내는 그래프이다. 도 7(c)는 국민연금 기반 추정 평균 연봉이 공시데이터 기반 평균 연봉보다 큰 데이터를 제거한, 복수 기업의 트리밍된 평균 연봉 데이터 쌍의 집합을 나타내는 그래프이다. 도 7(d)는 복수 기업의 트리밍된 평균 연봉 데이터 쌍의 집합을 이용하여 기계학습에 의해 구한 회귀곡선을 나타내는 그래프이다.In the drawing, the vertical axis represents the average annual salary based on public data, and the horizontal axis represents the estimated average annual salary based on the national pension. 7(a) is a graph showing a set of average annual salary data pairs of a plurality of companies. 7( b ) is a graph showing a set of average annual salary data pairs of multiple companies after removing outlier data. FIG. 7(c) is a graph showing a set of trimmed average annual salary data pairs of multiple companies, from which data in which the estimated average annual salary based on the national pension is greater than the average annual salary based on the public announcement data is removed. 7(d) is a graph showing a regression curve obtained by machine learning using a set of data pairs of trimmed average annual salaries of a plurality of companies.
도 8은 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 연령별 평균 연봉을 구하기 위한 통계데이터와 계산 결과를 나타내는 도면이다. 8 is a diagram illustrating statistical data and calculation results for obtaining an average annual salary by age in a system for providing average annual salary information by company according to an exemplary embodiment.
국가통계시스템 서버로부터 각 산업별 연령별 근로자수 및 임금총액 통계데이터를 수집하여 데이터베이스에 저장할 수 있다. 도 8에서 굵은 선으로 표시된 부분이 공공기관 데이터에서 다운로드 받은 통계데이터이다.Statistical data on the number of workers and total wages by industry and age can be collected from the national statistical system server and stored in the database. In FIG. 8 , a part marked with a thick line is statistical data downloaded from public institution data.
일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서, 프로세서는 데이터베이스에서 평균 연봉 정보를 제공받기 원하는 기업이 속하는 산업의 연령별 근로자수 및 임금총액 통계데이터를 조회하여 불러올 수 있다. 프로세서는 불러온 통계데이터를 이용하여 해당 기업의 각 연령()별 평균 연봉()을 다음 수학식 1에 따라 구하여, 기업별 연령별 평균 연봉 정보를 생성할 수 있다.In the system for providing average annual salary information for each company according to an embodiment, the processor may retrieve and retrieve statistical data on the number of workers by age and the total wage of an industry to which a company to which average annual salary information is to be provided belongs from a database. The processor uses the imported statistical data for each age of the company ( ) average annual salary by ( ) can be obtained according to Equation 1 below, and average annual salary information for each company and age can be generated.
[수학식 1][Equation 1]
여기에서, 는 연령이고, 은 통계데이터의 최저 연령이고, 는 통계데이터의 최고 연령이고, 는 상기 기업의 연령의 평균 연봉이고, 는 상기 기업의 평균 연봉이고, 는 상기 통계데이터의 연령의 월임금 총액이고, 는 상기 통계데이터의 연령의 근로자수이다.From here, is the age, is the minimum age of statistical data, is the highest age of statistical data, is the company's is the average annual salary for the age is the average annual salary of the company, is the statistical data is the total monthly wage for the age, is the statistical data is the number of workers by age.
예를 들어, 도 8에서 평균 연봉이 4,673만원인 기업의 경우, 해당 산업의 연령이 30세~34세인 직원의 월임금 총액은 3,666만원이고, 20세에서 59세까지 근로자수의 합계는 462,488명이고, 월임금총액과 근로자수의 곱을 합한 값은 2,090,488,701 이므로, 해당 기업의 30세인 직원의 평균 연봉을 4,673 * 3,666 * ( 462,488 / 2,090,488,701 ) = 3,790만원으로 결정할 수 있다.For example, in the case of a company with an average annual salary of 46.73 million won in FIG. 8, the total monthly wage of employees aged 30 to 34 in the industry is 36.66 million won, and the total number of workers aged 20 to 59 is 462,488 , and the sum of the product of the total monthly wage and the number of workers is 2,090,488,701, so the average annual salary of a 30-year-old employee in the company can be determined as 4,673 * 3,666 * ( 462,488 / 2,090,488,701 ) = 37.9 million won.
한편, 각 기업의 연봉과 직종이 포함된 이력서 정보를 수집하여 데이터베이스에 저장할 수 있다. 프로세서는 데이터베이스에서 평균 연봉 정보를 제공하려는 기업에 대한 이력서 정보를 조회하여, 해당 기업의 평균 연령 정보를 추출하고, 해당 기업이 속하는 산업의 연령별 임금 통계데이터에서, 연령별 근로자수 분포를 해당 기업의 이력서에 따른 연령별 인원수 분포를 이용하여 수정하고 수학식 1에 적용하여 해당 기업의 연령별 평균 연봉 정보를 생성할 수 있다. 해당 기업에 대해 수집된 이력서 정보가 많은 경우, 해당 기업의 연령 분포에 최적화된 연령별 평균 연봉 정보를 생성할 수 있다.Meanwhile, resume information including annual salary and occupation of each company may be collected and stored in a database. The processor searches the database for resume information about the company for which average annual salary information is to be provided, extracts the average age information of the company, and calculates the distribution of the number of workers by age from the wage statistical data by age of the industry to which the company belongs. It can be corrected using the distribution of the number of people by age according to and applied to Equation 1 to generate average annual salary information for each age of the company. If there is a lot of resume information collected about the company, average annual salary information by age optimized for the age distribution of the company can be generated.
도 9는 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서 직종별 평균 연봉을 구하기 위한 통계데이터와 계산 결과를 나타내는 도면이다. 9 is a diagram illustrating statistical data and calculation results for obtaining an average annual salary for each job category in the system for providing average annual salary information for each company according to an exemplary embodiment.
각 기업의 연봉과 직종이 포함된 이력서 정보를 수집하여 데이터베이스에 저장할 수 있다. 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템에서, 프로세서는 데이터베이스에서 평균 연봉 정보를 제공하려는 기업에 대한 이력서 정보를 조회하여, 해당 기업의 연령별 직종별 평균 연봉 및 인원수에 대한 통계데이터를 추출할 수 있다. 이력서 정보에서 추출된 통계 데이터는 도 9의 굵은 선 안쪽에 나타내었다.Resume information including annual salary and occupation of each company can be collected and stored in a database. In the system for providing average annual salary information for each company according to an embodiment, the processor retrieves resume information for a company for which average annual salary information is to be provided from a database, and extracts statistical data on the average annual salary for each age and job category of the company and the number of employees. there is. Statistical data extracted from resume information is shown inside the bold line in FIG. 9 .
프로세서는 해당 기업의 각 연령()별 직종()별 평균 연봉()을 다음 수학식 2에 따라 구하여, 기업별 연령별 직종별 평균연봉 정보를 생성할 수 있다. Processors of each age of the company ( ) by job type ( ) average annual salary by ( ) can be obtained according to Equation 2 below, and average annual salary information for each company, age, and occupation can be generated.
[수학식 2][Equation 2]
여기에서, 는 연령이고, 은 통계데이터의 최저 연령이고, 는 통계데이터의 최고 연령이고, 는 직종이고, 는 상기 기업의 연령 직종의 평균 연봉이고, 는 상기 기업의 평균 연봉이고, 는 상기 통계데이터의 연령 직종의 평균 연봉이고, 는 상기 통계데이터의 연령 직종의 인원수이다.From here, is the age, is the minimum age of statistical data, is the highest age of statistical data, is the occupation, is the company's age The average salary for the occupation is is the average annual salary of the company, is the statistical data age The average salary for the occupation is is the statistical data age is the number of people in the occupation.
예를 들어, 도 9에서 30세 직원의 평균 연봉이 3,790만원인 기업의 경우, 해당 기업의 IT/인터넷 직종의 평균 연봉은 3,339만원이고, 30세 전체 직종의 이력서 수집 인원수의 합이 108,477명이고, 평균연봉*인원수의 30세 전체 직종의 합이 349,385,510 이므로, 해당 기업의 30세인 직원 중 IT/인터넷 직종의 평균 연봉은 3,790 * 3,339 * ( 108,477 / 349,385,510 ) = 3,929만원으로 결정할 수 있다.For example, in the case of a company in which the average annual salary of a 30-year-old employee in FIG. 9 is 37.9 million won, the average annual salary of IT / Internet occupations in the company is 33.39 million won, and the sum of the number of resumes collected for all 30-year-old occupations is 108,477 people, , Average annual salary * number of employees The sum of all occupations aged 30 years old is 349,385,510, so the average annual salary of IT/Internet occupations among 30-year-old employees of the company can be determined as 3,790 * 3,339 * ( 108,477 / 349,385,510 ) = 39.29 million won.
도 10은 일 실시예에 따른 기업별 평균 연봉 정보 제공 시스템의 각 구성요소간 데이터의 흐름을 나타내는 구성도이다. 10 is a configuration diagram illustrating a flow of data between components of a system for providing average annual salary information for each company according to an exemplary embodiment.
공공기관 데이터를 활용하여 기업별 평균 연봉 정보를 제공하는 시스템은, 데이터베이스(150)와 프로세서(130)를 포함한다. 데이터베이스(150)는 공공기관 데이터를 저장하고 있다. 프로세서(130)는 통신 인터페이스(140)를 포함하고, 통신 인터페이스를 통해 데이터베이스와 연결되어, 데이터를 주고 받을 수 있다.A system for providing average annual salary information for each company by using public institution data includes a
프로세서(130)는, 입력모듈(810), 사업자 판단모듈(830), 데이터베이스 조회모듈(850), 공시데이터 기반 평균 연봉 추출모듈(870), 국민연금 기반 평균 연봉 계산모듈(890), 보정함수 생성모듈(900), 제어모듈(910), 연도별 평균연봉 계산모듈(930), 연령별 평균연봉 계산모듈(950), 직종별 평균연봉 계산모듈 (970), 출력모듈(990)을 포함할 수 있다.The
프로세서를 구성하는 각각의 모듈은 별개의 컴퓨터 시스템, 부품을 이용하여 구현하거나, 프로세서에서 동작하는 명령의 집합으로 구성할 수 있다.Each module constituting the processor may be implemented using a separate computer system or component, or may be composed of a set of instructions operating in the processor.
입력모듈(810)은 입력장치로부터 평균 연봉 정보를 제공받기 원하는 기업의 기업정보를 입력 받는다. 기업정보로 기업명, 사업자등록번호 등을 입력 받을 수 있으나, 법인 여부의 파악이 용이한 사업자등록번호를 포함하여 입력 받는 것이 바람직하다. The
사업자 판단모듈(830)은 사업자등록번호의 개인과 법인을 식별하는 부분으로부터 법인사업자 여부 판단한다. 법인 사업자인 경우, 데이터베이스 조회모듈(850)을 통해 데이터베이스에서 평균 연봉을 구하기 위한 데이터를 조회한다. 법인 사업자가 아닌 경우 데이터가 존재하지 않으므로 종료하거나, 기업정보를 다시 입력 받는다.The
데이터베이스 조회모듈(850)은 데이터베이스에서 평균 연봉 정보를 제공받기 원하는 기업의 공시데이터 또는 국민연금데이터를 조회하고, 그 결과를 데이터베이스에서 가져온다. 공시데이터에는 해당 기업의 평균 연봉 정보가 포함되어 있고, 국민연금 데이터에는 국민연금 가입 및 납부 정보가 포함되어 있다. The
공시데이터 기반 평균 연봉 추출모듈(870)은 공시데이터로부터 해당 기업의 평균 연봉을 추출하여 공시데이터 기반 평균 연봉을 구한다. The public data-based average annual
국민연금 기반 평균 연봉 계산모듈(890)은 국민연금데이터로부터 해당 기업의 국민연금 기반 평균 연봉을 계산한다. 국민연금 기반 평균 연봉 계산모듈(890)은, 국민연금데이터로부터 가입자수 정보와 당월 고지금액 정보를 추출하고, 당월 고지금액에 해당하는 임금을 가입자수로 나누어 해당 기업의 국민연금 기반 추정 평균 연봉을 계산한다. 해당 기업의 국민연금 기반 추정 평균 연봉에 보정함수 생성모듈(900)에서 구한 보정함수를 적용하여, 해당 기업의 국민연금 기반 평균 연봉을 구할 수 있다. The national pension-based average annual
보정함수 생성모듈(900)은, 특정 년도에서 복수 기업들에 대하여, 공시데이터에서 추출한 공시데이터 기반 평균 연봉과 국민연금데이터로부터 계산된 국민연금 기반 추정 평균 연봉을 매칭시켜, 복수 기업들의 평균 연봉 데이터 쌍의 집합을 구하고, 복수 기업들의 평균 연봉 데이터 쌍의 집합을 이용하여, 공시데이터 기반 평균 연봉과 국민연금 기반 추정 평균 연봉의 상관관계에서 국민연금 기반 추정 평균 연봉을 보정하는 보정함수를 구한다.The correction
보정함수 생성모듈(900)은, 복수 기업들의 평균 연봉 데이터 쌍의 집합에서 이상치를 제거하고, 이상치가 제거된 복수 기업들의 평균 연봉 데이터 쌍의 집합에서 국민연금 기반 추정 평균 연봉이 공시데이터 기반 평균 연봉보다 큰 데이터를 삭제하여 복수 기업의 트리밍된 평균 연봉 데이터 쌍의 집합을 구하고, 복수 기업의 트리밍된 평균 연봉 데이터 쌍의 집합에서 회귀함수를 구하여 보정함수를 구한다.The correction
제어모듈(910)은, 데이터베이스에서 해당 기업에 대한 공시데이터를 조회한 결과 공시데이터가 존재하지 않는 경우, 데이터베이스에서 해당 기업에 대한 국민연금데이터를 조회하도록 데이터베이스 조회모듈을 제어한다.The
연도별 평균연봉 계산모듈(930)은 복수 년도에 대해 해당 기업의 평균 연봉을 구하여 해당 기업의 연도별 평균 연봉 정보를 생성한다.The annual average annual
연도별 평균연봉 계산모듈(930)은 특정 년도에 대해 공시데이터가 존재하지 않는 경우, 데이터베이스에서 해당 기업에 대한 특정 년도의 이전 년도 또는 이후 년도의 공시데이터를 조회한다. 해당 기업에 대한 특정 년도의 이전 년도 또는 이후 년도의 공시데이터가 존재하는 경우, 특정 년도의 이전 년도 또는 이후 년도의 공시데이터로부터 해당 기업의 특정 년도의 이전 년도 또는 이후 년도의 공시데이터 기반 평균 연봉을 추출한다. 해당 기업에 대한 특정 년도 및 특정 년도의 이전 년도 또는 이후 년도의 국민연금데이터로부터 국민연금 기반 평균 연봉을 계산한다. 특정 년도의 이전 년도 또는 이후 년도의 국민연금 기반 평균 연봉에 대한 특정 년도의 국민연금 기반 평균 연봉의 변화율을 계산하고, 특정 년도의 이전 년도 또는 이후 년도의 공시데이터 기반 평균 연봉에 국민연금 기반 평균 연봉의 변화율을 곱하여 특정 년도의 평균 연봉으로 설정한다.If there is no disclosure data for a specific year, the average annual
연령별 평균연봉 계산모듈(950)은 국가통계시스템 서버로부터 각 산업별 연령별 근로자수 및 임금총액 통계데이터를 수집하여 데이터베이스에 저장할 수 있다. 연령별 평균연봉 계산모듈(950)은 평균 연봉 정보를 제공하려는 기업이 속하는 산업의 연령별 근로자수 및 임금총액 통계데이터를 데이터베이스에서 조회하고, 해당 기업의 각 연령()별 평균 연봉()을 다음 수학식 1에 따라 구한다. The average annual
[수학식 1][Equation 1]
여기에서, 는 연령이고, 은 통계데이터의 최저 연령이고, 는 통계데이터의 최고 연령이고, 는 상기 기업의 연령의 평균 연봉이고, 는 상기 기업의 평균 연봉이고, 는 상기 통계데이터의 연령의 월임금 총액이고, 는 상기 통계데이터의 연령의 근로자수이다.From here, is the age, is the minimum age of statistical data, is the highest age of statistical data, is the company's is the average annual salary for the age is the average annual salary of the company, is the statistical data is the total monthly wage for the age, is the statistical data is the number of workers by age.
연령별 평균연봉 계산모듈(950)은 데이터베이스에서 평균 연봉 정보를 제공하려는 기업에 대한 이력서 정보를 제공받아, 해당 기업의 평균 연령 정보를 추출하고, 해당 기업이 속하는 산업의 연령별 임금 통계데이터에서, 연령별 근로자수 분포를 해당 기업의 이력서에 따른 연령별 인원수 분포를 이용하여 수학식 1에 적용하여, 해당 기업의 연령별 평균 연봉을 구할 수 있다. The average annual
직종별 평균연봉 계산모듈 (970)은, 평균 연봉 정보를 제공하려는 기업에 대한 이력서가 저장된 데이터베이스에서 해당 기업에 대한 이력서 정보를 조회하고, 해당 기업의 연령별 직종별 평균 연봉 및 인원수에 대한 통계데이터를 추출하고, 해당 기업의 각 연령()별 직종()별 평균 연봉()을 다음 수학식 2에 따라 구할 수 있다.The average annual
[수학식 2][Equation 2]
여기에서, 는 연령이고, 은 통계데이터의 최저 연령이고, 는 통계데이터의 최고 연령이고, 는 직종이고, 는 상기 기업의 연령 직종의 평균 연봉이고, 는 상기 기업의 평균 연봉이고, 는 상기 통계데이터의 연령 직종의 평균 연봉이고, 는 상기 통계데이터의 연령 직종의 인원수이다.From here, is the age, is the minimum age of statistical data, is the highest age of statistical data, is the occupation, is the company's age The average salary for the occupation is is the average annual salary of the company, is the statistical data age The average salary for the occupation is is the statistical data age is the number of people in the occupation.
출력모듈(990)은 평균 연봉 정보를 제공하려는 기업에 대한 공시데이터 기반 평균 연봉 또는 국민연금 기반 평균 연봉을 포함하는 연도별 평균 연봉 정보, 연령별 평균 연봉 정보, 직종별 평균 연봉 정보 등을 출력장치로 출력할 수 있다. 출력장치로는 데이터베이스와 같은 저장장치, 인쇄장치, 또는 디스플레이 장치 등을 사용할 수 있다.The
이상에서 본 발명을 첨부된 도면을 참조하는 실시예들을 통해 설명하였지만 이에 한정되는 것은 아니며, 이들로부터 당업자라면 자명하게 도출할 수 있는 다양한 변형예들을 포괄하도록 해석되어야 한다. 특허청구범위는 이러한 변형예들을 포괄하도록 의도되었다. In the above, the present invention has been described through embodiments with reference to the accompanying drawings, but is not limited thereto, and should be interpreted to cover various modifications that can be obviously derived by those skilled in the art. The claims are intended to cover these variations.
110 : 공공기관 서버 120 : 공공기관 데이터베이스
130 : 프로세서 140 : 통신 인터페이스
150 : 데이터베이스 170, 190 : 사용자 단말
810 : 입력 모듈 830 : 사업자 판단모듈
850 : 데이터베이스 조회모듈
870 : 공시데이터 기반 평균 연봉 추출모듈
890 : 국민연금 기반 평균 연봉 추출모듈
900 : 보정함수 생성모듈 910 : 제어모듈
930 : 연도별 평균연봉 계산모듈
950 : 연령별 평균연봉 계산모듈
970 : 직종별 평균연봉 계산모듈 990 : 출력모듈110: public institution server 120: public institution database
130: processor 140: communication interface
150:
810: input module 830: operator determination module
850: database inquiry module
870: average annual salary extraction module based on public disclosure data
890: National pension-based average annual salary extraction module
900: correction function generation module 910: control module
930: Average annual salary calculation module by year
950: Average annual salary calculation module by age
970: average annual salary calculation module by occupation 990: output module
Claims (14)
입력 장치로부터 평균 연봉 정보를 제공받기 원하는 기업의 기업정보를 입력 받는 단계;
상기 데이터베이스에서 상기 기업에 대한 공시데이터를 조회하는 단계;
상기 공시데이터가 존재하는 경우, 상기 공시데이터로부터 상기 기업의 공시데이터 기반 평균 연봉을 추출하는 단계;
상기 공시데이터가 존재하지 않는 경우, 상기 데이터베이스에서 상기 기업에 대한 국민연금데이터를 조회하는 단계;
상기 국민연금데이터 조회결과 상기 기업에 대한 국민연금데이터가 존재하는 경우, 상기 국민연금데이터로부터 상기 기업의 국민연금 기반 평균 연봉을 계산하는 단계;
출력장치로 상기 기업에 대한 공시데이터 기반 평균 연봉 또는 국민연금 기반 평균 연봉을 포함하는 평균 연봉 정보를 출력하는 단계;
를 포함하는, 공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 방법.A method for providing average annual salary information for each company executable by a processor connected to a database storing public institution data through a communication interface, the method comprising:
receiving corporate information of a company to which average annual salary information is to be provided from an input device;
Retrieving public announcement data about the company from the database;
If the public announcement data exists, extracting an average annual salary based on the public announcement data of the company from the public announcement data;
Retrieving national pension data for the company from the database when the public announcement data does not exist;
calculating the national pension-based average annual salary of the company from the national pension data, when the national pension data for the company exists as a result of the national pension data inquiry;
outputting average annual salary information including an average annual salary based on public announcement data for the company or an average annual salary based on national pension to an output device;
A method for providing average annual salary information for each company using public institution data, including.
상기 기업의 국민연금 기반 평균 연봉을 계산하는 단계는,
상기 국민연금데이터로부터 가입자수 정보와 당월 고지금액 정보를 추출하는 단계;
상기 당월 고지금액에 해당하는 임금을 상기 가입자수로 나누어 상기 기업의 추정 평균 연봉을 계산하는 단계; 및
상기 기업의 추정 평균 연봉에 보정함수를 적용하여 상기 기업의 국민연금 기반 평균 연봉을 구하는 단계;
를 포함하는, 공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 방법.In claim 1,
The step of calculating the average annual salary based on the national pension of the company,
extracting information on the number of subscribers and information on the billing amount for the current month from the national pension data;
calculating an estimated average annual salary of the company by dividing the wage corresponding to the notice amount for the current month by the number of subscribers; and
obtaining a national pension-based average annual salary of the company by applying a correction function to the estimated average annual salary of the company;
A method for providing average annual salary information for each company using public institution data, including.
복수 기업들에 대하여, 공시데이터에서 추출한 공시데이터 기반 평균 연봉과 국민연금데이터로부터 계산된 국민연금 기반 추정 평균 연봉을 매칭시켜, 상기 복수 기업들의 평균 연봉 데이터 쌍의 집합을 구하는 단계; 및
상기 복수 기업들의 평균 연봉 데이터 쌍의 집합을 이용하여, 공시데이터 기반 평균 연봉과 국민연금 기반 추정 평균 연봉의 상관관계에서 상기 보정함수를 구하는 단계;
를 더 포함하는, 공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 방법.In claim 2, the method,
For a plurality of companies, obtaining a set of average annual salary data pairs of the plurality of companies by matching the average annual salary based on the public announcement data extracted from the public announcement data and the estimated average annual salary based on the national pension calculated from the national pension data; and
obtaining the correction function from a correlation between an average annual salary based on public announcement data and an estimated average annual salary based on the national pension, using a set of average annual salary data pairs of the plurality of companies;
A method for providing average annual salary information for each company using public institution data, further comprising a.
상기 보정함수를 구하는 단계는,
상기 복수 기업들의 평균 연봉 데이터 쌍의 집합에서, 이상치를 제거하는 단계;
상기 이상치가 제거된 복수 기업들의 평균 연봉 데이터 쌍의 집합에서, 국민연금 기반 추정 평균 연봉이 공시데이터 기반 평균 연봉보다 큰 데이터를 삭제하여 복수 기업의 트리밍된 평균 연봉 데이터 쌍의 집합을 구하는 단계; 및
상기 복수 기업의 트리밍된 평균 연봉 데이터 쌍의 집합에서 회귀함수를 구하는 단계;
를 포함하는, 공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 방법.In claim 3,
The step of obtaining the correction function,
removing outliers from the set of average annual salary data pairs of the plurality of companies;
Obtaining a set of trimmed average annual salary data pairs of multiple companies by deleting data in which the estimated average annual salary based on the national pension is greater than the average annual salary based on public announcement data from the set of average annual salary data pairs of the plurality of companies from which the outliers have been removed; and
obtaining a regression function from a set of trimmed average annual salary data pairs of the plurality of companies;
A method for providing average annual salary information for each company using public institution data, including.
상기 기업정보는, 사업자등록번호를 포함하고,
상기 방법은, 상기 사업자등록번호로부터 법인사업자 여부 판단하는 단계;
를 더 포함하는, 공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 방법.In claim 1,
The company information includes a business registration number,
The method may include determining whether a corporation is a business operator from the business registration number;
A method for providing average annual salary information for each company using public institution data, further comprising a.
상기 데이터베이스에서 상기 기업이 속하는 산업의 연령별 근로자수 및 임금총액 통계데이터를 조회하는 단계; 및
상기 기업의 각 연령()별 평균 연봉()을 다음 수학식 1에 따라 구하는 단계;
를 더 포함하는, 공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 방법.
[수학식 1]
여기에서, 는 연령이고, 은 통계데이터의 최저 연령이고, 는 통계데이터의 최고 연령이고, 는 상기 기업의 연령의 평균 연봉이고, 는 상기 기업의 평균 연봉이고, 는 상기 통계데이터의 연령의 월임금 총액이고, 는 상기 통계데이터의 연령의 근로자수이다.In claim 1, the method,
Retrieving statistical data on the number of workers and total wages by age of the industry to which the company belongs in the database; and
Each age of the above companies ( ) average annual salary by ( ) is obtained according to Equation 1 below;
A method for providing average annual salary information for each company using public institution data, further comprising a.
[Equation 1]
From here, is the age, is the minimum age of statistical data, is the highest age of statistical data, is the company's is the average annual salary for the age is the average annual salary of the company, is the statistical data is the total monthly wage for the age, is the statistical data is the number of workers by age.
상기 데이터베이스에서 상기 기업에 대한 이력서 정보를 조회하여, 상기 기업의 연령별 직종별 평균 연봉 및 인원수에 대한 통계데이터를 추출하는 단계; 및
상기 기업의 각 연령()별 직종()별 평균 연봉()을 다음 수학식 2에 따라 구하는 단계;
를 더 포함하는, 공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 방법.
[수학식 2]
여기에서, 는 연령이고, 은 통계데이터의 최저 연령이고, 는 통계데이터의 최고 연령이고, 는 직종이고, 는 상기 기업의 연령 직종의 평균 연봉이고, 는 상기 기업의 평균 연봉이고, 는 상기 통계데이터의 연령 직종의 평균 연봉이고, 는 상기 통계데이터의 연령 직종의 인원수이다.In claim 1, the method,
Retrieving resume information about the company from the database, and extracting statistical data about the average annual salary and number of employees by age and job category of the company; and
Each age of the above companies ( ) by job type ( ) average annual salary by ( ) is obtained according to Equation 2 below;
A method for providing average annual salary information for each company using public institution data, further comprising a.
[Equation 2]
From here, is the age, is the minimum age of statistical data, is the highest age of statistical data, is the occupation, is the company's age The average salary for the occupation is is the average annual salary of the company, is the statistical data age The average salary for the occupation is is the statistical data age is the number of people in the occupation.
입력장치로부터 평균 연봉 정보를 제공받기 원하는 기업의 기업정보를 입력 받는 입력모듈;
상기 데이터베이스에서 상기 기업에 대한 공시데이터 또는 국민연금데이터를 조회하는 데이터베이스 조회모듈;
상기 공시데이터로부터 상기 기업의 평균 연봉을 추출하는 공시데이터 기반 평균 연봉 추출모듈;
상기 국민연금데이터로부터 상기 기업의 평균 연봉을 계산하는 국민연금 기반 평균 연봉 계산모듈;
상기 데이터베이스에서 상기 기업에 대한 공시데이터를 조회한 결과 공시데이터가 존재하지 않는 경우, 상기 데이터베이스에서 상기 기업에 대한 국민연금데이터를 조회하도록 상기 데이터베이스 조회모듈을 제어하는 제어모듈; 및
출력장치로 상기 기업에 대한 공시데이터 기반 평균 연봉 또는 국민연금 기반 평균 연봉을 포함하는 평균 연봉 정보를 출력하는 출력모듈;
을 포함하는, 공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 시스템.A system for providing average annual salary information for each company, including a database storing public institution data and a processor connected to the database through a communication interface, wherein the processor:
An input module that receives corporate information of a company that wants to receive average annual salary information from an input device;
A database query module for querying public disclosure data or national pension data for the company in the database;
A public announcement data-based average annual salary extraction module for extracting an average annual salary of the company from the public announcement data;
a national pension-based average annual salary calculation module for calculating an average annual salary of the company from the national pension data;
a control module controlling the database inquiry module to search for national pension data for the company in the database when the public announcement data does not exist as a result of searching for the public announcement data for the company in the database; and
an output module outputting average annual salary information including an average annual salary based on public announcement data for the company or an average annual salary based on national pension to an output device;
A system for providing average annual salary information for each company using data from public institutions.
상기 국민연금 기반 평균 연봉 계산모듈은,
상기 국민연금데이터로부터 가입자수 정보와 당월 고지금액 정보를 추출하고,
상기 당월 고지금액에 해당하는 임금을 상기 가입자수로 나누어 상기 기업의 추정 평균 연봉을 계산하고,
상기 기업의 추정 평균 연봉에 보정함수를 적용하여 상기 기업의 국민연금 기반 평균 연봉을 구하는,
공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 시스템.In claim 8,
The national pension-based average annual salary calculation module,
Extract information on the number of subscribers and information on the billing amount for the current month from the national pension data,
Calculate the estimated average annual salary of the company by dividing the wage corresponding to the notice amount for the current month by the number of subscribers;
Applying a correction function to the estimated average annual salary of the company to obtain the average annual salary based on the national pension of the company,
A system for providing average annual salary information by company using data from public institutions.
복수 기업들에 대하여, 공시데이터에서 추출한 공시데이터 기반 평균 연봉과 국민연금데이터로부터 계산된 국민연금 기반 추정 평균 연봉을 매칭시켜, 상기 복수 기업들의 평균 연봉 데이터 쌍의 집합을 구하고, 상기 복수 기업들의 평균 연봉 데이터 쌍의 집합을 이용하여, 공시데이터 기반 평균 연봉과 국민연금 기반 추정 평균 연봉의 상관관계에서 상기 보정함수를 구하는 보정함수 생성모듈;
을 더 포함하는, 공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 시스템.In claim 9, the processor,
For multiple companies, a set of average annual salary data pairs of the multiple companies is obtained by matching the average annual salary based on the public disclosure data extracted from the public disclosure data and the estimated average annual salary based on the national pension calculated from the national pension data, and the average annual salary of the multiple companies is obtained. A correction function generation module for obtaining the correction function from a correlation between an average annual salary based on public announcement data and an estimated average annual salary based on national pension, using a set of annual salary data pairs;
A system for providing average annual salary information for each company using public institution data, further comprising a.
상기 보정함수 생성모듈은,
상기 복수 기업들의 평균 연봉 데이터 쌍의 집합에서, 이상치를 제거하고,
상기 이상치가 제거된 복수 기업들의 평균 연봉 데이터 쌍의 집합에서, 국민연금 기반 추정 평균 연봉이 공시데이터 기반 평균 연봉보다 큰 데이터를 삭제하여 복수 기업의 트리밍된 평균 연봉 데이터 쌍의 집합을 구하고,
상기 복수 기업의 트리밍된 평균 연봉 데이터 쌍의 집합에서 회귀함수를 구하는
공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 시스템.In claim 10,
The correction function generation module,
Remove outliers from the set of average annual salary data pairs of the plurality of companies,
In the set of average annual salary data pairs of multiple companies from which the outliers have been removed, data in which the national pension-based estimated average annual salary is greater than the public announcement data-based average annual salary is deleted to obtain a set of trimmed average annual salary data pairs of multiple companies,
Obtaining a regression function from a set of trimmed average annual salary data pairs of the plurality of companies
A system for providing average annual salary information by company using data from public institutions.
상기 기업정보는, 사업자등록번호를 포함하고,
상기 프로세서는, 상기 사업자등록번호로부터 법인사업자 여부 판단하는 사업자 판단모듈;
을 더 포함하는, 공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 시스템.In claim 8,
The company information includes a business registration number,
The processor may include: a business determination module for determining whether a corporation is a corporation based on the business registration number;
A system for providing average annual salary information for each company using public institution data, further comprising a.
상기 데이터베이스에서 상기 기업이 속하는 산업의 연령별 근로자수 및 임금총액 통계데이터를 조회하고, 상기 기업의 각 연령()별 평균 연봉()을 다음 수학식 1에 따라 구하는 연령별 평균연봉 계산모듈;
을 더 포함하는, 공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 시스템.
[수학식 1]
여기에서, 는 연령이고, 은 통계데이터의 최저 연령이고, 는 통계데이터의 최고 연령이고, 는 상기 기업의 연령의 평균 연봉이고, 는 상기 기업의 평균 연봉이고, 는 상기 통계데이터의 연령의 월임금 총액이고, 는 상기 통계데이터의 연령의 근로자수이다.In claim 8, the processor,
In the database, the number of workers and total wages by age of the industry to which the company belongs is inquired, and each age of the company ( ) average annual salary by ( ) Average annual salary calculation module by age to obtain according to Equation 1 below;
A system for providing average annual salary information for each company using public institution data, further comprising a.
[Equation 1]
From here, is the age, is the minimum age of statistical data, is the highest age of statistical data, is the company's is the average annual salary for the age is the average annual salary of the company, is the statistical data is the total monthly wage for the age, is the statistical data is the number of workers by age.
상기 데이터베이스에서 상기 기업에 대한 이력서 정보를 조회하고, 상기 기업의 연령별 직종별 평균 연봉 및 인원수에 대한 통계데이터를 추출하고, 상기 기업의 각 연령()별 직종()별 평균 연봉()을 다음 수학식 2에 따라 구하는 직종별 평균연봉 계산모듈;
을 더 포함하는, 공공기관 데이터를 활용한 기업별 평균 연봉 정보 제공 시스템.
[수학식 2]
여기에서, 는 연령이고, 은 통계데이터의 최저 연령이고, 는 통계데이터의 최고 연령이고, 는 직종이고, 는 상기 기업의 연령 직종의 평균 연봉이고, 는 상기 기업의 평균 연봉이고, 는 상기 통계데이터의 연령 직종의 평균 연봉이고, 는 상기 통계데이터의 연령 직종의 인원수이다.In claim 8, the processor,
Retrieve resume information about the company from the database, extract statistical data on the average annual salary and number of employees by age and occupation of the company, and each age of the company ( ) by job type ( ) average annual salary by ( ) The average annual salary calculation module for each job type is obtained according to Equation 2 below;
A system for providing average annual salary information for each company using public institution data, further comprising a.
[Equation 2]
From here, is the age, is the minimum age of statistical data, is the highest age of statistical data, is the occupation, is the company's age The average salary for the occupation is is the average annual salary of the company, is the statistical data age The average salary for the occupation is is the statistical data age is the number of people in the occupation.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210140209A KR102543428B1 (en) | 2021-10-20 | 2021-10-20 | System and method for providing average salary information of each company using public data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210140209A KR102543428B1 (en) | 2021-10-20 | 2021-10-20 | System and method for providing average salary information of each company using public data |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230056318A KR20230056318A (en) | 2023-04-27 |
KR102543428B1 true KR102543428B1 (en) | 2023-06-14 |
Family
ID=86099803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210140209A KR102543428B1 (en) | 2021-10-20 | 2021-10-20 | System and method for providing average salary information of each company using public data |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102543428B1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101250681B1 (en) | 2012-09-11 | 2013-04-03 | 송철수 | System and method for confirming payslip and calculating hourly wage |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010008121A (en) * | 2000-11-09 | 2001-02-05 | 김진문 | System for measuring an annual salary through communications and a method thereof and a method for seeking jobs using these |
KR20020081881A (en) * | 2001-04-20 | 2002-10-30 | 주식회사 오픈네트워크엔터프라이즈 | System and method for annual salary valuation by mutual estimation on the internet |
KR20030008580A (en) * | 2001-07-19 | 2003-01-29 | 김진우 | Methods of yield of valuation of performing duties ability, estimated annual salary, estimated position on the basis of network and record medium where such methods are recorded. |
KR102177604B1 (en) * | 2019-02-01 | 2020-11-12 | 주식회사 고객경영기술원 | Apparatus and method for predicting salary |
-
2021
- 2021-10-20 KR KR1020210140209A patent/KR102543428B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101250681B1 (en) | 2012-09-11 | 2013-04-03 | 송철수 | System and method for confirming payslip and calculating hourly wage |
Also Published As
Publication number | Publication date |
---|---|
KR20230056318A (en) | 2023-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6162781B2 (en) | Method and apparatus for determining the location of a new point of interest | |
US8972370B2 (en) | Repetitive fusion search method for search system | |
US20180181882A1 (en) | Compensation data prediction | |
US10147037B1 (en) | Method and system for determining a level of popularity of submission content, prior to publicizing the submission content with a question and answer support system | |
US20180047036A1 (en) | User behavior analysis method and device as well as non-transitory computer-readable medium | |
CN110119903B (en) | Data comprehensive analysis system | |
CN110782301A (en) | Order combining method and device, electronic equipment and computer readable storage medium | |
CN112862593B (en) | Credit scoring card model training method, device and system and computer storage medium | |
JP5061999B2 (en) | Analysis apparatus, analysis method, and analysis program | |
US10394804B1 (en) | Method and system for increasing internet traffic to a question and answer customer support system | |
KR102543428B1 (en) | System and method for providing average salary information of each company using public data | |
JP6748526B2 (en) | Calculation device, calculation method, and calculation program | |
JP2020004161A (en) | Examination support apparatus, examination support method, and service providing method | |
JP7184093B2 (en) | Skilled Index Providing Device, Skilled Index Providing Method, and Program | |
CN109934689B (en) | Target object ranking interpretation method and device, electronic equipment and readable storage medium | |
CN113642769A (en) | Travel route recommendation method, device, equipment and storage medium | |
JP2003263320A (en) | Estimating operation support system, method and program | |
US20200311747A1 (en) | Identifying the primary objective in online parameter selection | |
CN112669073A (en) | User retention prediction method and device, electronic equipment and storage medium | |
JP2003022382A (en) | Job mediation system and job mediating method | |
JP2002279119A (en) | Business analyzing system and business analyzing method for workflow management system | |
JP5847867B2 (en) | Equipment for providing reference information for advertisers | |
JP5506875B2 (en) | Equipment for providing reference information for advertisers | |
JP7070203B2 (en) | Maintenance management program, maintenance management system and maintenance management method | |
CN114338429B (en) | Network bandwidth determining method and device and electronic equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right |