KR102318103B1 - 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 및 이를 이용한 추천 장치 - Google Patents
구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 및 이를 이용한 추천 장치 Download PDFInfo
- Publication number
- KR102318103B1 KR102318103B1 KR1020200038685A KR20200038685A KR102318103B1 KR 102318103 B1 KR102318103 B1 KR 102318103B1 KR 1020200038685 A KR1020200038685 A KR 1020200038685A KR 20200038685 A KR20200038685 A KR 20200038685A KR 102318103 B1 KR102318103 B1 KR 102318103B1
- Authority
- KR
- South Korea
- Prior art keywords
- job seeker
- job
- matching
- resume
- history information
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
- G06Q10/1053—Employment or hiring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
- G06Q10/063112—Skill-based matching of a person or a group to a task
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 및 장치가 제공된다. 본 개시의 몇몇 실시예에 따른 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 은, 컴퓨팅 장치에서 기계 학습(machine-learning)을 수행하는 방법에 있어서, 구직자의 이력 정보와 구인자의 직무 명세서 사이의 매칭 및 합격 여부에 대한 score를 포함하는 실제 학습 데이터를 얻는 단계, 상기 구직자와 상기 구직자의 당시 재직 중 포지션 사이의 매칭 및 합격을 가리키는 데이터를 포함하는 가상 학습 데이터를 얻는 단계 및 상기 실제 학습 데이터 및 상기 가상 학습 데이터를 이용하여 구직자-구인자 매칭의 합격 여부에 대한 데이터를 출력하기 위한 추천 모델을 학습시키는 단계를 포함할 수 있다.
Description
본 개시는 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 및 그 장치에 관한 것이다. 보다 자세하게는, 구직자-구인자 매칭을 학습하기 위한 트레이닝 데이터셋을 증가시킬 수 있는 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 및 이를 이용한 추천 장치에 관한 것이다.
인적자원관리 시스템(HRMS,Human Resource Managament System)은 기업의 인적자원을 확보, 개발 및 관리하는 시스템으로서, 구직자의 요구사항과 구인자의 요구사항을 통해 구직자와 구인자를 연결시켜주고 관리하는 시스템이다. 종래의 인적자원 시스템은 구직자로부터 이력서를 온라인으로 수집하고, 구인자로부터 요구사항을 온라인으로 수집하였으며, 수집된 이력서에 대한 이력 정보와 요구사항을 매칭하여 이에 대한 결과를 구직자 또는 구인자에게 제공하는 수준에 그쳤다. 또한, 종래 등록특허공보 제10-1917139호 "구인 구직 플랫폼 제공 서버 및 이의 동작방법"에서는 구직자와 구인자를 매칭하기 위해 인공지능을 이용하여 구인자와 구직자 간에 서로 적합한 인재 또는 기업을 추천하려는 시도가 있었지만 이력서의 이력 정보를 전혀 고려하지 않은 채 채용 결과와 구직자의 키워드만을 이용하여 기계학습을 수행함에 따라 구인자의 요구사항에 적합한 구인자가 추천되지 않아 서로에게 적합한 매칭이 정밀하게 이루어지지 않는 문제점이 존재하였다. 이로 인해, 종래의 인적자원관리 시스템은 활용빈도가 저하되었고, 구인자가 각각의 이력서를 하나하나 수동으로 검토하는데 시간과 비용이 소모되는 문제점이 더 발생되었다. 이에 따라 종래의 인적자원관리 시스템에 대하여 보완 및 개선이 필요하였는데, 구직자의 이력 정보와 구인자의 요구 사항을 고려하여 기계 학습(Machin-Learning)을 수행함에 따라 구직자와 구인자를 효율적으로 매칭시켜 구직자 및 구인자 각각에게 그 결과를 제공할 수 있는 기술이 요구된다.
이러한 기계 학습 방법을 이용한 인적자원관리 시스템을 구현하기 위해 구직자와 구인자를 매칭하는 기계 학습 방법은 구직자의 이력서를 트레이닝 데이터셋으로 활용할 수 있다. 그러나 이력서를 트레이닝 데이터셋으로 활용하는 경우 구직자로부터 수집된 이력서의 형식이 통일되지 않고 다양한 형식으로 작성되었기 때문에, 구직자로부터 수집된 이력서를 곧장 트레이닝 데이터셋으로 활용할 수 없었다. 왜냐하면 기계 학습을 수행하기 위해 데이터에서 적절한 피쳐를 선택해야 되는데, 각각 형식이 상이한 이력서에서 통일된 피쳐를 선택하기 어렵기 때문이다.
또한, 구직자의 이력서와 구직자가 실제로 기업에 입사 지원한 결과를 이용하여 트레이닝 데이터셋으로 활용할 수 있는데, 잘못된 학습 결과에 따라 구직자가 이직하기 전인 현재의 재직 상태가 가장 최적의 상태임에도 불구하고 구직자에게 다른 회사로 이직하도록 추천 결과를 제공할 여지도 있어 구직자가 잘못된 결과를 토대로 이직을 하게 될 수 있다. 특히, 구직자의 이력 정보와 구직자의 실제 입사 결과가 완벽하게 전산화되기 전에 입사를 완료한 구직자들에 대해 구인자를 제대로 매칭하기 어려운 점이 있다.
이처럼 이력서의 양은 방대하더라도 기계 학습을 위한 통일된 형식의 트레이닝 데이터셋의 양이 실질적으로 부족하기 때문에 이력서를 이용하여 인적자원관리 시스템을 기계 학습하는데 어려움이 존재하였다. 상기와 같은 문제점에 따라 효과적으로 구직자의 이력 정보와 구인자의 직무 명세서를 매칭하기 위한 기계 학습 방법과, 기계 학습 방법의 성능을 향상시키기 위한 트레이닝 데이터셋을 확보하는 방안이 요구된다.
본 개시의 몇몇 실시예들을 통해 해결하고자 하는 기술적 과제는, 구직자의 이력 정보와 구인자의 직무 명세서를 매칭시켜 구직자에게 적합한 회사와 포지션을 추천하고, 구인자에게는 적합한 지원자를 추천하여 서로 합격 여부에 대한 데이터를 출력하는 학습을 수행함에 있어서, 트레이닝 데이터셋을 증가시켜 학습에 따른 성능 개선 효과를 얻을 수 있는 방법 및 그 방법을 수행하는 장치를 제공하는 것이다.
또한, 본 개시의 몇몇 실시예들을 통해 해결하고자 하는 다른 기술적 과제는, 구직자의 이력 정보와 구인자의 직무 명세서에 대한 매칭을 점수로 산정하여 합격 여부를 정확하게 분석하는 방법 및 그 방법을 수행하는 장치를 제공하는 것이다.
또한, 본 개시의 몇몇 실시예들을 통해 해결하고자 하는 다른 기술적 과제는, 비정형 이력서를 정형화시키는 과정을 학습하여 보다 적은 비용으로 효율적으로 비정형 이력서를 정형화시키고, 이에 따라 구직자의 이력 정보와 구인자의 직무 명세서를 매칭시켜 합격 여부에 대한 데이터를 출력하는 학습에 대한 트레이닝 데이터셋을 증가시킬 수 있는 방법 및 그 방법을 수행하는 장치를 제공하는 것이다.
상기 기술적 과제를 해결하기 위한, 본 개시의 몇몇 실시예에 따른 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 은, 컴퓨팅 장치에서 기계 학습(machine-learning)을 수행하는 방법에 있어서, 구직자의 이력서와 구인자의 직무 명세서 사이의 매칭 및 합격 여부를 포함하는 실제 학습 데이터를 얻는 단계, 상기 구직자의 이력서와 상기 구직자의 당시 재직 중 포지션 사이의 매칭 및 합격을 가리키는 데이터를 포함하는 가상 학습 데이터를 얻는 단계 및 상기 실제 학습 데이터 및 상기 가상 학습 데이터를 이용하여 구직자-구인자 매칭의 합격 여부에 대한 데이터를 출력하기 위한 추천 모델을 학습시키는 단계를 포함할 수 있다.
일 실시예에서, 상기 실제 학습 데이터를 얻는 단계는, 상기 구직자의 이력 정보를 포함하는 비정형 이력서를 미리 분류된 형식의 정형화 이력서로 변환하는 단계를 포함할 수 있다.
일 실시예에서, 상기 정형화 이력서로 변환하는 단계는, 상기 이력 정보에 대하여 형태소 분석을 수행하여 상기 이력 정보에 대한 키워드를 추출하는 단계, 상기 이력 정보가 저장된 말뭉치 사전(Corpus Set)을 이용하여 상기 키워드에 대해 개체명 인식을 수행하는 단계 및 상기 개체명 인식을 통해 분류된 상기 키워드의 분류에 따라 상기 키워드를 상기 정형화 이력서의 필드에 입력하는 단계를 포함할 수 있다.
일 실시예에서, 상기 정형화 이력서로 변환하는 단계는, 상기 키워드의 특징에 따라 상기 말뭉치 사전에 상기 키워드를 분류하여 상기 비정형 이력서에 대하여 상기 개체명 인식을 수행하는 개체명 인식 모델을 학습하는 단계를 더 포함할 수 있다.
일 실시예에서, 상기 키워드의 특징은, 상기 비정형 이력서에 배치된 상기 키워드의 순서 및 상기 키워드의 의미를 포함할 수 있다.
일 실시예에서, 상기 정형화 이력서로 변환하는 단계는, 상기 키워드에서 의미를 가지지 않는 불용어를 제거하고 상기 키워드의 어간을 분석하여 상기 키워드를 전처리하는 단계를 더 포함할 수 있다.
일 실시예에서, 상기 정형화 이력서의 필드는, 상기 구직자의 나이, 전공 정보, 학력 정보, 경력 정보, 직무 정보, 어학 정보, IT 스킬, 직무 스킬, 역량 정보를 포함할 수 있다.
일 실시예에서, 상기 실제 학습 데이터를 얻는 단계는, 상기 구직자의 이력 정보 및 상기 구직자가 상기 구인자의 직무 명세서에 대해 실제 입사 지원한 결과에 따른 실제 입사 결과를 이용하여 상기 구직자의 이력 정보와 구인자의 직무 명세서 사이의 매칭 및 합격 여부를 분석하는 단계를 포함할 수 있다.
일 실시예에서, 상기 정형화 이력서와 상기 실제 입사 결과를 기초로 상기 구직자의 이력 정보와 상기 구인자의 직무 명세서 사이의 매칭을 학습하여 상기 이력 정보의 필드 별로 가중치를 도출하고, 상기 가중치를 이용하여 상기 이력 정보의 필드 별로 상기 구직자의 이력 정보와 상기 구인자의 직무 명세서 사이의 매칭에 대한 점수를 산출하는 단계를 포함를 포함할 수 있다.
일 실시예에서, 상기 구직자의 이력 정보와 상기 구인자의 직무 명세서 사이의 매칭 및 합격 여부를 분석하는 단계는, 상기 이력 정보의 필드 별로 산출된 점수를 종합하여 상기 구직자의 이력 정보와 구인자의 직무 명세서 사이의 상기 합격 여부를 결정하는 단계를 더 포함할 수 있다.
일 실시예에서, 상기 가상 학습 데이터를 얻는 단계는, 상기 구직자가 상기 구직자의 당시 재직 중이거나 이전 근무한) 포지션에 가상으로 지원한 가상 입사 결과를 기초로 상기 가상 학습 데이터를 생성하는 단계를 포함할 수 있다.
일 실시예에서, 상기 가상 학습 데이터를 얻는 단계는, 상기 구직자와 상기 구직자의 당시 재직 중 포지션 사이의 매칭에 대한 점수를 향상시키는 단계를 더 포함할 수 있다.
일 실시예에서, 상기 구직자-구인자 매칭의 합격 여부에 대한 데이터를 출력하기 위한 추천 모델을 학습시키는 단계는, 상기 실제 학습 데이터와 상기 가상 학습 데이터를 반영하여 상기 추천 모델의 가중치를 업데이트하는 단계를 포함할 수 있다.
일 실시예에서, 상기 매칭 및 합격 여부에 따른 결과를 상기 구직자에게 제공하는 단계를 더 포함할 수 있다.
일 실시예에서, 상기 매칭 및 합격 여부에 따른 결과를 상기 구인자에게 제공하는 단계를 더 포함할 수 있다.
상술한 기술적 과제를 해결하기 위한 본 개시의 다른 몇몇 실시예에 따른 멀티태스크 학습 방법은, 컴퓨팅 장치에서 수행되는 방법에 있어서, 구직자의 이력 정보를 포함하는 비정형 이력서를 자연어 처리하는 단계, 상기 자연어 처리 결과를 이용하여 상기 비정형 이력서를 미리 분류된 형식의 정형화 이력서로 변환하는 단계, 상기 정형화 이력서와 상기 구직자의 구인자에 대한 실제 입사 결과를 기초로 상기 이력 정보에서 각 필드에 대한 점수를 스코어링하여 상기 구직자의 이력 정보와 구인자의 직무 명세서 사이의 매칭 및 합격 여부를 분석하는 단계, 상기 구직자의 이력 정보와 구인자의 직무 명세서 사이의 매칭 및 합격 여부 결과에 대한 데이터를 상기 구직자 및 구인자에게 제공하는 단계를 포함할 수 있다.
상술한 기술적 과제를 해결하기 위한 본 개시의 다른 몇몇 실시예에 따른 멀티태스크 학습 방법은, 프로세서, 네트워크 인터페이스, 메모리 및 상기 메모리에 로드(load)되고, 상기 프로세서에 의해 실행되는 컴퓨터 프로그램을 포함하되, 상기 컴퓨터 프로그램은, 구직자의 이력 정보와 구인자의 직무 명세서 사이의 매칭 및 합격 여부를 포함하는 실제 학습 데이터를 얻는 인스트럭션(instruction), 상기 구직자와 상기 구직자의 당시 재직 중 포지션 사이의 매칭 및 합격을 가리키는 데이터를 포함하는 가상 학습 데이터를 얻는 인스트럭션 및 상기 실제 학습 데이터 및 상기 가상 학습 데이터를 이용하여 구직자-구인자 매칭의 합격 여부에 대한 데이터를 출력하기 위한 추천 모델을 학습시키는 인스트럭션을 포함할 수 있다.
도 1은 본 개시의 몇몇 실시예에 따른 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법을 설명하기 위한 도면이다.
도 2는 본 개시의 몇몇 실시예에 따른 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법을 개략적으로 나타내는 흐름도이다.
도 3은 도 2를 참조하여 수행되는 일부 단계를 구체적으로 설명하기 위한 흐름도이다.
도 4는 도 3을 참조하여 수행되는 일부 단계를 구체적으로 설명하기 위한 흐름도이다.
도 5는 도 4에 따라 비정형 이력서를 정형화시키는 과정을 나타내는 예시도이다.
도 6은 본 개시의 몇몇 실시예에 따라 비정형 이력서를 정형화하는 과정을 학습할 때 학습의 피쳐 가 되는 필드를 설명하기 위한 도면이다.
도 7은 도 3를 참조하여 수행되는 일부 단계를 구체적으로 설명하기 위한 흐름도이다.
도 8은 본 개시의 몇몇 실시예에 따라 정형화 이력서를 이용하여 실제 학습 데이터를 얻는 방법을 설명하기 위한 예시도이다.
도 9는 본 개시의 몇몇 실시예에 따른 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법을 나타내는 흐름도이다.
도 10은 본 개시의 몇몇 실시예에 따라 가상 학습 데이터를 얻는 방법을 설명하기 위한 예시도이다.
도 11은 실제 학습 데이터와 가상 학습 데이터를 이용하여 합격 여부에 대한 데이터를 출력하는 방법을 설명하기 위한 도면이다.
도 12는 본 개시의 몇몇 실시예에 따라 각 기업 인사 담당자에게 정형화된 이력서를 이용하여 채용중인 포지션에 대해 매칭 점수를 산정하여 매칭 점수에 따라 각각 가장 적합한 지원자에 대한 데이터를 출력하는 예시를 나타내는 도면이다.
도 13은 본 개시의 몇몇 실시예에 따라 구직자의 이력 정보와 구인자의 직무 명세서 사이의 매칭을 통해 추천 시스템을 반복 학습하여 구인자의 요구 사항을 분석하고, 구인자의 요구 사항에 대하여 이력 정보의 필드 별로 가중치를 산출하는 예시를 나타내는 도면이다.
도 14는 정형화 이력서에 따라 이력 정보의 필드 별로 매칭에 대한 점수가 산출된 결과를 설명하기 위한 도면이다.
도 15는 본 개시의 다양한 실시예에 따른 장치를 구현할 수 있는 예시적인 컴퓨팅 장치를 나타내는 하드웨어 구성도이다.
도 2는 본 개시의 몇몇 실시예에 따른 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법을 개략적으로 나타내는 흐름도이다.
도 3은 도 2를 참조하여 수행되는 일부 단계를 구체적으로 설명하기 위한 흐름도이다.
도 4는 도 3을 참조하여 수행되는 일부 단계를 구체적으로 설명하기 위한 흐름도이다.
도 5는 도 4에 따라 비정형 이력서를 정형화시키는 과정을 나타내는 예시도이다.
도 6은 본 개시의 몇몇 실시예에 따라 비정형 이력서를 정형화하는 과정을 학습할 때 학습의 피쳐 가 되는 필드를 설명하기 위한 도면이다.
도 7은 도 3를 참조하여 수행되는 일부 단계를 구체적으로 설명하기 위한 흐름도이다.
도 8은 본 개시의 몇몇 실시예에 따라 정형화 이력서를 이용하여 실제 학습 데이터를 얻는 방법을 설명하기 위한 예시도이다.
도 9는 본 개시의 몇몇 실시예에 따른 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법을 나타내는 흐름도이다.
도 10은 본 개시의 몇몇 실시예에 따라 가상 학습 데이터를 얻는 방법을 설명하기 위한 예시도이다.
도 11은 실제 학습 데이터와 가상 학습 데이터를 이용하여 합격 여부에 대한 데이터를 출력하는 방법을 설명하기 위한 도면이다.
도 12는 본 개시의 몇몇 실시예에 따라 각 기업 인사 담당자에게 정형화된 이력서를 이용하여 채용중인 포지션에 대해 매칭 점수를 산정하여 매칭 점수에 따라 각각 가장 적합한 지원자에 대한 데이터를 출력하는 예시를 나타내는 도면이다.
도 13은 본 개시의 몇몇 실시예에 따라 구직자의 이력 정보와 구인자의 직무 명세서 사이의 매칭을 통해 추천 시스템을 반복 학습하여 구인자의 요구 사항을 분석하고, 구인자의 요구 사항에 대하여 이력 정보의 필드 별로 가중치를 산출하는 예시를 나타내는 도면이다.
도 14는 정형화 이력서에 따라 이력 정보의 필드 별로 매칭에 대한 점수가 산출된 결과를 설명하기 위한 도면이다.
도 15는 본 개시의 다양한 실시예에 따른 장치를 구현할 수 있는 예시적인 컴퓨팅 장치를 나타내는 하드웨어 구성도이다.
이하, 첨부된 도면을 참조하여 본 개시의 바람직한 실시예들을 상세히 설명한다. 본 개시의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 개시의 기술적 사상은 이하의 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 이하의 실시예들은 본 개시의 기술적 사상을 완전하도록 하고, 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 본 개시의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 개시의 기술적 사상은 청구항의 범주에 의해 정의될 뿐이다.
각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 개시를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 개시의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다. 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 개시를 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.
또한, 본 개시의 구성 요소를 설명하는 데 있어서, 제1, 제2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.
명세서에서 사용되는 "포함한다 (comprises)" 및/또는 "포함하는 (comprising)"은 언급된 구성 요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성 요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
본 명세서에 대한 설명에 앞서, 본 명세서에서 사용되는 몇몇 용어들에 대하여 명확하게 하기로 한다.
본 명세서에서, 매칭이란, 구직자의 이력 정보와 구인자의 직무 명세서 사이의 적합도 혹은 구직자의 이력 정보와 구인자의 직무 명세서 사이의 적합도에 따른 점수를 지칭한다. 예를 들어, 구직자의 이력 정보와 구인자의 직무 명세서가 매칭은 학습된 모델을 이용하여 구직자의 이력 정보와 구인자의 요구사항을 비교하여 산출된 점수를 지칭한다.
본 명세서에서 인스트럭션(instruction)이란, 기능을 기준으로 묶인 일련의 컴퓨터 판독가능 명령어들로서 컴퓨터 프로그램의 구성 요소이자 프로세서에 의해 실행되는 것을 가리킨다.
이하, 본 개시의 몇몇 실시예들에 대하여 첨부된 도면에 따라 상세하게 설명한다.
도 1은 본 개시의 몇몇 실시예에 따른 구직자-구인자 매칭의 합격 여부(50) 판단을 위한 기계 학습 방법을 설명하기 위한 도면이다.
도 1에 도시된 바와 같이, 기계 학습 장치(100)는 구직자-구인자 매칭의 합격 여부(50) 판단을 수행하는 컴퓨팅 장치이다. 상기 컴퓨팅 장치는, 노트북, 데스크톱(desktop), 랩탑(laptop) 등이 될 수 있으나, 이에 국한되는 것은 아니며 컴퓨팅 기능이 구비된 모든 종류의 장치를 포함할 수 있다. 상기 컴퓨팅 장치의 일 예는 도 15를 참조하도록 한다.
도 1은 기계 학습 장치(100)가 하나의 컴퓨팅 장치로 구현된 것을 예로써 도시하고 있으나, 실제 물리적 환경에서 기계 학습 장치(100)의 제1 기능은 제1 컴퓨팅 장치에서 구현되고, 기계 학습 장치(100)의 제2 기능은 제2 컴퓨팅 장치에서 구현될 수도 있다.
구직자(1)는 직업을 구하는 사용자의 단말 또는 서버 등의 장치로 이루어질 수 있다. 구인자(2)는 직무 포지션을 제공하는 사용자의 단말 또는 서버 등의 장치로 이루어질 수 있다. 구인자(2)는 기업, 상점, HR 부서, 영리 또는 비영리 단체, 법인 또는 조합에 의해 동작되는 장치로 이루어질 수 있으나 이에 한정되는 것은 아니고, 직무 포지션을 제공하여 구직자(1)를 고용하려는 다양한 단체의 장치로 변경될 수 있다. 한편 구직자(1) 및 구인자(2)는 인적자원관리 서버로 구성될 수도 있다.
기계 학습 장치(100)는 구직자(1)와 구인자(2)로부터 각각 비정형 이력서(10)와 실제 입사 결과(20)를 획득하여 구직자(1)의 구인자(2)에 대한 합격 여부(50) 판단에 대한 모델을 학습할 수 있다. 기계 학습 장치(100)는 후술하는 바와 같이 비정형 이력서(10)와 실제 입사 결과(20)를 이용하여 실제 학습 데이터(30)를 얻고, 구직자(1)와 구직자(1)의 당시 재직 중 포지션 사이의 매칭 및 합격을 가리키는 데이터를 포함하는 가상 학습 데이터(40)를 얻을 수 있다.
도 1에서 기계 학습 장치(100)는 비정형 이력서(10)와 실제 입사 결과(20)를 구직자(1) 및 구인자(2)로부터 얻는 것으로 표현되었는데, 도 1은 기계 학습 장치(100)가 상기 데이터를 수신하는 관계를 한정하는 것은 아니고 일 예시를 나타낸 것이며, 기계 학습 장치(100)는 비정형 이력서(10)와 실제 입사 결과(20)를 인적자원 관리 서버로부터 수신할 수도 있으며, 상기 도면이 데이터의 출처를 한정하는 것은 아니다.
기계 학습 장치(100)는 실제 학습 데이터(30)와 가상 학습 데이터(40)를 이용하여 구직자-구인자 매칭의 합격 여부(50)에 대한 데이터를 출력하기 위한 모델을 학습시킬 수 있다.
기계 학습 장치(100)는 신경망(neural network)을 이용하여 상기 모델을 학습할 수 있다. 본 명세서에서, 신경망(neural network)이란 신경 구조를 모방하여 고안된 모든 종류의 기계 학습 모델을 포괄하는 용어이다. 가령, 상기 신경망은 인공 신경망(artificial neural network; ANN), 컨볼루션 신경망(convolutional neural network; CNN) 등과 같이 모든 종류의 신경망 기반 모델을 포함할 수 있다. 상기 신경망은 복수의 태스크에 의해 공유되는 적어도 하나의 공유 레이어(shared layer)를 포함할 수 있고, 기계 학습을 통해 상기 공유 레이어의 가중치(즉, 학습 파라미터)가 업데이트될 수 있다.
기계 학습 장치(100)는 학습 결과를 통해 구직자(1)와 구인자(2) 사이의 매칭의 합격 여부(50)에 대한 데이터를 출력하여 구직자(1) 또는 구인자(2)에게 상기 합격 여부(50)에 대한 데이터를 제공할 수 있다.
지금까지 도 1을 참조하여 본 개시의 몇몇 실시예에 따른 기계 학습 장치(100)의 동작 및 학습 환경에 대하여 설명하였다. 이하에서는, 본 개시의 다양한 실시예들에 따른 방법들에 대하여 설명하도록 한다.
상기 방법들의 각 단계는 컴퓨팅 장치에 의해 수행될 수 있다. 다시 말하면, 상기 방법들의 각 단계는 컴퓨팅 장치의 프로세서에 의해 실행되는 하나 이상의 인스트럭션들로 구현될 수 있다. 상기 방법들에 포함되는 모든 단계는 하나의 물리적인 컴퓨팅 장치에 의하여 실행될 수도 있을 것이나, 상기 방법들의 제1 단계들은 제1 컴퓨팅 장치에 의하여 수행되고, 상기 방법들의 제2 단계들은 제2 컴퓨팅 장치에 의하여 수행될 수도 있다. 이하에서는, 상기 방법들의 각 단계가 기계 학습 장치(100)에 의해 수행되는 것을 가정하여 설명을 이어가도록 한다. 따라서, 상기 방법들에 관한 설명에서 각 동작의 주어가 생략된 경우, 상기 예시된 장치에 의하여 수행될 수 있는 것으로 이해될 수 있을 것이다. 또한, 이하에서 후술될 방법들은 필요에 따라 논리적으로 수행 순서가 바뀔 수 있는 범위 안에서 각 동작의 수행 순서가 바뀔 수 있음은 물론이다.
도 2는 본 개시의 몇몇 실시예에 따른 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법을 개략적으로 나타내는 흐름도이다.
도 2를 참조하면, 몇몇 실시예에 따르면, 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법은 실제 학습 데이터(30)를 얻는 단계(S100), 가상 학습 데이터(40)를 얻는 단계(s200) 및 구직자-구인자 매칭의 합격 여부(50)에 대한 데이터를 출력하기 위한 모델이 학습되는 단계(S300)가 수행될 수 있다. 이하 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법은 설명의 편의상 기계 학습 방법이라고 약칭한다.
단계 S100에서, 구직자(1)와 구인자(2) 사이의 매칭 및 합격 여부(50)를 포함하는 실제 학습 데이터(30)가 얻어질 수 있다. 실제 학습 데이터(30)는 기계 학습 장치(100)에 의해서 학습된 데이터로서 구직자(1)의 이력 정보, 구인자(2)의 포지션 정보, 구직자(1)의 구인자(2)에 대한 매칭 및 그 매칭에 따른 합격 결과를 포함할 수 있다. 실제 학습 데이터(30)에 포함된 이력 정보는 후술하는 바와 같이 비정형 이력서(10)에 포함된 이력 정보를 정형화하여 정형화된 데이터일 수 있다. 구인자(2)의 포지션 정보는 구인자(2)로부터 제공되고 형식이 미리 비정형 데이터 혹은 구조화된 데이터일 수 있다. 구직자(1)의 구인자(2)에 대한 매칭은 점수로 이루어질 수 있는데, 구직자(1)가 구인자(2)에 지원하였을 때 합격될 수 있는 점수를 의미할 수 있다. 실제 학습 데이터(30)에 대한 보다 구체적인 내용은 도 8에서 설명하도록 한다.
단계 S200에서, 구직자(1)와 상기 구직자(1)의 당시 재직 중 포지션 사이의 매칭 및 합격을 가리키는 데이터를 포함하는 가상 학습 데이터(40)를 얻을 수 있다. 가상 학습 데이터(40)는 실제 학습 데이터(30)를 기반으로 생성한 데이터로서, 구직자(1)가 현재 재직 중 포지션에 다시 지원한 것으로 가정하여 생성한 데이터일 수 있다. 가상 학습 데이터(40)에 대한 상세한 내용은 도 10에서 설명하도록 한다.
단계 S300에서 실제 학습 데이터(30) 및 가상 학습 데이터(40)를 이용하여 구직자-구인자 매칭의 합격 여부(50)에 대한 데이터를 출력하기 위한 모델이 학습될 수 있다. 이때, 구직자-구인자 매칭의 합격 여부(50)에 대한 데이터는 추천시스템을 통해 도출된 각 필드별 점수와 함께 합격 또는 불합격에 대한 정보를 포함할 수 있다. 이러한 합격 여부(50)에 대한 데이터는 매칭이 미리 설정된 점수를 초과하는 경우 합격인 것으로 출력될 수 있는데, 미리 설정된 점수는 구인자(2)의 해당 포지션에 대한 통계를 통하여 결정될 수 있다. 구직자-구인자 매칭의 합격 여부(50)에 대한 데이터는 실제 학습 데이터(30) 및 가상 학습 데이터(40)가 갱신됨에 따라 함께 변경될 수 있으며, 이러한 과정을 수행하면서 구직자-구인자의 매칭에 영향을 미치는 속성에 대해 가중치를 업데이트하여 추천 모델을 학습할 수 있다.
도 3은 도 2를 참조하여 수행되는 일부 단계를 구체적으로 설명하기 위한 흐름도이다.
단계 S100에서 실제 학습 데이터(30)를 얻게 될 때, 단계 S110에서 비정형 이력서(10)를 정형화 이력서(11)로 변환되고, 단계 S130에서 구직자(1)와 상기 구인자(2) 사이의 매칭 및 합격 여부(50)가 분석될 수 있다.
먼저, 단계 S110에서, 비정형 이력서(10)는 미리 분류된 형식의 정형화 이력서(11)로 변환될 수 있다. 비정형 이력서(10)는 구직자(1)의 이력 정보를 포함할 수 있다. 비정형 이력서(10)는 이력 정보를 포함하는 다양한 형식의 데이터를 지칭하며, 이력 정보 항목이 나열되어 상기 이력 정보에 대한 상기 구직자(1)의 정보가 기재된 이력서, 이력 정보 항목이 나열되지 않고 상기 구직자(1)의 정보만 나열된 이력서, 구직자(1)의 정보가 서술식으로 기재된 이력서 등 형식에 한정되지 않고, 구직자(1)의 이력 정보가 포함된 다양한 형태로 구성될 수 있다.
정형화 이력서(11)는 미리 분류된 형식으로 형식이 구조화된 이력서일 수 있다. 예를 들어, 정형화 이력서(11)는 구직자의 나이, 전공 정보, 학력 정보, 경력 정보, 직무 정보, 어학 정보, IT 스킬, 직무 스킬, 역량 정보의 필드를 포함할 수 있으며, 이에 한정되는 것은 아니고 형식이 구조화되어 이력 정보를 포함하는 다양한 형태로 구성될 수 있다. 단계 S110에 대한 보다 구체적인 내용을 도 4 내지 도 6을 참조하여 설명하도록 한다.
도 4는 도 3을 참조하여 수행되는 일부 단계를 구체적으로 설명하기 위한 흐름도이다.
도 4에서 먼저 단계 S111의 이력 정보에 대하여 형태소 분석을 수행하여 이력 정보에 대한 키워드가 추출될 수 있다. 이후, 단계 S113에서 추출된 키워드에 대해 전처리가 수행될 수 있다. 단계 S113에서 키워드에서 의미를 가지지 않는 불용어를 제거하고 키워드의 어간이 분석될 수 있다. 어간이 분석된 키워드는 단어의 원형이 될 수 있다. 단계 S115에서 전처리가 수행된 키워드에 대해 개체명 인식(Named-Entity Recognition, NER)이 수행될 수 있다. 이때, 이력 서의 주요 단어에 대한 정보가 저장된 말뭉치 사전(200)을 이용하여 키워드에 대해 개체명 인식이 수행될 수 있다. 단계 S117에서 단계 S115에서 개체명 인식이 수행될 때 키워드의 속성에 따라 상기 말뭉치 사전(200)에 키워드를 분류하는 모델이 학습될 수 있다. 단계 S118에서 NER 모델에서 탐지되지 못한 개체가 말뭉치 사전에 분류될 수 있다. 이에 따라, NER 모델에서 탐지되지 못한 용어는 후에 NER 모델에서 탐지될 수 있다. 본 단계에서 비정형 이력서(10)에 기재된 키워드의 의미를 기초로 개체명 인식 모델이 학습될 수 있다. 단계 S119에서, 개체명 인식을 통해 분류된 키워드의 분류에 따라 상기 키워드가 정형화 이력서(11)의 필드에 입력될 수 있다. 정형화 이력서(11)의 필드는, 구직자(1)의 나이, 전공 정보, 학력 정보, 경력 정보, 어학 정보, 스킬, 역량 정보로 분류될 수 있으나 이에 한정되는 것은 아니고, 비정형 이력서(10)에 포함된 이력 정보에 따라 유동적으로 함께 변동될 수도 있다.
도 5는 도 4에 따라 비정형 이력서를 정형화시키는 과정을 나타내는 예시도이다.
도 5를 참조하면, 비정형 이력서(10)는 형태가 정형화되지 않아 어느 위치가 어떤 이력 정보를 나타내는지 파악하기 용이하지 않다. 기계 학습 장치(100)는 이러한 비정형 이력서(10)에 대해 개체명 인식 모델(S115)과 말뭉치 사전(200)을 이용하여 정형화 이력서(11)로 변경한 뒤 생성된 정형화 이력서(11)를 학습 장치에 저장할 수 있다. 기계 학습 장치(100)는 말뭉치 사전(200)을 이용하여 비정형 이력서(10)를 정형화하는 모델을 학습시킬 수 있다.
도 6은 본 개시의 몇몇 실시예에 따라 비정형 이력서를 정형화하는 과정을 학습할 때 학습의 속성이 되는 키워드를 설명하기 위한 도면이다.
도 6을 참조하면, 단계 S111에서 형태소 분석이 수행되어 비정형 이력서(10) 내에 포함된 토큰에 대한 키워드가 추출될 수 있다. 단계 S111이 수행되면, 도 5에서 비정형 이력서(10)에 대해 상측에 '김지원'이라는 키워드가 추출되고, 그 우측 아래 '21 kangnam-ku, Seoul'이라는 키워드가 추출되고, 그 아래 '82-10-xxxx-yyyy' 라는 키워드가 추출될 수 있다. 또한, 그 왼쪽 아래에는 'EDUCATION'이라는 키워드, 'Stanford MS in Computer Science.'라는 키워드가 추출될 수 있다. 이러한 방식으로 비정형 이력서(10) 내에 포함된 모든 키워드가 추출될 수 있다. 이때, 단계 S111에서 형태소 분석이 수행될 때 언어의 종류, 글자의 폰트, 크기 등은 관계없이 모든 토큰에 대해 키워드가 추출될 수 있다.
이후, 단계 S113에서 추출된 키워드에 대해 전처리가 수행될 수 있다. 단계 S113에서 키워드에서 의미를 가지지 않는 불용어를 제거하고 키워드의 어간이 분석될 수 있다. 어간이 분석된 키워드는 단어의 원형이 될 수 있다.
단계 S115에서 전처리가 수행된 키워드에 대해 개체명 인식(Named-Entity Recognition, NER)이 수행될 수 있다. 여러 개의 개체명 인식 모델을 이용하여 자체적인 개체명 인식 모델이 구축될 수 있다. 또한, 개체명 인식 모델에서 탐지하지 못한 개체들을 추출하여, 말뭉치 사전(200)을 생성할 수 있다. 이력 정보가 저장된 말뭉치 사전(200)을 이용하여 키워드에 대해 개체명 인식이 수행될 수 있다. 말뭉치 사전(200)은 이력 정보에 포함된 단어 혹은 개체들이 저장된 데이터베이스일 수 있다. 개체명 인식 모델은 이력 정보의 후보자 이름, 회사명, 지역, 전공, 학교 등의 정보가 학습되고, 말뭉치 사전(200)에는 이력 정보에는 포함되었으나, 개체명 인식 모델이 탐지하지 못한 중요한 단어를 사전화 하여 저장할 수 있다(예를 들어: language skill, 컴퓨터 스킬 등)은 이력 정보의 분류를 저장할 수 있고, 분류에 해당될 수 있는 구직자(1)의 정보를 저장할 수 있다. 예를 들어 개체명 인식 모델은 이력 정보가 이름 정보, 전공 정보, 학력 정보, 경력 정보로 분류된 것으로 학습될 수 있고, 이러한 분류에 의해 탐지되지 못한 이력 정보가(컴퓨터 스킬, 스킬 SET 등) 존재한다고 판단되는 경우 말뭉치 사전(200)에 해당 이력 정보를 해당 분류에 저장할 수 있다.
학습된 개체명 인식 모델은 후술하는 추천 시스템에 활용될 수 있는데, 추천 시스템은 후술하는 바와 같이 이력서를 획득하면 이력서에 대한 각 회사/포지션 별로 합격 지수를 산출할 수 있다. 이후 합격 지수 (혹은 적합도)가 높은 N개의 회사를 구직자에게 추천한다. 이때 추천 시스템은 하나의 모델을 사용하지 않고, Random Forest, XGBoost, Deep learning 등 여러 개의 모델을 사용하여 앙상블 모델을 만들어서 학습될 수 있다.
단계 S117에서 개체명 인식이 수행되는 경우 키워드의 속성에 따라 상기 말뭉치 사전(200)에 키워드를 분류하는 모델이 학습될 수 있다. 본 단계에서 비정형 이력서(10)에 기재된 키워드의 의미를 기초로 개체명 인식 모델이 학습될 수 있다. 일 예로, 단계 S117에서 비정형 이력서(10) 내에 EDUCATION으로부터 가장 인접한 위치에 Stanford라는 키워드가 인식되었으면, 개체명 인식 모델은 Stanford가 학력의 범주에 기재될 수 있는 사항이라고 학습하고 Stanford를 개체명 인식 모델이 학습될 수 있다.이와 동시에 Stanford는 EDUCATION의 범주에 저장된 것이므로, 개체명 인식 모델은 Stanford가 EDUCATION의 범주에 속하는 것으로 학습할 수 있다. 물론, 개체명 인식 모델이 Stanford가 EDUCATION의 범주에 속한다는 것을 이미 알고 있는 경우 학습되지 않을 수 있다. 또한, 단계 S115에서 EDUCATION의 하측에 CAREER를 경력으로 인식하고 개체명 인식 모델은 CAREER가 학습될 수 있다. CAREER의 하측에 Google이라는 키워드를 개체명 인식 모델이 인식하지 못하는 경우 단계 S117에서 Google이라는 키워드가 CAREER의 키워드에 가장 가까이 있는 키워드이므로 경력에 기재될 수 있는 사항이라고 학습하고 Google이 경력으로 학습될 수 있다. 또한, 예를 들어 현존하는 개체명 인식 모델은 'computer skill'이 능력의 범주에 해당되는지 인식할 수 없기 때문에, ‘computer skill'을 말뭉치 사전(200)에 저장하고 ‘computer skill'을 능력 범주로 분류하도록 학습할 수 있다.
또한, 본 단계에서 개체명 인식 모델은 비정형 이력서(10)에 배치된 키워드의 순서를 기초로 개체명 인식 모델이 학습될 수 있다. 일 예로, 비정형 이력서(10)의 상단에는 일반적으로 이름이 적혀있는데, 개체명 인식 모델이 비정형 이력서(10)를 학습하면서 비정형 이력서(10)의 상측에는 이름이 인식되는 빈도가 많아짐에 따라 비정형 이력서(10)의 상측에는 이름이 기재되어 있다고 학습될 수 있다. 또한, 본 단계에서 이름에 대해 이름은 대부분 3글자로 이루어져 있으며, 이름의 첫 자에는 김, 이, 박의 빈도가 높다는 학습을 하여 비정형 이력서(10)의 상측에 3글자이고 첫 글자에 김, 이, 박으로 시작하는 키워드의 경우 이름일 가능성이 높은 것으로 판단하고 인식하도록 학습될 수 있다. 또한, 본 단계에서 이름의 하측에 나오는 숫자들은 집주소, 전화번호 또는 개인 식별번호에 관한 번호라고 개체명 인식 모델이 학습될 수 있다. 한편, 도 5에 도시된 비정형 이력서(10)와 같이 카테고리가 분류된 이력서의 경우 키워드가 군집된 영역마다 하나의 이력 정보가 기재된 것으로 학습될 수 있고, 이력 정보의 순서는 이름, 주소, 연락처, EDUCATION, CAREER, SKILLS, COMPETENCY, PERSONALITY, HOBBY의 순서로 배치된다고 학습될 수 있다. 본 개시의 실시예에서 단계 S117이 수행되면서 복수개의 이력서 즉, 약 3만 건 이상의 이력서를 이용하여 학습되는 경우 다양한 형식의 이력서를 이용하여 학습되기 때문에 이력서 상에 공통적으로 기재되는 항목 또는 내용의 경우 훌륭한 성능으로 학습되는 것이 확인되었다.
본 개시의 몇몇 실시예에 따르면, 개체명 인식 모델을 학습시켜 비정형 이력서(10)를 정형화 이력서(11)로 변환시킴에 따라, 이력서에 최적화된 기계 학습 방법을 이용하여 비정형 이력서(10)를 저비용으로 빠르게 정형화 이력서(11)로 변환시킬 수 있는 효과가 있다. 이상 도 4 내지 6을 참조하여 비정형 이력서(10)를 정형화시키는 방법과 기계 학습 방법에 대해 설명하였다.
도 7은 도 3를 참조하여 수행되는 일부 단계를 구체적으로 설명하기 위한 흐름도이고, 도 8은 본 개시의 몇몇 실시예에 따라 정형화 이력서를 이용하여 실제 학습 데이터를 얻는 방법을 설명하기 위한 예시도이다.
도 7을 참조하면, 도 3에서 S130에서 구직자(1)의 이력 정보 및 실제 입사 결과(20)를 이용하여 구직자(1)와 구인자(2) 사이의 매칭 및 합격 여부(31)가 분석되는 구체적인 과정이 수행될 수 있다. 이때, 구직자(1)의 이력 정보는 단계 S110에서 변환된 정형화 이력서(11)에 포함된 이력 정보일 수 있다. 실제 입사 결과(20)는 구직자(1)가 구인자(2)에 대해 실제 입사 지원한 결과에 대한 데이터이다. 구직자(1)는 여러 구인자(2) 중에 어느 구인자(2)에 대해 합격한 이력이 존재할 수 있고 어느 구인자(2)에 대해 불합격한 이력이 존재할 수도 있다. 이 경우 기계 학습 장치(100)는 도 1에서 살펴본 바와 같이 구인자(2)로부터 실제 입사 결과(20)를 얻을 수 있는데, 단계 S130에서 여러명의 구인자(2)로부터 얻은 실제 입사 결과(20)를 통해 구직자(1)와 구인자(2)의 매칭 및 합격 여부(31)가 분석될 수 있다.
구체적으로, 단계 S131에서 구직자(1)와 구인자(2) 사이의 매칭에 대한 점수가 스코어링될 수 있다. 본 단계에서 정형화 이력서(11)와 상기 실제 입사 결과(20)를 기초로 구직자(1)와 구인자(2) 사이의 매칭을 학습하여 이력 정보의 속성 별로 가중치가 도출될 수 있다. 이러한 가중치를 기초로 구직자(1)와 구인자(2) 사이의 매칭에 대한 점수가 이력 정보의 속성 별로 산출될 수 있다. 단계 S131을 도 8을 이용하여 함께 설명하면, 단계 S131에서 정형화 이력서(11)가 입력되었다고 가정하고, 실제 입사 결과(20)를 획득될 수 있다. 실제 입사 결과(20)는 구직자(1)의 ID, 구인자(2)의 ID 및 구직자(1)의 구인자(2)에 대한 합격 결과를 O 또는 X로 나타내는 데이터 구조체일 수 있다. 이름이 김지원인 구직자(1)의 정형화 이력서(11a) 경우 삼성과 Google에는 합격, MS 두 포지션에는 불합격, 이름이 Jeff Lee인 구직자(1)의 정형화 이력서(11b)는 MS AI 포지션과 Amazon에 합격하나 삼성과 MS NW 포지션에 불합격, 이름이 Nam Kim인 구직자(1)의 정형화 이력서(11c)는 LG와 MS NW 포지션에는 합격, 삼성과 MS AI 포지션에 불합격된 실제 입사 결과(20)를 획득한 것으로 가정한다. 김지원은 Google 회사에 7년의 경력이 있으나, 삼성에 지원하였을 때 실제 입사 결과(20)는 합격이였으나, MS AI Neural Network 포지션에는 불합격이었다. 이에 따라, 기계 학습 장치(100)는 김지원의 정형화 이력서(11)를 참고하여 Stanford학력을 가지고 Master 학위가 있으며 Com Sc의 전공이며 AI NLP의 경력이 7년이 있으면, Google과 삼성에는 합격할 수 있으나 MS AI Neural Network 과 MS NW 포지션에는 불합격되는 것으로 매칭하여 모델을 학습시킬 수 있다. 또한, 이름이 Nam Kim인 구직자(1)의 경우 LG에 근무중이며 MS 5G NW 포지션에는 합격했으나, 삼성 NLP 포지션과 MS AI포지션에 각각 불합격되었다는 실제 입사 결과(20)를 기초로 학습될 수 있다. 이에 따라, SNU학력을 가지고 Master Degree가 있으며 Com sc 전공이며 NW의 경력이 5년이 있는 경우, LG 와 MS 에는 합격이 가능하나, 삼성 NLP 포지션과 MS AI 포지션에는 실제 지원했을 때 불합격되는 것으로 매칭하여 모델을 학습시킬 수 있다. 이러한 경우들을 통해 김지원 구직자(1)와 Nam Kim 구직자(1)의 이력 정보를 비교하였을 때, 학위, 전공은 동일하므로 Google에 입사하기 위해 학위, 전공 이외의 것이 작용되었다고 매칭이 학습될 수도 있다. 또한, 일례에서, Nam Kim 구직자(1)의 Google 입사에 대한 학습의 경우 통상의 기술자가 유추하여 충분히 실시할 수 있을 것이다.
이러한 정보를 기초로 실제 학습 데이터(30)를 살펴보면, 구인자(2) 삼성의 경우 NLP 책임에 대해 Top50의 학력을 가지고 석사 학위를 소지하며, AI, 기계학습을 전공하고, 7년의 경력이 있으며 영어와 NLP,NER,Pos의 스킬을 가지고 있는 경우 97점을 획득할 수 있을 것이라고 분석될 수 있다. 또한, 김지원이 MS AI 포지션에 지원했을 경우 TOP100 학교의 석사학위를 요구하며, AI,Vision의 전공으로 5년 경력과, 영어와 Neural Network 스킬을 요구하므로, 김지원씨는 74점을 획득할 것이라고 분석될 수 있다. 이러한 방식을 통해 구직자(1)들의 정형화 이력서(11)와 실제 입사 결과(20)를 비교하여 각 구인자(2)들의 요구하는 이력 정보의 속성 별 가중치를 도출할 수 있다.
다시 도 7을 참조하면 단계 S133에서 이력 정보에 따라 실제 입사 결과(20)가 합격인 확률을 이용하여 이력 정보의 속성이 분석될 수 있다. 즉 도 8에 실제 학습 데이터(30)의 점수는 합격될 수 있는 퍼센트의 확률로 계산될 수 있다. 이때, 단계 S135에서 이력 정보의 속성 별로 산출된 점수를 이용하여 구직자(1)와 구인자(2) 사이의 합격 여부(31)가 결정될 수 있다. 도 8에 도시된 바와 같이 각각의 속성에 대한 점수를 이용하여 합격 여부(31)가 결정될 수 있다.
도 9는 본 개시의 몇몇 실시예에 따른 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법을 나타내는 흐름도이고, 도 10은 본 개시의 몇몇 실시예에 따라 가상 학습 데이터를 얻는 방법을 설명하기 위한 예시도이며, 도 11은 실제 학습 데이터와 가상 학습 데이터를 이용하여 합격 여부에 대한 데이터를 출력하는 방법을 설명하기 위한 도면이다.
도 9를 참조하면, 단계 S100 및 단계 S300의 경우 도 2에서 설명한 단계와 동일하게 수행되므로 그 설명을 생략하도록 한다. 단계 S150에서 이력 정보에서 구직자(1)가 구인자(2)에 대해 지원한 이력이 없고, 실제 학습 데이터(30)에 포함된 합격 여부(31)에서 구직자(1)가 구인자(2)에 대해 합격으로 결정되며, 구직자(1)가 구인자(2)에 지원한 실제 입사 결과(20)가 불합격인 경우, 구직자(1)와 구직자(1)의 당시 재직 중 포지션 사이의 매칭이 향상될 수 있다. 즉, 구직자(1)가 구인자(2)에 지원한 결과가 불합격인 경우에도 구직자(1)의 이력 정보가 추천 시스템에서 학습이 된다.
구체적으로 본 단계에서, 구직자(1)가 구인자(2)에 대해 지원한 결과 실제 입사 결과가 불합경인 경우 가상 학습 데이터(40)를 얻게 될 수 있다. 또한, 실제 학습 데이터(30)에 포함된 합격 여부(50)에서 구직자(1)가 구인자(2)에 대해 합격으로 결정되었는데 후에 구직자(1)가 실제로 구인자(2)에 지원한 결과 실제 입사 결과(20)가 불합격이 되는 경우 실제 학습 데이터(30)의 학습에 오차가 발생된 것으로 판단될 수 있다. 따라서, 본 단계에서 가상 학습 데이터(40)가 생성될 수 있다.
도 10을 참조하면, 가상 학습 데이터(40)는 정형화 이력서(11)를 기초로 현재 구직자(1)의 당시 재직 중 포지션에 대해 가상으로 입사하여 실제 입사 결과(20) 합격한 것으로 가정하여 생성된 실제 학습 데이터(30)와 유사한 구조로 생성될 수 있다. 가상 학습 데이터(40)는 실제 학습 데이터(30)와 유사하게 실제 학습 데이터(30)에 포함된 이력 정보의 대부분 혹은 전부를 포함할 수 있다. 또한, 가상 학습 데이터(40)는 구직자(1)의 현재 직무가 실제 학습 데이터(30)에서 추천된 구인자(2)의 포지션에 비해 더욱 매칭이 잘되는 것이므로, 구직자(1)의 당시 재직 중 포지션 사이의 매칭의 점수(41)가 만점이 되도록 설정될 수 있다. 이러한 경우 가상 학습 데이터(40)가 생성됨에 따라 본 이력 정보와 유사한 이력 정보를 가진 구직자(1)가 구인자(2)에 대해 매칭되는 점수가 더 향상될 수 있다.
이에 따라, 본 개시에 따른 기계 학습 방법은 구직자(1)가 가상 학습 데이터(40)를 함께 이용함에 따라 풍부한 트레이닝 데이터셋을 확보할 수 있어 기계 학습 모델의 성능이 향상될 수 있다.
도 11은 실제 학습 데이터와 가상 학습 데이터를 이용하여 합격 여부에 대한 데이터를 출력하는 방법을 설명하기 위한 도면이다.
도 11을 참조하면, 기계 학습 장치(100)는 실제 학습 데이터(30)와 가상 학습 데이터(40)를 통합하여 하나의 트레이닝 데이터셋으로 취급하여 상기 구직자-구인자 매칭의 합격 여부(50)에 대한 데이터를 출력하기 위한 모델을 학습시킬 수 있다. 도 11에 도시된 바와 같이 기계 학습 장치(100)는 구인자(1, 2, 3)가 요구하는 요구 사항을 포함하는 직무 명세서에 적합한 이력 정보에 대한 합격 여부(50)를 출력하고 이러한 모델을 학습시킬 수 잇다. 기계 학습 장치(100)는 실제 학습 데이터(30)와 상기 가상 학습 데이터(40)를 반영하여 각 속성의 가중치를 업데이트함에 따라 모델을 학습시킬 수 있다. 본 개시에 따르면, 가상 학습 데이터(40)가 생성됨에 따라 구직자(1)의 당시 재직 중 포지션 사이의 매칭이 향상되어 상기 구직자(1)의 이력 정보와 유사한 이력 정보를 가진 구직자(1)가 구인자(2)에 대해 매칭되는 점수가 더 향상될 수 있다.
도 12는 본 개시의 몇몇 실시예에 따라 각각의 정형화 이력서에 대해 적합한 구인자를 매칭하여 합격 여부에 대한 데이터를 출력하는 예시를 나타내는 도면이다.
도 12를 참조하면, 기계 학습 장치(100)는 정형화 이력서(11)를 획득하면 각각의 정형화 이력서(11)에 포함된 이력 정보를 기초로 구인자(1, 2, 3)에 매칭시켜 각각의 구인자별로 가장 매칭되는 구직자(1)에 대한 합격 여부(50)를 출력할 수 있다. 이러한 기계 학습 장치(100)는 구직자(1)의 이력서와 구인자(2)의 직무 명세서의 요구사항을 수집하여 매칭 스코어 및 합격 여부(50)를 출력하는 '추천 시스템'을 수행하는 구성요소이다.
추천 시스템은 이러한 매칭에 대한 점수 및 합격 여부(50)를 구직자(1)에게 제공하거나 구인자(2)에게 제공할 수 있다. 앞서 도 1에서 설명한 바와 같이 구인자(2)는 인적자원 관리 서버, HR 서버 또는 회사 HR 임직원, 리쿠르터 단말일 수 있다. 예를 들어, 추천 시스템은 회사의 직무 명세서의 요구사항을 입력하면 회사에 적절한 구직자(1)를 회사 HR 임직원에게 추천할 수 있다. 혹은, 여러 명의 구직자(1,2,3...n)의 비정형 이력서를 혹은 정형 데이터가 추천 시스템에 upload되면, 구직자의 속성별 score 와 전체 score 를 산출하여 score가 가장 높은 지원자가 추천될 수 있다. 이때 구직자-구인자 매칭의 합격 여부(50)에 대한 데이터를 출력하기 위한 모델을 학습시키는 단계가 수행될 수도 있다.
이하 도 12를 참조하여 추천 시스템에서 구인자 즉, 기업의 인사팀에 구직자를 추천하는 일 예시를 설명하도록 한다. 삼성 인사팀에서는 모든 지원자중, 김지원의 비정형 혹은 정형화 이력서(11a)가 삼성의 NLP 책임에 대해 97점으로 최고 매칭을 획득하여 삼성에 채용하는 것이 적합한 것으로 출력된다. MS 인사팀에게는 Jeff Lee의 비정형 혹은 정형화 이력서(11b)가 MS의 AI Eng에 대해 94점으로 최고 매칭을 획득하여 MS에 채용하는 것이 적합한 것으로 출력된다. Nam Kim의 비정형 혹은 정형화 이력서(11c)는 MS의 NW에 대해 93점으로 최고 매칭을 획득하여 MS에서 채용하는 것이 적합한 것으로 출력될 수 있다. 이와 같이 도 12를 참조하여 추천 시스템에서 구인자 즉, 기업의 인사팀에 구직자를 추천하는 추천 시스템의 일 예시를 설명하였다.
도 13은 본 개시의 몇몇 실시예에 따라 구인자 (1, 2, 3, ... n)의 각각의 포지션에 (오른쪽 3개 표) 대해서 매칭을 학습하여 구직자(1)에게 가장 적합한 구인자를 추천하는 합격 score 표이다. (좌우 도표위치 변경해야 합니다). 구직자의 이력 정보와 구인자의 직무 명세서 사이의 매칭을 통해 추천 시스템을 반복 학습하여 구인자의 요구 사항을 분석하고, 구인자의 요구 사항에 대하여 이력 정보의 필드 별로 가중치를 산출하는 예시를 나타내는 도면이다.
도 13을 참조하면, 구직자(1, 2, 3... n)와 구인자(1, 2, 3... n) 사이의 매칭에 대한 점수를 기초로 구인자(1, 2, 3... n)의 각 포지션에 대한 필드 별로 매칭에 대한 점수를 산출하여 합격 여부(50)를 산출할 수 있다. 본 단계에서 실제 학습 데이터(30)와 가상 학습 데이터(40)를 기초로 구직자(1)와 구인자(2) 사이의 매칭의 합격 여부(50)에 대한 데이터를 출력할 때 이러한 모델을 학습하여 이력 정보의 필드 별로 가중치(51)가 도출될 수 있다. 이러한 가중치를 기초로 구직자(1)와 구인자(2) 사이의 매칭에 대한 점수가 이력 정보의 필드 별로 산출될 수 있다. 이러한 방식을 통해 각 구인자(1,2,3...n)들의 요구하는 이력 정보의 필드 별 가중치(51)가 도출될 수 있다.
(구체적으로, 기계 학습 장치(100)가 얻은 실제 학습 데이터(30)와 가상 학습 데이터(40)를 합격 여부(50)에 대한 데이터와 비교하여 학습하면, 각각의 구인자(2)의 직무 포지션에 따라 선호하는 이력 정보의 필드 별 가중치(51)가 다르게 학습될 것이다. 따라서 이에 따라 각 구인자의 포지션에 따라 가중치 별로 다르게 분석될 수 있다. 도 13을 참고하면 김지원 구직자의 학습 결과, 삼성 NLP 책임의 가중치(51a)의 경우 나이에 대한 가중치가 40, 학력에 대한 가중치가 90, 전공에 대한 가중치가 80으로 분석될 수 있고, MS의 AI Eng의 가중치(51b)의 경우 나이에 대한 가중치가 20, 학력에 대한 가중치가 80, 전공에 대한 가중치가 80으로 분석될 수 있으며, MS의 NW의 가중치(51c)의 경우 나이에 대한 가중치가 40, 학력에 대한 가중치가 90, 전공에 대한 가중치가 80으로 분석될 수 있다.
도 14는 정형화 이력서(11)에 따라 이력 정보의 필드 별로 매칭에 대한 점수가 산출된 결과를 설명하기 위한 도면이다.
도 14를 참조하면, 기계 학습 장치(100)에 정형화 이력서(11)가 입력되면, 각각의 구인자(2)에 대하여 각각의 이력 정보 필드에 따라 점수가 산출될 수 있다. 이러한 점수는 몇몇 실시예에서 0~1범위로 설정될 수 있으며, 이를 총 합하여 합격에 대한 퍼센트를 점수로 기재할 수 있다. 도 14와 같이 김지원의 정형화 이력서(11)의 경우 삼성 NLP 책임에 대하여 학력 1점, Major 1점, 전공 1점, 경력 1점 외국어 1점 요구스킬 0.8로서 총점 97점을 획득할 수 있다. 그러나, 김지원의 정형화 이력서(11)의 경우 MS의 AI Eng 및 MS의 NW에서는 전공 및 요구스킬에서 낮은 점수를 획득하였고, 총점에서도 각각 74점, 70을 획득하였다. 따라서, 본 개시의 몇몇 실시예에 따른 기계 학습 방법은 구인자(2)에 대하여 각각의 이력 정보 필드에 따라 점수를 산출함에 따라 구인자(1)는 이러한 결과를 보고 가장 적합한 구직자(1)를 찾을 수 있으며, 이와 동시에 불합격되는 구인자(2)가 요구하는 이력 정보의 필드 중 구직자(1)가 부족한 부분을 향상시키도록 부족한 이력 정보의 필드에 대해 알려줄 수 있는 효과가 있다.
도 15는 본 개시의 다양한 실시예에 따른 장치를 구현할 수 있는 예시적인 컴퓨팅 장치를 나타내는 하드웨어 구성도이다.
지금까지 도 14를 참조하여 본 개시의 몇몇 실시예에 따른 멀티도메인 기반 기계학습 방법에 대하여 설명하였다. 이하에서는, 본 개시의 다양한 실시예에 따른 장치(e.g. 기계 학습 장치 100)를 구현할 수 있는 예시적인 컴퓨팅 장치(100)에 대하여 설명하도록 한다.
도 15는 본 개시의 다양한 실시예에 따른 장치(e.g. 학습 장치 10)를 구현할 수 있는 예시적인 컴퓨팅 장치(100)를 나타내는 하드웨어 구성도이다.
도 15에 도시된 바와 같이, 컴퓨팅 장치(100)는 하나 이상의 프로세서(110), 버스(150), 통신 인터페이스(170), 프로세서(110)에 의하여 수행되는 컴퓨터 프로그램을 로드(load)하는 메모리(130)와, 컴퓨터 프로그램(191)를 저장하는 스토리지(190)를 포함할 수 있다. 다만, 도 15에는 본 개시의 실시예와 관련 있는 구성요소들만이 도시되어 있다. 따라서, 본 개시가 속한 기술분야의 통상의 기술자라면 도 15에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다.
프로세서(110)는 컴퓨팅 장치(100)의 각 구성의 전반적인 동작을 제어한다. 프로세서(110)는 CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), GPU(Graphic Processing Unit) 또는 본 개시의 기술 분야에 잘 알려진 임의의 형태의 프로세서를 포함하여 구성될 수 있다. 또한, 프로세서(110)는 본 개시의 실시예들에 따른 방법/동작을 실행하기 위한 적어도 하나의 애플리케이션 또는 프로그램에 대한 연산을 수행할 수 있다. 컴퓨팅 장치(100)는 하나 이상의 프로세서를 구비할 수 있다.
메모리(130)는 각종 데이터, 명령 및/또는 정보를 저장한다. 메모리(130)는 본 개시의 다양한 실시예들에 따른 방법/동작을 실행하기 위하여 스토리지(190)로부터 하나 이상의 프로그램(191)을 로드할 수 있다. 메모리(130)는 RAM과 같은 휘발성 메모리로 구현될 수 있을 것이나, 본 개시의 기술적 범위가 이에 한정되는 것은 아니다.
버스(150)는 컴퓨팅 장치(100)의 구성 요소 간 통신 기능을 제공한다. 버스(150)는 주소 버스(Address Bus), 데이터 버스(Data Bus) 및 제어 버스(Control Bus) 등 다양한 형태의 버스로 구현될 수 있다.
통신 인터페이스(170)는 컴퓨팅 장치(100)의 유무선 인터넷 통신을 지원한다. 또한, 통신 인터페이스(170)는 인터넷 통신 외의 다양한 통신 방식을 지원할 수도 있다. 이를 위해, 통신 인터페이스(170)는 본 개시의 기술 분야에 잘 알려진 통신 모듈을 포함하여 구성될 수 있다. 경우에 따라, 통신 인터페이스(170)는 생략될 수도 있다.
스토리지(190)는 상기 하나 이상의 컴퓨터 프로그램(191)과 각종 데이터(e.g. 학습 데이터셋), 기계학습 모델 등을 비임시적으로 저장할 수 있다. 스토리지(190)는 ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리 등과 같은 비휘발성 메모리, 하드 디스크, 착탈형 디스크, 또는 본 개시가 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터로 읽을 수 있는 기록 매체를 포함하여 구성될 수 있다.
컴퓨터 프로그램(191)은 메모리(130)에 로드될 때 프로세서(110)로 하여금 본 개시의 다양한 실시예에 따른 방법/동작을 수행하도록 하는 하나 이상의 인스트럭션들을 포함할 수 있다. 즉, 프로세서(110)는 상기 하나 이상의 인스트럭션들을 실행함으로써, 본 개시의 다양한 실시예에 따른 방법/동작들을 수행할 수 있다.
예를 들어, 컴퓨터 프로그램(191)은 구직자의 이력 정보와 구인자의 직무 명세서 사이의 매칭 및 합격 여부를 포함하는 실제 학습 데이터를 얻는 인스트럭션, 구직자와 구직자의 당시 재직 중 포지션 사이의 매칭 및 합격을 가리키는 데이터를 포함하는 가상 학습 데이터를 얻는 인스트럭션 및 실제 학습 데이터 및 가상 학습 데이터를 이용하여 구직자-구인자 매칭의 합격 여부에 대한 데이터를 출력하기 위한 모델을 학습시키는 인스트럭션들을 포함할 수 있다. 이와 같은 경우, 컴퓨팅 장치(100)를 통해 본 개시의 몇몇 실시예에 따른 멀티태스크 학습 장치(e.g. 10)가 구현될 수 있다.
지금까지 도 15를 참조하여 본 개시의 다양한 실시예에 따른 장치를 구현할 수 있는 예시적인 컴퓨팅 장치(100)에 대하여 설명하였다.
지금까지 도 1 내지 도 15를 참조하여 본 개시의 다양한 실시예들 및 그 실시예들에 따른 효과들을 언급하였다. 본 개시의 기술적 사상에 따른 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
지금까지 도 1 내지 도 15를 참조하여 설명된 본 개시의 기술적 사상은 컴퓨터가 읽을 수 있는 매체 상에 컴퓨터가 읽을 수 있는 코드로 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체는, 예를 들어 이동형 기록 매체(CD, DVD, 블루레이 디스크, USB 저장 장치, 이동식 하드 디스크)이거나, 고정식 기록 매체(ROM, RAM, 컴퓨터 구비 형 하드 디스크)일 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체에 기록된 상기 컴퓨터 프로그램은 인터넷 등의 네트워크를 통하여 다른 컴퓨팅 장치에 전송되어 상기 다른 컴퓨팅 장치에 설치될 수 있고, 이로써 상기 다른 컴퓨팅 장치에서 사용될 수 있다.
이상에서, 본 개시의 실시예를 구성하는 모든 구성 요소들이 하나로 결합되거나 결합되어 동작하는 것으로 설명되었다고 해서, 본 개시의 기술적 사상이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 개시의 목적 범위 안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다.
도면에서 동작들이 특정한 순서로 도시되어 있지만, 반드시 동작들이 도시된 특정한 순서로 또는 순차적 순서로 실행되어야만 하거나 또는 모든 도시 된 동작들이 실행되어야만 원하는 결과를 얻을 수 있는 것으로 이해되어서는 안 된다. 특정 상황에서는, 멀티태스킹 및 병렬 처리가 유리할 수도 있다. 더욱이, 위에 설명한 실시예들에서 다양한 구성들의 분리는 그러한 분리가 반드시 필요한 것으로 이해되어서는 안 되고, 설명된 프로그램 컴포넌트들 및 시스템들은 일반적으로 단일 소프트웨어 제품으로 함께 통합되거나 다수의 소프트웨어 제품으로 패키지 될 수 있음을 이해하여야 한다.
이상 첨부된 도면을 참조하여 본 개시의 실시예들을 설명하였지만, 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자는 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 본 개시가 다른 구체적인 형태로도 실시될 수 있다는 것을 이해할 수 있다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 개시의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 개시에 의해 정의되는 기술적 사상의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
Claims (17)
- 컴퓨팅 장치에서 기계 학습(machine-learning)을 수행하는 방법에 있어서,
구직자의 이력 정보와 구인자의 직무 명세서 사이의 매칭 및 합격 여부를 포함하는 실제 학습 데이터를 얻는 단계;
상기 구직자가 상기 구직자의 현재 포지션과 예전 재직 중 포지션에 가상으로 지원한 가상입사 결과를 기초로 상기 구직자와 상기 구직자의 당시 재직 중 포지션 사이의 매칭 및 합격을 가리키는 데이터를 포함하고, 상기 실제 학습 데이터와 동일한 구조로 생성되도록 상기 실제 학습 데이터에 포함된 정보를 이용하여 생성된 가상 학습 데이터를 얻는 단계; 및
상기 실제 학습 데이터 및 상기 가상 학습 데이터를 이용하여 구직자-구인자 매칭의 합격 여부에 대한 데이터를 출력하기 위한 모델을 학습시키는 단계를 포함하고,
상기 가상 학습 데이터를 얻는 단계는,
상기 구직자와 상기 구직자의 당시 재직 중 포지션 사이의 매칭의 점수가 만점으로 설정된 상기 가상 학습 데이터를 얻는 단계를 포함하는,
구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법. - 제1 항에 있어서,
상기 실제 학습 데이터를 얻는 단계는,
상기 모델을 학습시키는 단계를 반복하는 과정에서 구직자들의 정형화 이력서와 상기 직무 명세서를 비교하여 상기 구직자-구인자 매칭의 합격 여부에 대한 데이터의 스코어를 높이는 상기 정형화 이력서의 필드에 대하여 가중치가 높은 것으로 판단하고, 상기 가중치가 높은 필드에 대하여 상기 구인자가 요구하는 이력 정보를 판단하는 단계; 및
상기 가중치가 포함되지 않은 상기 직무 명세서에 대하여 상기 가중치를 반영하여 상기 직무 명세서의 요구사항을 수집하는 단계를 포함하는,
구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법. - 제2항에 있어서,
상기 실제 학습 데이터를 얻는 단계는,
상기 정형화 이력서와 실제 입사 결과를 기초로 상기 구직자의 이력 정보와 구인자의 직무 명세서 사이의 매칭을 학습하여 상기 이력 정보의 필드 별로 가중치를 도출하고, 상기 가중치를 이용하여 상기 이력 정보의 필드 별로 상기 구직자의 이력 정보와 구인자의 직무 명세서 사이의 매칭에 대한 점수를 산출하는 단계를 더 포함하는,
구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법. - 제1 항에 있어서,
상기 구직자의 이력 정보를 포함하는 비정형 이력서를 미리 분류된 형식의 정형화 이력서로 변환하는 단계를 더 포함하며,
상기 비정형 이력서를 미리 분류된 형식의 정형화 이력서로 변환하는 단계는,
상기 이력 정보에 대하여 형태소 분석을 수행하여 상기 이력 정보에 대한 키워드를 추출하는 단계;
상기 추출된 키워드 중 범주를 가리키는 인접 키워드와, 상기 비정형 이력서 상에 배치된 키워드의 순서를 이용하여 학습된 개체명 인식 모델 또는 상기 개체명 인식 모델이 탐지하지 못한 단어가 사전화된 말뭉치 사전(Corpus Set)을 이용하여 상기 추출된 키워드에 대해 개체명 인식을 수행하는 단계; 및
상기 개체명 인식을 통해 분류된 상기 키워드의 분류에 따라 상기 키워드를 상기 정형화 이력서의 필드에 입력하는 단계를 포함하는,
구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법. - 제4항에 있어서,
상기 정형화 이력서로 변환하는 단계는,
상기 이력 정보에 대하여 형태소 분석을 수행하여 상기 이력 정보에 대한 키워드를 추출하는 단계;
상기 이력 정보가 저장된 말뭉치 사전(Corpus Set)을 이용하여 상기 키워드에 대해 개체명 인식을 수행하는 단계; 및
상기 개체명 인식을 통해 분류된 상기 키워드의 분류에 따라 상기 키워드를 상기 정형화 이력서의 필드에 입력하는 단계를 포함하는,
구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200038685A KR102318103B1 (ko) | 2019-06-11 | 2020-03-31 | 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 및 이를 이용한 추천 장치 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190068497A KR102097282B1 (ko) | 2019-06-11 | 2019-06-11 | 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 및 이를 이용한 추천 장치 |
KR1020200038685A KR102318103B1 (ko) | 2019-06-11 | 2020-03-31 | 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 및 이를 이용한 추천 장치 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190068497A Division KR102097282B1 (ko) | 2019-06-11 | 2019-06-11 | 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 및 이를 이용한 추천 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200141919A KR20200141919A (ko) | 2020-12-21 |
KR102318103B1 true KR102318103B1 (ko) | 2021-10-27 |
Family
ID=74090865
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200038685A KR102318103B1 (ko) | 2019-06-11 | 2020-03-31 | 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 및 이를 이용한 추천 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102318103B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11797942B2 (en) | 2022-03-09 | 2023-10-24 | My Job Matcher, Inc. | Apparatus and method for applicant scoring |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022197033A1 (ko) * | 2021-03-15 | 2022-09-22 | 주식회사 원티드랩 | 채용 중개 서비스에서 구직자 및 구인자의 매칭 확률 예측을 위한 신경망 모델 제공 전자 장치 및 방법 |
KR102601804B1 (ko) * | 2021-03-15 | 2023-11-15 | 주식회사 원티드랩 | 신경망 모델 기반의 채용 추천 서비스 제공 전자 장치 및 방법 |
KR102601803B1 (ko) * | 2021-03-15 | 2023-11-14 | 주식회사 원티드랩 | 채용 중개 서비스에서 구직자 및 구인자의 매칭 확률 예측을 위한 신경망 모델 제공 전자 장치 및 방법 |
JP7077495B1 (ja) * | 2021-07-28 | 2022-05-31 | 篤師 眞野 | 情報処理装置、プログラム及び情報処理方法 |
KR102368188B1 (ko) * | 2021-11-29 | 2022-03-02 | (주)올워크 | 인공지능 기반 직업 매칭 시스템 |
KR102522192B1 (ko) * | 2022-06-20 | 2023-04-14 | 주식회사 위세스 | 자가 실시 평판 조회 기능을 제공하는 채용 중개 시스템 및 그 방법 |
KR102596995B1 (ko) * | 2023-03-22 | 2023-11-01 | (주)이음길에이치알 | 전직예측보고서 제공장치 및 그 제공방법 |
CN117171428B (zh) * | 2023-08-04 | 2024-04-05 | 北京网聘信息技术有限公司 | 一种提升搜索和推荐结果准确性的方法 |
CN118013245B (zh) * | 2024-04-09 | 2024-06-18 | 杭州东方网升科技股份有限公司 | 一种基于深度学习模型的匹配度评估方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6480077B1 (ja) * | 2018-12-25 | 2019-03-06 | 株式会社ビデオマッチング | 人材マッチング装置、人材マッチング方法及び人材マッチングプログラム |
KR101961144B1 (ko) * | 2017-10-12 | 2019-03-22 | 주식회사 디지털존 | 국가직무능력표준 기반 직무적합 매칭 시스템 및 그 방법 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170116753A (ko) | 2016-04-12 | 2017-10-20 | 한국과학기술원 | 일자리 추천 매칭 시스템 및 그를 이용한 매칭 방법 |
KR20170133584A (ko) * | 2016-05-26 | 2017-12-06 | 주식회사 햄파트너스 | 인재 데이터 베이스 이력서 데이터 정규화를 통한 세그멘테이션 자동화 솔루션 |
-
2020
- 2020-03-31 KR KR1020200038685A patent/KR102318103B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101961144B1 (ko) * | 2017-10-12 | 2019-03-22 | 주식회사 디지털존 | 국가직무능력표준 기반 직무적합 매칭 시스템 및 그 방법 |
JP6480077B1 (ja) * | 2018-12-25 | 2019-03-06 | 株式会社ビデオマッチング | 人材マッチング装置、人材マッチング方法及び人材マッチングプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11797942B2 (en) | 2022-03-09 | 2023-10-24 | My Job Matcher, Inc. | Apparatus and method for applicant scoring |
Also Published As
Publication number | Publication date |
---|---|
KR20200141919A (ko) | 2020-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102318103B1 (ko) | 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 및 이를 이용한 추천 장치 | |
US11574026B2 (en) | Analytics-driven recommendation engine | |
US12010073B2 (en) | Systems and processes for operating and training a text-based chatbot | |
KR102097282B1 (ko) | 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 및 이를 이용한 추천 장치 | |
US10725827B2 (en) | Artificial intelligence based virtual automated assistance | |
US8700385B2 (en) | Providing a task description name space map for the information worker | |
US9224155B2 (en) | Systems and methods for managing publication of online advertisements | |
WO2020253503A1 (zh) | 人才画像的生成方法、装置、设备及存储介质 | |
KR20180041478A (ko) | 기계학습을 활용한 월렛 시스템 기반 인재 매칭 시스템 및 그 방법 | |
KR20200072900A (ko) | 구직 서류 기반 직무능력 분석매칭 시스템 및 그 제어방법 | |
US12026182B2 (en) | Automated processing of unstructured text data in paired data fields of a document | |
Mohanty et al. | Resumate: A prototype to enhance recruitment process with NLP based resume parsing | |
US10896034B2 (en) | Methods and systems for automated screen display generation and configuration | |
US11249751B2 (en) | Methods and systems for automatically updating software functionality based on natural language input | |
KR20200139008A (ko) | 딥러닝 기술을 활용한 법률서비스 이용자의 의도분석 기반 계약서 추천 및 자동완성 서비스 | |
JP7350206B1 (ja) | 求人データ管理システム及び求人データ管理方法 | |
Aljedaani et al. | Learning sentiment analysis for accessibility user reviews | |
CN117743315A (zh) | 一种为多模态大模型系统提供高质量数据的方法 | |
Rege | Artificial Intelligence Implementation in SAP | |
US20230037894A1 (en) | Automated learning based executable chatbot | |
Apatean et al. | Machine-learning based application for staff recruiting | |
WO2023164312A1 (en) | An apparatus for classifying candidates to postings and a method for its use | |
CÎMPEANU | Business Activities Using Chatbots. | |
Jayasekara et al. | Artificial Intelligence Agent to Identify the Correct Human Resources | |
Ustenko et al. | Amazon Textract and artficial intelegence system at banking document managment system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |