KR20230134711A - Researcher matching device, matching method and computer program for industry-university collaboration project - Google Patents

Researcher matching device, matching method and computer program for industry-university collaboration project Download PDF

Info

Publication number
KR20230134711A
KR20230134711A KR1020220031820A KR20220031820A KR20230134711A KR 20230134711 A KR20230134711 A KR 20230134711A KR 1020220031820 A KR1020220031820 A KR 1020220031820A KR 20220031820 A KR20220031820 A KR 20220031820A KR 20230134711 A KR20230134711 A KR 20230134711A
Authority
KR
South Korea
Prior art keywords
matrix
data
field
subject
research
Prior art date
Application number
KR1020220031820A
Other languages
Korean (ko)
Inventor
김문수
박예서
이승윤
최혜원
Original Assignee
한국외국어대학교 연구산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국외국어대학교 연구산학협력단 filed Critical 한국외국어대학교 연구산학협력단
Priority to KR1020220031820A priority Critical patent/KR20230134711A/en
Publication of KR20230134711A publication Critical patent/KR20230134711A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063112Skill-based matching of a person or a group to a task
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 연구 분야를 기반으로 하여 연구자와 연구실을 연계하는 매칭 장치에 있어서, 세부분야로 기분류된 연구 기술 분야(이하 ‘기술 분야’) 및 연구 주제 분야(이하 ‘주제 분야’)에 대한 연구자의 제1 관심 데이터 및 연구 이력 데이터를 저장하는 제1 데이터베이스; 상기 기술 분야 및 상기 주제 분야에 대한 연구실의 제2 관심 데이터 및 구인 데이터를 저장하는 제2 데이터베이스; 인공지능 알고리즘을 이용하여 상기 연구 이력 데이터로부터 제1 핵심 데이터를 추출하고, 상기 구인 데이터부터 제2 핵심 데이터를 추출하는 추출부; 상기 기술 분야 및 상기 주제 분야에 대해, 상기 제1 관심 데이터 및 상기 제1 핵심 데이터를 기반으로 상기 연구자의 제1 매트릭스를 생성하고, 상기 제2 관심 데이터 및 상기 제2 핵심 데이터를 기반으로 상기 연구실의 제2 매트릭스를 생성하는 매트릭스 생성부; 상기 기술 분야 및 상기 주제 분야 각각에 대해, 상기 연구자의 상기 제1 매트릭스를 기준으로 상기 연구실의 상기 제2 매트릭스를 비교하거나, 또는 상기 제2 매트릭스를 기준으로 상기 제1 매트릭스를 비교하여, 상기 기술 분야 또는 상기 주제 분야에서의 일치 여부에 따라 상기 연구실 또는 상기 연구자를 등급으로 분류하는 분류부; 및 상기 제1 매트릭스와 상기 제2 매트릭스 간 유사도를 비교하여, 상기 분류부에서 분류된 상기 연구실 중 적어도 어느 하나를 상기 연구자에게 제공하거나, 또는 상기 연구자 중 적어도 어느 하나를 상기 연구실에 제공하는 매칭부;를 포함하여, 연구 분야에 대한 주된 핵심 연구 분야, 역량은 일치한 상태에서, 관심 연구 분야가 서로 다른 연구자 또는 연구팀을 매칭함으로써, 연계 프로젝트의 성과를 더욱 향상시킬 수 있다.The present invention relates to a matching device that connects researchers and laboratories based on research fields, to researchers in research technology fields (hereinafter referred to as "technology fields") and research subject fields (hereinafter referred to as "subject fields") categorized as detailed fields. a first database storing first interest data and research history data; a second database storing second interest data and recruitment data of a laboratory for the technical field and the subject field; an extraction unit that extracts first core data from the research history data using an artificial intelligence algorithm and extracts second core data from the job offer data; For the technical field and the subject area, generate a first matrix of the researchers based on the first interest data and the first core data, and the research laboratory based on the second interest data and the second core data. a matrix generator that generates a second matrix; For each of the technical fields and the subject areas, by comparing the second matrix of the laboratory with respect to the first matrix of the researcher, or by comparing the first matrix with respect to the second matrix, the technology a classification unit that classifies the laboratory or the researcher into grades according to whether or not they match in the field or subject area; and a matching unit that compares the similarity between the first matrix and the second matrix and provides at least one of the laboratories classified in the classification unit to the researcher, or provides at least one of the researchers to the laboratory. The performance of linked projects can be further improved by matching researchers or research teams with different research areas of interest while maintaining the same core research areas and capabilities.

Description

산학 연계 프로젝트를 위한 연구자 매칭 장치, 매칭 방법 및 컴퓨터 프로그램{RESEARCHER MATCHING DEVICE, MATCHING METHOD AND COMPUTER PROGRAM FOR INDUSTRY-UNIVERSITY COLLABORATION PROJECT}Researcher matching device, matching method, and computer program for industry-academia collaboration projects {RESEARCHER MATCHING DEVICE, MATCHING METHOD AND COMPUTER PROGRAM FOR INDUSTRY-UNIVERSITY COLLABORATION PROJECT}

본 발명은 연구 분야가 유사한 연구자와 연구실, 또는 연구자와 연구팀을 연계할 수 있는 매칭 장치, 매칭 방법 및 컴퓨터 프로그램에 관한 것이다.The present invention relates to a matching device, matching method, and computer program that can link researchers and labs or researchers and research teams with similar research fields.

기술이 전문화되고 고도화됨에 따라서, 연구자들의 연구 분야는 세부적인 전문 분야로 다양하게 분기되고 있다. 이에 연구자 개인 또는 단독 연구팀만으로는 연구를 진행하는데 제약이 생기는 경우가 있어 연구 분야가 유사한 연구자, 연구팀 또는 연구실 간의 협업이 요구되는 실정이다. 연구실을 갖는 기업의 경우, 다양한 연구실을 보유하고 있다. 그러나, 해당 연구실에서 추가적으로 필요로 하는 연구자 또는 연구팀을 충원하고자 하는 경우 또는 협업하려는 경우, 실질적으로 이를 결정할 수 있는 인사권이 해당 연구실에 없어 적절한 매칭이 이루어지지 않는 문제가 있다. 특히, 최근 코로나 19 상황으로 인해 연구에 제약이 생기면서 연구 프로젝트 수행을 위한 수행원을 모집하는 것조차 어렵다. 또한, 연구 분야가 세분화되면서, 특정 연구 분야를 수행하고 있거나 수행하고자 하는 니즈를 가지는 연구자, 연구팀 또는 연구실을 파악하기 어려지고 있다.As technology becomes specialized and advanced, researchers' research fields are branching into various specialized fields. As a result, there are cases where there are limitations in conducting research with an individual researcher or a single research team, so collaboration between researchers, research teams, or laboratories with similar research fields is required. In the case of companies that have research labs, they have a variety of research labs. However, when the laboratory wants to recruit additional researchers or research teams or collaborate, there is a problem in which appropriate matching cannot be made because the laboratory does not have the personnel authority to make actual decisions. In particular, with the recent restrictions on research due to the COVID-19 situation, it is difficult to even recruit attendants to carry out research projects. Additionally, as research fields become fragmented, it is becoming difficult to identify researchers, research teams, or labs that are conducting or have needs for a specific research field.

이에, 본 출원인은 연구 분야를 기술 분야와 주제 분야로 구분하여 연구 분야의 유사성을 기준으로 연구자, 연구팀 또는 연구실 간 매칭을 수행하고자 하였으며, 기술 분야와 주제 분야의 가중치를 차등적으로 적용하여 보다 관련성 높은 매칭을 수행할 수 있도록 연구 개발을 진행하였다. Accordingly, the applicant divided the research field into technology field and subject field and attempted to perform matching between researchers, research teams, or laboratories based on the similarity of the research field, and differentially applied weights to the technology field and subject field to ensure more relevance. Research and development were conducted to enable high matching.

국재공개특허 WO2008/004563National Open Patent WO2008/004563

본 발명은 유사한 연구 분야의 연구를 수행하는 연구자, 연구팀 또는 연구실을 연계할 수 있는 매칭 장치, 매칭 방법 및 컴퓨터 프로그램을 제공하고자 한다. 특히, 본 발명은 연계 프로젝트의 성과를 높이기 위해 연구 분야에 대한 핵심적인 역량과 관심은 일치하되, 연구자 또는 연구팀이 서로 다른 분야에 관심과 역량, 지식이 있는 연구자 또는 연구팀을 매칭하고자 하는 것을 목적으로 한다. The present invention seeks to provide a matching device, matching method, and computer program that can link researchers, research teams, or laboratories conducting research in similar research fields. In particular, the purpose of the present invention is to match researchers or research teams with interests, capabilities, and knowledge in different fields while matching core capabilities and interests in research fields in order to increase the performance of linked projects. do.

본 발명이 해결하려는 과제들은 앞에서 언급한 과제들로 제한되지 않는다. 본 발명의 다른 과제 및 장점들은 아래 설명에 의해 더욱 분명하게 이해될 것이다.The problems that the present invention seeks to solve are not limited to the problems mentioned above. Other problems and advantages of the present invention will be more clearly understood by the description below.

상기 목적을 달성하기 위하여 본 발명은, 연구 분야를 기반으로 하여 연구자와 연구실을 연계하는 매칭 장치에 있어서, 세부분야로 기분류된 연구 기술 분야(이하 ‘기술 분야’) 및 연구 주제 분야(이하 ‘주제 분야’)에 대한 연구자의 제1 관심 데이터 및 연구 이력 데이터를 저장하는 제1 데이터베이스; 상기 기술 분야 및 상기 주제 분야에 대한 연구실의 제2 관심 데이터 및 구인 데이터를 저장하는 제2 데이터베이스; 인공지능 알고리즘을 이용하여 상기 연구 이력 데이터로부터 제1 핵심 데이터를 추출하고, 상기 구인 데이터부터 제2 핵심 데이터를 추출하는 추출부; 상기 기술 분야 및 상기 주제 분야에 대해, 상기 제1 관심 데이터 및 상기 제1 핵심 데이터를 기반으로 상기 연구자의 제1 매트릭스를 생성하고, 상기 제2 관심 데이터 및 상기 제2 핵심 데이터를 기반으로 상기 연구실의 제2 매트릭스를 생성하는 매트릭스 생성부; 상기 기술 분야 및 상기 주제 분야 각각에 대해, 상기 연구자의 상기 제1 매트릭스를 기준으로 상기 연구실의 상기 제2 매트릭스를 비교하거나, 또는 상기 제2 매트릭스를 기준으로 상기 제1 매트릭스를 비교하여 상기 기술 분야 또는 상기 주제 분야에서의 일치 여부에 따라 상기 연구실 또는 상기 연구자를 등급으로 분류하는 분류부; 및 상기 제1 매트릭스와 상기 제2 매트릭스 간 유사도를 비교하여, 상기 분류부에서 분류된 상기 연구실 중 적어도 어느 하나를 상기 연구자에게 제공하거나, 또는 상기 연구자 중 적어도 어느 하나를 상기 연구실에 제공하는 매칭부;를 포함하는 것을 일 특징으로 한다.In order to achieve the above object, the present invention provides a matching device that connects researchers and laboratories based on research fields, with research technology fields classified into detailed fields (hereinafter referred to as "technology fields") and research subject fields (hereinafter referred to as " a first database storing the researcher's first interest data and research history data for the 'subject field'); a second database storing second interest data and recruitment data of a laboratory for the technical field and the subject field; an extraction unit that extracts first core data from the research history data using an artificial intelligence algorithm and extracts second core data from the job offer data; For the technical field and the subject area, generate a first matrix of the researchers based on the first interest data and the first core data, and the research laboratory based on the second interest data and the second core data. a matrix generator that generates a second matrix; For each of the technical field and the subject area, the second matrix of the laboratory is compared to the first matrix of the researcher, or the first matrix is compared to the second matrix to determine the technical field. or a classification unit that classifies the laboratory or the researcher into grades depending on whether there is agreement in the subject field; and a matching unit that compares the similarity between the first matrix and the second matrix and provides at least one of the laboratories classified in the classification unit to the researcher, or provides at least one of the researchers to the laboratory. One feature is that it includes ;.

바람직하게, 상기 기술 분야는 세부 분류로 IoT, 인공지능, 영상처리, 보안, 빅데이터, 모바일, 자동제어기술, 데스크톱 SW, 가상현실 및 블록체인 중 적어도 어느 하나를 포함하고, 상기 주제 분야는 세부 분류로 비영리/공공연구, 영리/개인, 업무 자동화·지능화 및 기업 분석·개선 중 적어도 어느 하나를 포함할 수 있다.Preferably, the technical field includes at least one of IoT, artificial intelligence, image processing, security, big data, mobile, automatic control technology, desktop SW, virtual reality, and blockchain, and the subject field is detailed. Classification may include at least one of non-profit/public research, profit/private, work automation/intelligence, and corporate analysis/improvement.

바람직하게, 상기 제1 또는 제2 관심 데이터는, 상기 기술 분야 중 적어도 어느 하나 및 상기 주제 분야 중 적어도 어느 하나를 포함하고, 상기 제1 또는 제2 핵심 데이터는, 상기 기술 분야 중 어느 하나 및 상기 주제 분야 중 어느 하나를 포함할 수 있다.Preferably, the first or second data of interest includes at least one of the technical fields and at least one of the subject fields, and the first or second key data includes one of the technical fields and the It can cover any one of the subject areas.

바람직하게, 상기 추출부는, 상기 연구 이력 데이터 또는 상기 구인 데이터를 전처리하여 전처리 데이터를 생성하는 텍스트 전처리 모듈; 및 추출된 상기 전처리 데이터를 벡터화하여 검출 빈도를 산정하며, 상기 전처리 데이터가 상기 기술 분야의 세부분야 또는 상기 주제 분야의 세부분야에 대해 기설정된 핵심 단어를 포함하는 경우 해당 세부분야에 가중치를 부여하여 상기 핵심 데이터를 도출하는 핵심 데이터 도출 모듈;을 포함하며, 상기 핵심 데이터는 상기 기술 분야의 세부분야 중 어느 하나 또는 상기 주제 분야의 세부분야 중 어느 하나에 대한 정보일 수 있다.Preferably, the extraction unit includes a text preprocessing module that preprocesses the research history data or the job offer data to generate preprocessed data; And the extracted pre-processed data is vectorized to calculate the detection frequency, and if the pre-processed data includes key words preset for a sub-field of the technical field or a sub-field of the subject field, a weight is assigned to the sub-field. It includes a core data derivation module that derives the core data, and the core data may be information about one of the subfields of the technical field or one of the subfields of the subject field.

바람직하게, 상기 추출부는, 상기 핵심 데이터 도출 모델에서 도출된 상기 핵심 데이터가 복수 개의 상기 기술 분야 또는 상기 주제 분야를 포함하는 상기 관심 데이터 중 어느 하나에 해당하는지 검증하는 검증 모듈을 더 포함할 수 있다.Preferably, the extraction unit may further include a verification module that verifies whether the core data derived from the core data derivation model corresponds to one of the plurality of technical fields or the data of interest including the subject field. .

바람직하게, 상기 핵심 데이터 도출 모듈은, TF-IDF 기반 모듈로 벡터화할 수 있다.Preferably, the core data derivation module can be vectorized into a TF-IDF based module.

바람직하게, 상기 매트릭스는 상기 기술 분야에 대한 기술 매트릭스 및 상기 주제 분야에 대한 주제 매트릭스를 포함하며, 상기 기술 매트릭스 또는 상기 주제 매트릭스는, 상기 관심 데이터가 해당하는 상기 기술 분야의 세부분야 또는 상기 주제 분야의 세부분야에 대해 n이 부여되고, 상기 핵심 데이터가 해당하는 세부분야에 3n을 부여하여 생성될 수 있다.Preferably, the matrix includes a technology matrix for the technical field and a subject matter matrix for the subject field, and the technology matrix or the subject matrix is a subfield or subject field of the technical field to which the data of interest corresponds. n is assigned to each subfield, and the core data can be created by assigning 3n to the corresponding subfield.

바람직하게, 매칭 대상인 상기 연구자에 대하여 매칭 후보인 복수의 상기 연구실 중 적어도 어느 하나를 추천하는 경우, 상기 기술 분야 또는 상기 주제 분야에 대해, 상기 연구자의 상기 제1 매트릭스의 최댓값이 해당하는 각각의 세부분야와 복수의 상기 제2 매트릭스의 최댓값이 해당하는 각각의 세부분야가 일치하는지를 기준으로 판단하며, 매칭 대상인 상기 연구실에 대하여 매칭 후보인 복수의 상기 연구자 중 적어도 어느 하나를 추천하는 경우, 상기 기술 분야 또는 상기 주제 분야에 대해, 상기 연구실의 상기 제2 매트릭스의 최댓값이 해당하는 각각의 세부분야와 복수의 상기 제1 매트릭스의 최댓값이 해당하는 각각의 세부분야가 일치하는지를 기준으로 판단하며, 상기 기술 분야 및 상기 주제 분야의 세부분야가 일치하는 연구실 또는 연구자를 A군, 상기 주제 분야의 세부분야만 일치하는 연구실 또는 연구자를 B군, 상기 A군 및 상기 B군이 아닌 연구실 또는 연구자를 C군으로 분류할 수 있다.Preferably, when recommending at least one of the plurality of laboratories that are matching candidates for the researcher who is a matching target, for the technical field or the subject field, the maximum value of the first matrix of the researcher corresponds to each detail It is determined based on whether the field and each subfield corresponding to the maximum value of the plurality of second matrices match, and when at least one of the plurality of researchers who are matching candidates is recommended for the laboratory that is the matching target, the technical field Or, for the subject field, it is determined based on whether each subfield corresponding to the maximum value of the second matrix of the laboratory matches each subfield to which the maximum value of the plurality of first matrices corresponds, and the technical field And the laboratories or researchers matching the detailed fields of the above subject fields are classified into group A, the laboratories or researchers matching only the detailed fields of the above subject fields are classified into group B, and the labs or researchers other than the above group A and the above group B are classified into group C. can do.

바람직하게, 상기 매칭부는, 매칭 대상인 상기 연구자에 대하여 매칭 후보인 복수의 상기 연구실 중 적어도 어느 하나를 추천하는 경우, 상기 A군에 대하여, 상기 제1 매트릭스에 포함되는 상기 제1 기술 매트릭스 및 상기 제1 주제 매트릭스를 각각 정규화하고, 상기 제2 매트릭스에 포함되는 상기 제2 기술 매트릭스 및 상기 제2 주제 매트릭스를 각각 정규화하는 정규화 모듈; 상기 제1 또는 제2 기술 매트릭스, 상기 제1 또는 2 주제 매트릭스 중 값이 1인 셀을 삭제하고, 상기 제1 기술 매트릭스와 상기 제1 주제 매트릭스를 연결하여 상기 제1 매트릭스를 재배열하고, 상기 제2 기술 매트릭스와 상기 제2 주제 매트릭스를 연결하여 상기 제2 매트릭스를 재배열하는 재배열 모듈; 및 재배열된 상기 제1 매트릭스와 재배열된 복수의 상기 제2 매트릭스에 대한 코사인 유사도를 산출하는 유사도 산출 모듈을 포함할 수 있다.Preferably, when the matching unit recommends at least one of the plurality of laboratories that are matching candidates for the researcher who is a matching target, for the group A, the first technology matrix and the first technology matrix included in the first matrix a normalization module that normalizes one topic matrix, and normalizes the second technology matrix and the second topic matrix included in the second matrix, respectively; Delete a cell with a value of 1 among the first or second technology matrix and the first or second topic matrix, rearrange the first matrix by connecting the first technology matrix and the first topic matrix, and a rearrangement module that rearranges the second matrix by connecting a second technology matrix and the second subject matrix; and a similarity calculation module that calculates a cosine similarity for the rearranged first matrix and the plurality of rearranged second matrices.

바람직하게, 상기 매칭부는, 매칭 대상인 상기 연구자에 대하여 매칭 후보인 복수의 상기 연구실 중 적어도 어느 하나를 추천하는 경우, 상기 B군에 대하여, 상기 정규화 모듈은 상기 제1 및 제2 주제 매트릭스를 정규화하고, 상기 재배열 모듈은 상기 제1 및 제2 주제 매트릭스 중 값이 1인 셀을 삭제하여 재배열하고, 상기 유사도 산출 모듈은 재배열된 상기 제1 주제 매트릭스와 재배열된 복수의 상기 제2 주제 매트릭스에 대한 코사인 유사도를 산출할 수 있다.Preferably, when the matching unit recommends at least one of the plurality of laboratories that are matching candidates for the researcher who is a matching target, for the group B, the normalization module normalizes the first and second subject matrices, and , the rearrangement module deletes and rearranges cells with a value of 1 among the first and second topic matrices, and the similarity calculation module rearranges the rearranged first topic matrix and a plurality of rearranged second topics. The cosine similarity for the matrix can be calculated.

바람직하게, 상기 매칭부는, 상기 A군 또는 상기 B군에 대하여, 상기 유사도 산출 모듈에서 상기 코사인 유사도가 낮은 상기 연구실을 우선 제공할 수 있다.Preferably, the matching unit may first provide the laboratory with the low cosine similarity to the group A or the group B in the similarity calculation module.

바람직하게, 상기 매칭부는, 매칭 대상인 상기 연구자에 대하여 매칭 후보인 복수의 상기 연구실 중 적어도 어느 하나를 추천하는 경우, 상기 C군에 대하여, 상기 제1 매트릭스에 속한 상기 제1 기술 매트릭스 및 상기 제1 주제 매트릭스를 연결하여 재배열하고, 상기 제2 기술 매트릭스와 상기 제2 주제 매트릭스를 연결하여 상기 제2 매트릭스를 재배열하고, 재배열된 상기 제1 매트릭스와 재배열된 복수의 상기 제2 매트릭스에 대한 코사인 유사도를 산출하는 C군 판단 모듈을 더 포함할 수 있다.Preferably, when the matching unit recommends at least one of the plurality of laboratories that are matching candidates for the researcher who is a matching target, for the group C, the first technology matrix belonging to the first matrix and the first Connect and rearrange the subject matrix, connect the second technology matrix and the second subject matrix and rearrange the second matrix, and connect the rearranged first matrix and the rearranged plurality of second matrices. It may further include a C group judgment module that calculates cosine similarity.

바람직하게, 상기 매칭부는, 상기 C군에 대하여, 상기 C군 판단 모듈에서 코사인 유사도가 큰 상기 연구실을 우선 제공할 수 있다.Preferably, the matching unit may first provide, for the group C, the laboratory with a high cosine similarity in the group C determination module.

또한, 상기 목적을 달성하기 위하여 본 발명은, 연구 분야를 기반으로 하여 복수의 팀원을 포함한 연구팀과 연구자를 연계하는 매칭 장치에 있어서, 세부분야로 기분류된 연구 기술 분야(이하 ‘기술 분야’) 및 연구 주제 분야(이하 ‘주제 분야’)에 대한 연구자의 제3 관심 데이터 및 연구자 이력 데이터를 저장하는 제3 데이터베이스; 상기 기술 분야 및 상기 주제 분야에 대한 제4 관심 데이터 및 팀원 이력 데이터를 연구팀 팀원별로 저장하는 제4 데이터베이스; 인공지능 알고리즘을 이용하여 상기 연구자 이력 데이터로부터 제3 핵심 데이터를 추출하고, 상기 팀원 이력 데이터부터 팀원별 제4 핵심 데이터를 각각 추출하는 추출부; 상기 기술 분야 및 상기 주제 분야에 대해, 상기 제3 관심 데이터 및 상기 제3 핵심 데이터를 기반으로 상기 연구자의 제3 매트릭스를 생성하고, 상기 제4 관심 데이터 및 상기 제4 핵심 데이터를 기반으로 상기 연구팀의 제4 매트릭스를 생성하는 매트릭스 생성부; 상기 기술 분야 및 상기 주제 분야 각각에 대해, 상기 연구자의 상기 제3 매트릭스를 기준으로 상기 연구팀의 상기 제4 매트릭스를 비교하거나, 또는 상기 제4 매트릭스를 기준으로 상기 제3 매트릭스를 비교하여 상기 기술 분야 또는 상기 주제 분야에서의 일치 여부에 따라 상기 연구팀 또는 상기 연구자를 등급으로 분류하는 분류부; 및 상기 제3 매트릭스와 상기 제4 매트릭스 간 유사도를 비교하여, 상기 분류부에서 분류된 상기 연구팀 중 적어도 어느 하나를 상기 연구자에게 제공하거나, 또는 상기 연구자 중 적어도 어느 하나를 상기 연구팀에 제공하는 매칭부;를 포함하는 것을 다른 특징으로 한다.In addition, in order to achieve the above object, the present invention provides a matching device that connects researchers with a research team including a plurality of team members based on the research field, and the research technology field classified as a detailed field (hereinafter referred to as the 'technology field'). and a third database storing the researcher's third-party interest data and researcher history data on the research subject field (hereinafter referred to as 'subject field'); a fourth database storing fourth interest data and team member history data for the technical field and the subject field for each research team member; an extraction unit that extracts third core data from the researcher history data using an artificial intelligence algorithm and extracts fourth core data for each team member from the team member history data; For the technical field and the subject area, generate a third matrix of the researcher based on the third interest data and the third core data, and the research team based on the fourth interest data and the fourth core data. a matrix generator that generates a fourth matrix; For each of the technical fields and the subject fields, the fourth matrix of the research team is compared with the third matrix of the researcher, or the third matrix is compared with the fourth matrix to determine the technical field. or a classification unit that classifies the research team or the researchers into grades according to whether there is agreement in the subject field; and a matching unit that compares the similarity between the third matrix and the fourth matrix and provides at least one of the research teams classified in the classification unit to the researcher, or provides at least one of the researchers to the research team. Another feature is that it includes ;.

바람직하게, 상기 매트릭스는 상기 기술 분야에 대한 기술 매트릭스 및 상기 주제 분야에 대한 주제 매트릭스를 포함하며, 상기 기술 매트릭스 또는 상기 주제 매트릭스는, 상기 연구팀을 구성하는 복수의 팀원 각각에 대해 상기 제4 관심 데이터가 해당하는 상기 기술 분야의 세부분야 또는 상기 주제 분야의 세부분야에 대해 n이 부여되고, 상기 제4 핵심 데이터가 해당하는 세부분야에 3n을 부여된 후, 상기 기술 분야 및 상기 주제 분야의 세부분야에 대한 전체 팀원의 값을 더하여 생성될 수 있다.Preferably, the matrix includes a technology matrix for the technical field and a topic matrix for the subject field, and the technology matrix or the topic matrix includes the fourth data of interest for each of a plurality of team members constituting the research team. After n is given to the subfield of the technical field or the subfield of the subject field to which the fourth core data corresponds, and 3n is assigned to the subfield to which the fourth core data corresponds, the technical field and the subfield of the subject field It can be created by adding the values of all team members for .

또한, 상기 목적을 달성하기 위하여 본 발명은, 연구 분야를 기반으로 하여 연구자와 연구실을 연계하는 매칭 방법에 있어서, 세부분야로 기분류된 연구 기술 분야(이하 ‘기술 분야’) 및 연구 주제 분야(이하 ‘주제 분야’)에 대한 연구자의 제1 관심 데이터 및 연구 이력 데이터를 수신하는 제1 단계; 인공지능 알고리즘을 이용하여 상기 연구 이력 데이터로부터 제1 핵심 데이터를 추출하는 제2 단계; 상기 기술 분야 및 상기 주제 분야에 대한 연구실의 제2 관심 데이터 및 구인 데이터를 수신하는 제3 단계; 인공지능 알고리즘을 이용하여 상기 구인 데이터부터 제2 핵심 데이터를 추출하는 제4 단계; 상기 제1 관심 데이터 및 상기 제1 핵심 데이터를 기반으로 상기 기술 분야 및 상기 주제 분야에 대해 상기 연구자의 제1 매트릭스를 생성하는 제5 단계; 상기 제2 관심 데이터 및 상기 제2 핵심 데이터를 기반으로 상기 기술 분야 및 상기 주제 분야에 대해 상기 연구실의 제2 매트릭스를 생성하는 제6 단계; 상기 기술 분야 및 상기 주제 분야 각각에 대해, 상기 연구자의 상기 제1 매트릭스를 기준으로 상기 연구실의 상기 제2 매트릭스를 비교하거나, 또는 상기 제2 매트릭스를 기준으로 상기 제1 매트릭스를 비교하여, 상기 기술 분야 또는 상기 주제 분야에서의 일치 여부에 따라 상기 연구실 또는 상기 연구자를 A등급 내지 C등급 중 어느 하나로 분류하는 제7 단계; 및 상기 제1 매트릭스와 상기 제2 매트릭스 간 유사도를 비교하여, 상기 제7 단계에서 분류된 상기 연구실 중 적어도 어느 하나를 상기 연구자에게 제공하거나, 또는 상기 연구자 중 적어도 어느 하나를 상기 연구실에 제공하는 제8 단계;를 포함하는 것을 다른 특징으로 한다.In addition, in order to achieve the above object, the present invention provides a matching method for linking researchers and laboratories based on research fields, including research technology fields (hereinafter referred to as "technology fields") and research topic fields (hereinafter referred to as "technology fields") categorized as detailed fields. A first step of receiving the researcher's first interest data and research history data regarding the 'subject field'); A second step of extracting first core data from the research history data using an artificial intelligence algorithm; a third step of receiving secondary interest data and recruitment data from a laboratory for the technical field and the subject area; A fourth step of extracting second core data from the job offer data using an artificial intelligence algorithm; A fifth step of generating a first matrix of the researchers for the technical field and the subject field based on the first interest data and the first core data; A sixth step of generating a second matrix of the laboratory for the technical field and the subject field based on the second interest data and the second core data; For each of the technical fields and the subject areas, by comparing the second matrix of the laboratory with respect to the first matrix of the researcher, or by comparing the first matrix with respect to the second matrix, the technology A seventh step of classifying the laboratory or the researcher into one of grades A to C depending on whether there is a match in the field or subject area; And a method for comparing the similarity between the first matrix and the second matrix and providing at least one of the laboratories classified in the seventh step to the researcher, or providing at least one of the researchers to the laboratory. Another feature is that it includes 8 steps.

본 발명은 매칭 방법을 프로세서가 수행하도록 하는 컴퓨터 판독 가능 기록매체에 저장된 컴퓨터 프로그램일 수 있다.The present invention may be a computer program stored in a computer-readable recording medium that allows a processor to perform a matching method.

본 발명에 따르면, 특정 연구 분야의 연구를 수행하는 연구자와 특정 연구 분야의 연구원을 모집하거나 협업을 원하는 연구팀 또는 연구실(기업)이 연계될 수 있도록 함으로써, 연구의 시너지를 일으킬 수 있다. 연구자와 연구팀, 연구자와 연구실, 연구팀과 연구실 간 연계 등 다양한 형태로 매칭가능하다. 특히, 본 발명은 연구 분야에 대한 주된 핵심 연구 분야, 역량은 일치한 상태에서, 관심 연구 분야가 서로 다른 연구자 또는 연구팀을 매칭하여 연계 연구를 수행하도록 함으로써, 더 큰 시너지를 내어 연계 프로젝트의 성과를 더욱 향상시킬 수 있다.According to the present invention, synergy in research can be created by connecting researchers conducting research in a specific research field with a research team or laboratory (company) seeking to recruit or collaborate with researchers in a specific research field. Matching is possible in various forms, such as linkage between researchers and research teams, researchers and laboratories, and research teams and laboratories. In particular, the present invention allows researchers or research teams with different research areas of interest to perform linked research while matching the main core research areas and capabilities, thereby creating greater synergy and improving the performance of linked projects. It can be improved further.

연구자 또는 연구실이 연구하는 분야는 자신들이 밝힌 관심 연구 분야뿐만 아니라, 이전의 연구 결과물들을 분석하여 다수의 관심 연구 분야 중 가장 핵심적인 연구 분야를 선정하므로, 정확도가 높은 장점을 가진다. 연구팀의 경우에는 개별 연구원들의 연구 결과물을 모두 분석하여 공통적인 핵심 연구 분야를 도출함으로써, 보다 정확한 연구 분야 도출이 가능하다.The field studied by a researcher or laboratory has the advantage of high accuracy because it analyzes not only the research areas of interest that the researcher or laboratory has revealed, but also analyzes previous research results to select the most core research field among multiple research areas of interest. In the case of a research team, it is possible to derive a more accurate research field by analyzing all the research results of individual researchers and deriving a common core research field.

또한, 매칭의 기준이 되는 연구 분야는 기술 분야와 주제 분야로 구분되어 가중치가 차등적으로 적용된다. 주제 분야는 연구의 주체 또는 목적에 관한 분류를 포함한다. 그러므로, 연구의 기술적인 부분뿐만 아니라 연구 목적에 대한 측면도 고려하여 매칭되므로, 매칭이 된 이후에도 연구의 방향에 관한 문제가 발생할 가능성이 낮다는 장점을 갖는다.In addition, the research fields that serve as the basis for matching are divided into technical fields and topic fields, and weights are applied differentially. The subject area includes a classification regarding the subject or purpose of the research. Therefore, since matching takes into account not only the technical aspects of the research but also aspects of the research purpose, it has the advantage that problems regarding the direction of the research are less likely to arise even after matching.

도 1은 본 발명의 실시예에 따른 매칭 장치의 구조를 나타낸 블록도이다.
도 2는 본 발명의 실시예에 따른 연구자 및 복수의 연구실의 연구 분야를 산출하여 매칭하는 과정을 나타낸 구조도이다.
도 3은 본 발명의 실시예에 따른 추출부의 텍스트 전처리 모듈에서 수행되는 전처리 과정을 나타낸 순서도이다.
도 4는 본 발명의 실시예에 따른 추출부의 핵심 데이터 도출 모듈에서 수행되는 벡터화 및 가중치 부여 과정을 설명하기 위한 참조도면이다.
도 5a 내지 도 5f는 본 발명의 실시예에 따른 매트릭스 생성부에서 연구자 또는 연구실에 대한 기술 매트릭스 및 주제 매트릭스가 생성되는 과정을 설명하기 위한 참조도면이다.
도 6a 내지 도 6d는 본 발명의 실시예에 따른 매트릭스 생성부에서 연구팀에 대한 기술 매트릭스 및 주제 매트릭스가 생성되는 과정을 설명하기 위한 참조도면이다.
도 7a 및 도 7b는 단일 연구실에 대한 복수의 연구자 중 일부를 후보군으로 분류하기 위해 기술 매트릭스 및 주제 매트릭스의 세부분야의 일치 여부를 파악할 수 있는 매트릭스를 나타낸다.
도 8a 내지 도 8c는 본 발명의 실시예에 따른 추천 대상 후보인 A군 중에서 추천 우선순위를 선정하는 과정을 설명하기 위한 참조도면이다.
도 9는 본 발명의 실시예에 따른 추천 대상 후보인 B군 중에서 추천 우선순위를 선정하는 과정을 설명하기 위한 참조도면이다.
도 10은 본 발명의 따른 실시예로서, 따른 매칭 방법을 나타낸 순서도이다.
1 is a block diagram showing the structure of a matching device according to an embodiment of the present invention.
Figure 2 is a structural diagram showing the process of calculating and matching research fields of researchers and multiple laboratories according to an embodiment of the present invention.
Figure 3 is a flowchart showing the pre-processing process performed in the text pre-processing module of the extraction unit according to an embodiment of the present invention.
Figure 4 is a reference diagram for explaining the vectorization and weighting process performed in the core data derivation module of the extraction unit according to an embodiment of the present invention.
Figures 5A to 5F are reference diagrams for explaining the process of generating a technology matrix and a subject matrix for a researcher or laboratory in the matrix generator according to an embodiment of the present invention.
Figures 6A to 6D are reference diagrams for explaining the process of generating a technology matrix and a topic matrix for a research team in the matrix generator according to an embodiment of the present invention.
Figures 7a and 7b show a matrix that can determine whether the detailed fields of the technology matrix and the subject matrix match in order to classify some of the plurality of researchers for a single laboratory into candidate groups.
Figures 8A to 8C are reference diagrams for explaining the process of selecting a recommendation priority from group A, which is a candidate for recommendation, according to an embodiment of the present invention.
Figure 9 is a reference diagram for explaining the process of selecting a recommendation priority among group B, which is a candidate for recommendation according to an embodiment of the present invention.
Figure 10 is a flowchart showing a matching method according to an embodiment of the present invention.

이하, 첨부된 도면들에 기재된 내용들을 참조하여 본 발명을 상세히 설명한다. 다만, 본 발명이 예시적 실시 예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일 참조부호는 실질적으로 동일한 기능을 수행하는 부재를 나타낸다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings. However, the present invention is not limited or limited by the exemplary embodiments. The same reference numerals in each drawing indicate members that perform substantially the same function.

본 발명의 목적 및 효과는 하기의 설명에 의해서 자연스럽게 이해되거나 보다 분명해질 수 있으며, 하기의 기재만으로 본 발명의 목적 및 효과가 제한되는 것은 아니다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이, 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다.The purpose and effect of the present invention can be naturally understood or become clearer through the following description, and the purpose and effect of the present invention are not limited to the following description. Additionally, in describing the present invention, if it is determined that a detailed description of known techniques related to the present invention may unnecessarily obscure the gist of the present invention, the detailed description will be omitted.

도 1은 본 발명의 실시예에 따른 매칭 장치(1)의 구조를 나타낸 블록도이다.Figure 1 is a block diagram showing the structure of a matching device 1 according to an embodiment of the present invention.

매칭 장치(1)는 연구 분야를 기반으로 하여 연구자와 연구실, 연구자와 연구팀, 또는 연구팀와 연구실을 연계할 수 있다. 동일한 연구 기술 분야 및 주제 분야 내에서 세부적으로 서로 다른 영역에 관심, 역량 또는 지식을 가지는 사람이 모여 연계 프로젝트를 진행하면, 서로 간 시너지를 낼 수 있으며, 프로젝트는 더욱 잘 수행될 수 있다. 따라서, 연계 프로젝트의 성공에 가장 큰 영향을 끼치는 요인은 먼저 동일한 연구 기술 분야 및 주제 분야의 사람을 모으는 것이다. 그러나, 일반적으로 연계 프로젝트를 진행함에 있어서, 연구 분야 및 연구 주제를 선정하는 것이 가장 어려운 점으로 꼽히고 있다. The matching device 1 can link researchers and labs, researchers and research teams, or research teams and labs based on research fields. When people with interests, capabilities, or knowledge in different areas within the same research technology field and subject area come together to conduct a linked project, synergy can be created between them, and the project can be performed better. Therefore, the factor that has the greatest impact on the success of a linking project is first bringing together people from the same research technology field and subject area. However, in general, when conducting a linked project, selecting a research field and research topic is considered the most difficult.

매칭 장치(1)는 연구자, 연구팀 또는 연구실의 각 관심 데이터와 연구에 관한 관련 데이터(연구 이력 데이터, 팀원의 이력 데이터, 구인 데이터)를 기반으로 하여 연구자-연구실, 연구자-연구팀 또는 연구팀-연구실을 매칭할 수 있다. 보다 상세하게, 연구자-연구실 간 매칭은 특정 연구자에게 여러 연구실 중 해당 연구자가 수행하는 연구 분야와 가장 유사한 분야의 연구실을 추천할 수 있다. 또는, 특정 연구실에 복수의 연구자 중 해당 연구실이 진행하는 연구 분야와 가장 유사한 분야를 수행하는 연구자를 추천할 수 있다. 즉, 일 대 다수 관계에서 특정 개인 또는 단체에 가장 적합한 단체 또는 개인을 매칭해줄 수 있다. 여기에서, 연구실이란 연구 단체에 속한 연구실 또는 기업에 속한 연구실 등 다수인이 속하여 공통의 연구를 수행하는 그룹을 의미하는 것으로 그 형태는 다양할 수 있다. 다만, 본 발명의 일실시예에서는 연구실이 기업인 경우로 가정하여 설명한다. 따라서, 기업인 연구실 입장에서 연구원을 구인하거나 또는 협업을 위해 연구원을 모집하는 경우가 대부분이므로, 매칭의 기준이 되는 데이터는 ‘구인 데이터’일 수 있다. 여기에서 연구에 관한 관련 데이터(연구 이력 데이터, 팀원의 이력 데이터, 구인 데이터)는 텍스트 데이터일 수 있다.The matching device (1) matches the researcher-laboratory, researcher-research team, or research team-laboratory based on each interest data of the researcher, research team, or laboratory and related data about the research (research history data, team member history data, recruitment data). You can match. More specifically, matching between researchers and labs can recommend to a specific researcher a lab in a field that is most similar to the research field that the researcher is conducting among several labs. Alternatively, among multiple researchers in a specific lab, the researcher carrying out the field most similar to the research field being conducted by the lab can be recommended. In other words, in a one-to-many relationship, the most suitable organization or individual can be matched to a specific individual or organization. Here, a laboratory refers to a group of multiple people performing common research, such as a laboratory belonging to a research organization or a laboratory belonging to a company, and its form may vary. However, in one embodiment of the present invention, the description is made assuming that the laboratory is a company. Therefore, in most cases, from the standpoint of a corporate research lab, recruiting researchers or recruiting researchers for collaboration, the data that serves as the basis for matching may be ‘recruitment data.’ Here, related data about the research (research history data, team member history data, recruitment data) may be text data.

또한, 매칭 장치(1)는 연구자-연구팀 간 매칭, 또는 연구팀-연구실 간 매칭도 수행할 수 있다. 다만, 여기서 연구팀은 연구실과는 다른 개념이다. 본 발명에서 연구실은 자체적으로 단일한 연구의 방향, 목적 또는 분야를 가진다. 반면, 연구팀은 복수의 연구자 개인이 모인 그룹으로, 연구의 방향, 목적 또는 분야가 통일되지 못할 수 있다. 따라서, 연구팀의 연구에 관한 관련 데이터는 팀원 각각의 이력 데이터를 모두 고려하여, 연구팀의 주된 연구 분야가 설정될 수 있다. 연구자-연구팀 간 매칭은, 특정 연구자가 복수의 연구팀 중 어느 한 연구팀에 속하고자 하거나 협업을 하고자 하는 경우, 특정 연구자에게 연구 분야가 동일한 연구팀을 추천할 수 있다. 또는 반대로 특정 연구팀이 팀원을 충원하고자 하거나 협업을 희망하는 경우, 특정 연구팀에 연구 분야가 동일한 연구자를 추천할 수 있다. 이는 연구팀-연구실 간 매칭에서도 마찬가지로 적용될 수 있다.In addition, the matching device 1 can also perform matching between researchers and research teams, or between research teams and laboratories. However, here, the research team is a different concept from the laboratory. In the present invention, the laboratory has its own single direction, purpose, or field of research. On the other hand, a research team is a group of multiple individual researchers, and the direction, purpose, or field of research may not be unified. Therefore, the research team's main research field can be established by considering all relevant data regarding the research team's research and the history data of each team member. Matching between researchers and research teams can recommend a research team with the same research field to a specific researcher if the researcher wishes to belong to or collaborate with one of multiple research teams. Or, conversely, if a specific research team wants to recruit team members or collaborate, researchers with the same research field can be recommended to the specific research team. This can also be applied to matching between research teams and laboratories.

주목할 점은, 매칭 장치(1)는 연구 분야를 보다 세부적으로 연구 기술 분야(이하 ‘기술 분야’) 및 연구 주제 분야(이하 ‘주제 분야’)로 구분하여 양 분야를 모두 고려한다는 점이다. 기술 분야는 세부분야로 IoT, 인공지능, 영상처리, 보안, 빅데이터, 모바일, 자동제어기술, 데스크톱 SW, 가상현실 및 블록체인으로 분류될 수 있다. 주제 분야는 세부 분류로 비영리/공공연구, 영리/개인, 업무 자동화·지능화 및 기업 분석·개선으로 분류될 수 있으며, 이러한 분류는 일예시로서 이에 제한되는 것은 아니며, 더욱 세부적으로 분류되거나 분류 체계가 상이할 수 있다. 이하 ‘연구 분야’는 기술 분야와 주제 분야를 총칭하는 것으로 정의한다.What is noteworthy is that the matching device (1) divides the research field into a more detailed research technology field (hereinafter referred to as ‘technology field’) and a research subject field (hereinafter referred to as ‘subject field’) and considers both fields. The technology field can be divided into IoT, artificial intelligence, image processing, security, big data, mobile, automatic control technology, desktop SW, virtual reality, and blockchain. Subject areas can be subdivided into non-profit/public research, profit/private, business automation/intelligence, and corporate analysis/improvement. These classifications are examples and are not limited to this, and may be classified in more detail or have a classification system. may be different. Hereinafter, ‘research field’ is defined as a general term for technical fields and subject areas.

매칭 장치(1)는 데이터베이스(10), 추출부(11), 매트릭스 생성부(13), 분류부(15) 및 매칭부(17)를 포함할 수 있다.The matching device 1 may include a database 10, an extraction unit 11, a matrix generation unit 13, a classification unit 15, and a matching unit 17.

데이터베이스(10)는 세부분야로 기분류된 기술 분야 및 주제 분야에 대한 연구자, 연구팀, 연구실의 관심 데이터 또는 연구에 관한 관련 데이터를 저장할 수 있다. 데이터베이스(10)에 저장되는 데이터는 주체에 따라 상이할 수 있다. 즉, 연구자의 경우, 관심 데이터 및 연구 이력 데이터가 저장될 수 있으며, 연구팀의 경우 해당 연구팀에 속하는 개별 연구자인 팀원의 이력 데이터가 저장될 수 있다. 연구실의 경우에는 해당 연구실의 관심 데이터 및 구인 데이터가 데이터베이스(10)에 저장될 수 있다.The database 10 may store data of interest or research-related data of researchers, research teams, and laboratories in technical fields and subject areas categorized into detailed fields. Data stored in the database 10 may differ depending on the subject. That is, for researchers, data of interest and research history data can be stored, and for research teams, history data of team members who are individual researchers belonging to the research team can be stored. In the case of a laboratory, data of interest and job openings for the laboratory may be stored in the database 10.

데이터베이스(10)는 제1 데이터베이스(101)와 제2 데이터베이스(103)를 포함할 수 있다. 매칭 장치(1)는 연구자-연구실, 연구자-연구팀 또는 연구팀-연구실 간의 매칭, 즉 A : B 매칭이므로, 도 1과 같이 데이터베이스(10)를 두 그룹으로 구분하여 표현한 것이다. 도 1의 실시예에서는 단일 연구자에게 복수의 연구실 중 적어도 어느 하나의 연구실을 추천하는 매칭을 하는 것으로 설정하여 설명한다. 이러한 설정은 이하 도 2에서도 마찬가지이다. 단일 연구자에게 연구실을 추천하는 경우, 제1 데이터베이스(101)는 연구 분야(기술 분야 및 주제 분야)에 대한 연구자의 제1 관심 데이터 및 연구 이력 데이터를 저장할 수 있다. 연구자의 제1 관심 데이터는 연구자 스스로 기술 분야 및 주제 분야에 대해 자신이 관심있다고 선정한 분야에 관한 정보이다. 관심 데이터는 복수의 기술 분야 중 적어도 어느 하나 및 복수의 주제 분야 중 적어도 어느 하나를 포함할 수 있다. 연구자의 연구 이력 데이터는 연구자가 이전까지 수행한 연구 결과물로서, 추후 핵심 데이터를 산출하는데 사용되는 기초 데이터이다. 연구자의 연구 이력 데이터에 대한 분석을 통해 산출된 핵심 데이터는 연구자의 주된 연구 분야로서, 연구실의 연구 분야와의 유사 판단의 기준이 될 수 있다.The database 10 may include a first database 101 and a second database 103. Since the matching device 1 is a matching between a researcher and a laboratory, a researcher and a research team, or a research team and a laboratory, that is, A:B matching, the database 10 is expressed by dividing it into two groups as shown in FIG. 1. In the embodiment of Figure 1, the description is set to perform matching by recommending at least one laboratory among a plurality of laboratories to a single researcher. These settings are the same in Figure 2 below. When recommending a laboratory to a single researcher, the first database 101 may store the researcher's first interest data and research history data for the research field (technical field and subject field). The researcher's primary data of interest is information about the technical field and subject area the researcher has selected as being of interest. Data of interest may include at least one of a plurality of technical fields and at least one of a plurality of subject fields. The researcher's research history data is the results of research previously conducted by the researcher and is basic data used to calculate key data in the future. The core data calculated through analysis of the researcher's research history data is the researcher's main research field and can serve as a standard for judging similarity to the laboratory's research field.

제2 데이터베이스(103)는 연구 분야에 대한 연구실의 제2 관심 데이터 및 구인 데이터를 저장할 수 있다. 연구실의 제2 관심 데이터는 연구실에서 관심있다고 선정한 분야에 관한 정보이다. 제2 관심 데이터 또한 복수의 기술 분야 중 적어도 어느 하나 및 복수의 주제 분야 중 적어도 어느 하나를 포함할 수 있다. 다만, 연구자의 관심 데이터와 연구실의 관심 데이터는 상이하므로, 이를 구분하여 제1 관심 데이터 및 제2 관심 데이터로 명명하였다. 따라서, 이하 ‘관심 데이터’는 제1 관심 데이터와 제2 관심 데이터를 통칭하는 의미로 사용됨을 명확히 한다. ‘제1 관심 데이터’ 또는 ‘제2 관심 데이터’로 데이터의 주체를 명확히 밝히지 않는 경우, ‘관심 데이터’는 제1 관심 데이터와 제2 관심 데이터 모두를 의미한다. 이는 핵심 데이터, 매트릭스 또한 마찬가지이다. 즉, ‘핵심 데이터’는 제1 핵심 데이터 및 제2 핵심 데이터를 통칭하며, ‘매트릭스’는 제1 매트릭스 및 제2 매트릭스를 통칭한다.The second database 103 may store the laboratory's second interest data and recruitment data for the research field. The laboratory's secondary data of interest is information about the field selected by the laboratory as being of interest. The second data of interest may also include at least one of a plurality of technical fields and at least one of a plurality of subject fields. However, since the researcher's data of interest and the laboratory's data of interest are different, they were separated and named data of first interest and data of second interest. Therefore, it is clarified that ‘data of interest’ hereinafter is used to collectively refer to first data of interest and second data of interest. If the subject of the data is not clearly identified as ‘data of primary interest’ or ‘data of secondary interest’, ‘data of interest’ means both data of primary interest and data of secondary interest. This also applies to core data and matrices. In other words, ‘core data’ refers collectively to the first core data and the second core data, and ‘matrix’ refers to the first matrix and the second matrix.

연구실의 구인 데이터는 연구실에서 연구자를 모집하기 위해 공고하는 데이터일 수 있으며, 또는 연구실의 이전 연구 데이터를 포함할 수 있다. 연구실의 구인 데이터는 추후 핵심 데이터를 산출하는데 사용되는 기초 데이터이다. 연구실의 구인 데이터에 대한 분석을 통해 산출된 핵심 데이터는 연구실의 주요 니즈가 반영된 주된 연구 분야로서, 연구자의의 연구 분야와의 유사 판단의 기준이 될 수 있다. 도 1은 단일 연구자에게 복수의 연구실 중 적어도 어느 하나의 연구실을 추천하는 매칭을 하는 예시이므로, 제2 데이터베이스(103)는 복수의 연구실의 정보를 포함할 수 있다. 다만, 이러한 세부 구조는 임의적인 것으로, 데이터베이스(10)는 각 연구자, 연구팀 또는 연구실마다 개별적인 저장 공간을 형성하여 제n 데이터베이스를 포함할 수 있다.The laboratory's recruitment data may be data advertised by the laboratory to recruit researchers, or may include the laboratory's previous research data. The laboratory's recruitment data is basic data used to calculate key data later. The core data calculated through analysis of the laboratory's recruitment data is the main research area that reflects the main needs of the laboratory, and can serve as a standard for determining similarity to the researcher's research field. Since Figure 1 is an example of matching that recommends at least one of a plurality of laboratories to a single researcher, the second database 103 may include information on a plurality of laboratories. However, this detailed structure is arbitrary, and the database 10 may include an n-th database by forming an individual storage space for each researcher, research team, or laboratory.

추출부(11)는 인공지능 알고리즘을 이용하여 연구 이력 데이터로부터 제1 핵심 데이터를 추출하고, 구인 데이터부터 제2 핵심 데이터를 추출할 수 있다. The extraction unit 11 may extract first core data from research history data and extract second core data from job offer data using an artificial intelligence algorithm.

추출부(11)는 텍스트 전처리 모듈(111), 핵심 데이터 도출 모듈(113) 및 검증 모듈(115)를 포함할 수 있다.The extraction unit 11 may include a text preprocessing module 111, a core data derivation module 113, and a verification module 115.

텍스트 전처리 모듈(111)은 연구 이력 데이터 또는 구인 데이터를 전처리하여 전처리 데이터를 생성할 수 있다.The text preprocessing module 111 may generate preprocessed data by preprocessing research history data or job offer data.

핵심 데이터 도출 모듈(113)은 추출된 전처리 데이터를 벡터화하여 검출 빈도를 산정할 수 있다. 핵심 데이터 도출 모듈(113)은 TF-IDF 기반 모듈로 벡터화할 수 있다. 핵심 데이터 도출 모듈(113)은 전처리 데이터가 기술 분야의 세부분야 또는 주제 분야의 세부분야에 대해 기설정된 핵심 단어를 포함하는 경우 해당 세부분야에 가중치를 부여하여 핵심 데이터를 도출할 수 있다. The core data derivation module 113 can calculate the detection frequency by vectorizing the extracted preprocessed data. The core data derivation module 113 can be vectorized into a TF-IDF based module. The core data derivation module 113 may derive core data by assigning a weight to the subfield of the technical field or subject field if the preprocessed data includes key words preset for the subfield of the technical field or subject field.

핵심 데이터는 기술 분야의 세부분야 중 어느 하나 또는 주제 분야의 세부분야 중 어느 하나에 대한 정보이며, 보다 상세하게, 관심 데이터의 일부일 수 있다. 예를 들어, 연구자의 제1 관심 데이터가 기술 분야에서 IoT, 영상처리, 자동제어기술, 데스크톱 SW인 경우, 제1 핵심 데이터는 IoT, 자동제어기술, 데스크톱 SW 또는 영상처리 중 어느 하나이며, 이를 제외한 기술 분야인 인공지능, 보안, 빅데이터, 모바일, 가상현실, 블록체인에는 해당되지 않는다. 또한, 연구자의 제1 관심 데이터가 주제 분야에서 업무 자동화·지능화, 기업 분석·개선인 경우, 업무 자동화·지능화 또는 기업 분석·개선 중 어느 하나이며, 이를 제외한 주제 분야인 비영리/공공연구 및 영리/개인에는 해당되지 않는다.Core data is information about one of the subfields of a technical field or one of the subfields of a subject field, and more specifically, may be part of data of interest. For example, if the researcher's first data of interest is IoT, image processing, automatic control technology, and desktop SW in the technology field, the first core data is one of IoT, automatic control technology, desktop SW, or image processing, and It does not apply to the excluded technology fields such as artificial intelligence, security, big data, mobile, virtual reality, and blockchain. In addition, if the researcher's primary interest data is work automation/intelligence or corporate analysis/improvement in the subject field, it is either work automation/intelligence or business analysis/improvement, and other subject areas include non-profit/public research and for-profit/improvement. It does not apply to individuals.

검증 모듈(115)은 핵심 데이터 도출 모델(113)에서 도출된 핵심 데이터가 복수 개의 기술 분야 또는 주제 분야를 포함하는 관심 데이터 중 어느 하나에 해당하는지 검증할 수 있다. 검증 모듈(115)은 검증 결과, 핵심 데이터가 관심 데이터의 일부에 해당되지 않는 경우, 인공지능 알고리즘을 통해 재학습시킬 수 있다. The verification module 115 may verify whether the core data derived from the core data derivation model 113 corresponds to any one of data of interest including a plurality of technical fields or subject fields. If, as a result of the verification, the core data does not correspond to part of the data of interest, the verification module 115 can retrain it through an artificial intelligence algorithm.

매트릭스 생성부(13)는 기술 분야 및 주제 분야에 대해, 제1 관심 데이터 및 제1 핵심 데이터를 기반으로 연구자의 제1 매트릭스를 생성할 수 있으며, 또한 제2 관심 데이터 및 제2 핵심 데이터를 기반으로 연구실의 제2 매트릭스를 생성할 수 있다. 여기서 매트릭스는 연구 분야별로 구분하여 생성될 수 있다. 각 매트릭스, 제1 매트릭스 및 제2 매트릭스는 기술 분야에 대한 기술 매트릭스 및 주제 분야에 대한 주제 매트릭스를 각각 포함할 수 있다. 기술 매트릭스 또는 주제 매트릭스는, 먼저 관심 데이터가 해당하는 기술 분야의 세부분야 또는 주제 분야의 세부분야에 대해 n이 부여되고, 핵심 데이터가 해당하는 세부분야에 3n 가중치가 부여되어 생성될 수 있다. 매트릭스 생성 과정은 이하 도 5에서 자세히 후술한다. The matrix generator 13 may generate the researcher's first matrix based on the first data of interest and the first core data for the technical field and subject field, and may also generate the first matrix of the researcher based on the second data of interest and the second core data. You can create the second matrix of the laboratory. Here, the matrix can be created separately by research field. Each matrix, the first matrix and the second matrix, may include a technology matrix for the technology field and a subject matrix for the subject field, respectively. The technology matrix or topic matrix may be created by first assigning n to the subfield of the technology field or subfield of the subject field to which the data of interest corresponds, and then assigning a 3n weight to the subfield to which the core data corresponds. The matrix creation process is described in detail in Figure 5 below.

분류부(15)는 기술 분야 및 주제 분야 각각에 대해, 연구자의 제1 매트릭스를 기준으로 연구실의 제2 매트릭스를 비교하거나, 제2 매트릭스를 기준으로 제1 매트릭스를 비교하여 기술 분야 또는 주제 분야에서의 일치 여부에 따라 연구실 또는 연구자를 등급으로 분류할 수 있다.The classification unit 15 compares the second matrix of the laboratory based on the first matrix of the researcher, for each technical field and subject field, or compares the first matrix based on the second matrix to determine the technical field or subject field. Labs or researchers can be classified into levels depending on whether or not they match.

분류부(15)는 매칭 대상인 연구자에 대하여 매칭 후보인 복수의 연구실 중 적어도 어느 하나를 추천하는 경우, 기술 분야 또는 주제 분야에 대해, 연구자의 제1 매트릭스의 최댓값이 해당하는 각각의 세부분야와 복수의 제2 매트릭스의 최댓값이 해당하는 각각의 세부분야가 일치하는지를 기준으로 판단할 수 있다. 그 후, 분류부(15)는 매칭 후보인 복수의 연구실에 대해 매칭 대상인 연구자의 기술 분야와 주제 분야의 세부분야가 일치하는지를 기준으로, 양 분야의 세부분야가 모두 일치하는 연구실을 A군, 양 분야 중 주제 분야의 세부분야만 일치하는 연구실을 B군, A군 및 B군이 아닌 연구실을 C군으로 분류할 수 있다. 이때, 각 A, B, C군에는 각각 복수의 연구실이 포함될 수 있다.When recommending at least one of a plurality of laboratories that are matching candidates for a researcher who is a matching target, the classification unit 15 selects each subfield and a plurality of laboratories to which the maximum value of the researcher's first matrix corresponds to the technical field or subject field. It can be judged based on whether the maximum value of the second matrix matches each subfield. Afterwards, the classification unit 15 determines whether the technical field of the researcher who is the subject of matching matches the detailed field of the subject field for a plurality of laboratories that are matching candidates, and selects the laboratory that matches the detailed fields of both fields as Group A and Yang. Among the fields, labs that match only the subfields of the subject field can be classified into Group B, Group A, and labs that are not Group B can be classified into Group C. At this time, each group A, B, and C may include multiple laboratories.

한편, 매칭 대상인 연구실에 대하여 매칭 후보인 복수의 연구자 중 적어도 어느 하나를 추천하는 경우, 분류부(15)는 기술 분야 또는 주제 분야에 대해, 연구실의 제2 매트릭스의 최댓값이 해당하는 각각의 세부분야와 복수의 제1 매트릭스의 최댓값이 해당하는 각각의 세부분야가 일치하는지를 기준으로 판단할 수 있다. 그 후, 분류부(15)는 매칭 후보인 복수의 연구자에 대해 매칭 대상인 연구실의 기술 분야와 주제 분야의 세부분야가 일치하는지를 기준으로, 양 분야의 세부분야가 모두 일치하는 연구자를 A군, 양 분야 중 주제 분야의 세부분야만 일치하는 연구자를 B군, A군 및 B군이 아닌 연구자를 C군으로 분류할 수 있다. 이때, 각 A군, B군, C군에는 각각 복수의 연구자가 포함될 수 있다.Meanwhile, when recommending at least one of a plurality of researchers who are matching candidates for a matching laboratory, the classification unit 15 selects each subfield for which the maximum value of the laboratory's second matrix corresponds to the technical field or subject field. It can be determined based on whether the maximum value of the plurality of first matrices matches each subfield. Afterwards, the classification unit 15 determines whether the technical field of the laboratory and the subfield of the subject field match for the plurality of researchers who are matching candidates, and selects researchers whose subfields match in both fields into Group A and Yang. Among the fields, researchers who match only the subfields of the topic can be classified into group B, group A, and researchers who are not group B can be classified into group C. At this time, each group A, B, and C may include multiple researchers.

매칭부(17)는 제1 매트릭스와 제2 매트릭스 간 유사도를 비교하여, 분류부(15)에서 분류된 연구실 중 적어도 어느 하나를 연구자에게 제공하거나, 또는 연구자 중 적어도 어느 하나를 연구실에 제공할 수 있다. 매칭부(17)는 정규화 모듈(171), 재배열 모듈(173) 및 유사도 산출 모듈(175)을 포함할 수 있다. The matching unit 17 may compare the similarity between the first matrix and the second matrix and provide at least one of the laboratories classified in the classification unit 15 to the researcher, or provide at least one of the researchers to the laboratory. there is. The matching unit 17 may include a normalization module 171, a rearrangement module 173, and a similarity calculation module 175.

매칭부(17)는 분류부(15)에서 분류된 A군, B군, C군 매칭 후보를 A군 > B군 > C군 순서대로 우선하여 매칭 대상에 추천하여 매칭할 수 있다. 주목할 점은, 분류된 후보군은 해당 후보군 내에서 우선적으로 추천되는 방법이 상이하다. The matching unit 17 may perform matching by recommending matching candidates for Group A, Group B, and Group C classified in the classification unit 15 as matching targets in the order of Group A > Group B > Group C. What is noteworthy is that the classified candidate group differs in the preferential recommendation method within the candidate group.

매칭부(17)는 매칭 대상인 연구자에 대하여 매칭 후보인 복수의 연구실 중 적어도 어느 하나를 추천하는 경우를 먼저 가정하면, A군에 대하여, 정규화 모듈(171)은 제1 매트릭스에 포함되는 제1 기술 매트릭스 및 제1 주제 매트릭스를 각각 정규화하고, 제2 매트릭스에 포함되는 제2 기술 매트릭스 및 제2 주제 매트릭스를 각각 정규화할 수 있다.Assuming that the matching unit 17 recommends at least one of a plurality of laboratories that are matching candidates for the researcher who is the matching target, for group A, the normalization module 171 selects the first technology included in the first matrix. The matrix and the first subject matrix may be normalized, and the second technology matrix and the second subject matrix included in the second matrix may be normalized, respectively.

재배열 모듈(173)은 제1 또는 제2 기술 매트릭스, 제1 또는 2 주제 매트릭스 중 값이 1인 셀을 삭제하고, 제1 기술 매트릭스와 제1 주제 매트릭스를 연결하여 제1 매트릭스를 재배열하고, 제2 기술 매트릭스와 제2 주제 매트릭스를 연결하여 제2 매트릭스를 재배열할 수 있다. The rearrangement module 173 deletes cells with a value of 1 among the first or second technology matrix and the first or second subject matrix, rearranges the first matrix by connecting the first technology matrix and the first subject matrix, and , the second matrix can be rearranged by connecting the second technology matrix and the second subject matrix.

유사도 산출 모듈(175)는 재배열된 제1 매트릭스와 재배열된 복수의 제2 매트릭스에 대한 코사인 유사도를 산출할 수 있다. 코사인 유사도는 1에 가까울수록 벡터의 유사도가 높은 것임으로 유사한 분야에 관심이 있는 것임을 나타내며, 반대로 0에 가까울수록 벡터의 유사도가 낮은 것임으로 서로 다른 분야에 관심있는 것임을 나타낼 수 있다.The similarity calculation module 175 may calculate cosine similarity for the rearranged first matrix and the plurality of rearranged second matrices. The closer the cosine similarity is to 1, the higher the vector similarity, indicating interest in a similar field. Conversely, the closer it is to 0, the lower the vector similarity, indicating interest in different fields.

매칭 대상인 연구자에 대하여 매칭 후보인 복수의 연구실 중 적어도 어느 하나를 추천할 때, B군인 경우에는 정규화 모듈(171)은 제1 및 제2 주제 매트릭스를 정규화하고, 재배열 모듈(173)은 제1 및 제2 주제 매트릭스 중 값이 1인 셀을 삭제하여 재배열하고, 유사도 산출 모듈(173)은 재배열된 제1 주제 매트릭스와 재배열된 복수의 제2 주제 매트릭스에 대한 코사인 유사도를 산출할 수 있다. When recommending at least one of a plurality of laboratories that are matching candidates for a matching researcher, in the case of Group B, the normalization module 171 normalizes the first and second subject matrices, and the rearrangement module 173 normalizes the first and second subject matrices. And cells with a value of 1 in the second subject matrix are deleted and rearranged, and the similarity calculation module 173 can calculate the cosine similarity for the rearranged first subject matrix and the plurality of rearranged second subject matrices. there is.

즉, 매칭부(17)는 A군과 B군에 대해 유사한 과정으로 주요 매칭 대상을 선정할 수 있다. 그러나, A군은 기술 분야와 주제 분야의 일치 여부를 모두 고려하는 반면, B군은 주제 분야의 일치 여부만을 고려하여 주제 매트릭스만을 사용한다. 따라서, 정규화 모듈(171)은 B군에 대해 주제 매트릭스만을 정규화하며, 기술 매트릭스를 사용하지 않으므로 재배열 모듈(173)은 B군에 대해 기술 매트릭스와 주제 매트릭스를 연결하는 과정을 포함하지 않는다. In other words, the matching unit 17 can select the main matching target for group A and group B through a similar process. However, while group A considers both the technical field and the subject field, group B only considers the match between the subject fields and uses only the topic matrix. Therefore, the normalization module 171 normalizes only the topic matrix for group B, and does not use the technology matrix, so the reordering module 173 does not include a process of connecting the technology matrix and topic matrix for group B.

매칭부(17)는 매칭 대상인 연구자에 대하여 매칭 후보인 복수의 연구실 중 적어도 어느 하나를 추천할 때 C군인 경우, 별도의 C군 판단 모듈(177)을 더 포함할 수 있다.The matching unit 17 may further include a separate group C determination module 177 when recommending at least one of a plurality of laboratories that are matching candidates for the researcher to be matched, and in the case of group C.

C군 판단 모듈(177)은 제1 매트릭스에 속한 제1 기술 매트릭스 및 제1 주제 매트릭스를 연결하여 재배열하고, 제2 기술 매트릭스와 제2 주제 매트릭스를 연결하여 제2 매트릭스를 재배열하고, 재배열된 제1 매트릭스와 재배열된 복수의 제2 매트릭스에 대한 코사인 유사도를 산출할 수 있다. The C group judgment module 177 connects and rearranges the first technology matrix and the first subject matrix belonging to the first matrix, connects the second technology matrix and the second subject matrix, rearranges the second matrix, and reorders the second matrix. Cosine similarity can be calculated for the arranged first matrix and the rearranged plurality of second matrices.

매칭부(17)는 A군 또는 B군에 대하여, 유사도 산출 모듈(175)에서 산출된 코사인 유사도가 낮은 매칭 후보 연구실 또는 연구자를 우선 제공할 수 있다. 반면, 매칭부(17)는 C군에 대하여, C군 판단 모듈(177)을 통해 코사인 유사도가 큰 매칭 후보 연구실 또는 연구자를 우선 제공할 수 있다.The matching unit 17 may first provide a matching candidate laboratory or researcher with a low cosine similarity calculated by the similarity calculation module 175 for group A or group B. On the other hand, the matching unit 17 may first provide a matching candidate laboratory or researcher with a high cosine similarity to group C through the group C judgment module 177.

매칭부(17)에서 각 후보군에 따른 매칭 후보 추천 방법은 이하 도 6 내지 도 8에서 자세히 후술한다.The method of recommending matching candidates for each candidate group in the matching unit 17 will be described in detail with reference to FIGS. 6 to 8 below.

도 2는 본 발명의 실시예에 따른 연구자 및 복수의 연구실의 연구 분야를 산출하여 매칭하는 과정을 나타낸 구조도이다. 도 2는 매칭 대상인 단일의 연구자에 대하여 매칭 후보인 복수의 연구실을 어느 하나를 추천하는 것을 전제로 한다. 일 예시로, 연구실은 연구실1, 연구실2, 연구실3인 경우이다. 제1 데이터베이스(101)는 연구자의 연구 이력 데이터 및 기술·주제 분야에 대한 제1 관심 데이터를 포함하며, 이를 통해 제1 핵심 데이터를 추출할 수 있다. 제2 데이터베이스(103)는 연구실1, 연구실2, 연구실3의 각 구인 데이터와 기술·주제 분야에 대한 제2 관심 데이터를 포함하며, (1), (2), (3)을 부여하여 구분하였다. 추출부(11)는 연구자 및 각 연구실에 대하여 핵심 데이터를 산출하며, 각각에 대해 기술·주제 분야에 대한 매트릭스를 생성할 수 있다. 생성된 매트릭스는 이하 도 5e 또는 도 5f와 같이 세부분야를 열로 하여 하나의 매트릭스로 병합될 수 있다. 이후 연구자-연구실 매칭 알고리즘을 통해 연구자와 각 연구실 간 유사도를 판단하여 복수의 연구실 중 적어도 어느 하나를 추천할 수 있다.Figure 2 is a structural diagram showing the process of calculating and matching research fields of researchers and multiple laboratories according to an embodiment of the present invention. Figure 2 assumes that one of a plurality of laboratories that are matching candidates is recommended to a single researcher that is the matching target. As an example, the labs are Lab 1, Lab 2, and Lab 3. The first database 101 includes the researcher's research history data and first interest data on technology and subject areas, through which the first core data can be extracted. The second database 103 includes job opening data for each of Lab 1, Lab 2, and Lab 3, as well as secondary interest data on technology and subject areas, and is classified by assigning (1), (2), and (3). . The extraction unit 11 calculates key data for researchers and each laboratory, and can generate a matrix for technology and subject areas for each. The generated matrix can be merged into one matrix with detailed fields as columns, as shown in Figure 5e or 5f below. Afterwards, the similarity between the researcher and each laboratory can be determined through the researcher-laboratory matching algorithm, and at least one of the plurality of laboratories can be recommended.

도 3은 본 발명의 실시예에 따른 추출부(11)의 텍스트 전처리 모듈(111)에서 수행되는 전처리 과정을 나타낸 순서도이다. 텍스트 전처리 모듈(111)은 연구자의 연구 이력 데이터 또는 연구실의 구인 데이터를 전처리하여 전처리 데이터를 생성할 수 있다.Figure 3 is a flow chart showing the pre-processing process performed in the text pre-processing module 111 of the extraction unit 11 according to an embodiment of the present invention. The text preprocessing module 111 may generate preprocessed data by preprocessing the researcher's research history data or the laboratory's job opening data.

S1101 내지 S1108 단계는 하기 표와 같이 정리될 수 있다.Steps S1101 to S1108 can be organized as in the table below.

S1101 단계는 영어를 모두 소문자로 변환하는 단계이다. 필요에 따라 기술적인 용어의 경우 영어로 표현하는 경우가 있다. 이때 문서 작성자에 따라, 문장 혹은 단어의 첫 글자가 대문자로 표현되는 경우가 있으며, 또는 모두 소문자나 대문자로 표현하는 경우도 있다. 그러므로, 모든 문자를 동일한 모양 및 크기로 통일을 하지 않으면 텍스트 분석 패키지에서는 같은 의미의 스펠링이라도 다르게 인식될 위험이 있다.Step S1101 is the step of converting all English letters to lowercase letters. If necessary, technical terms may be expressed in English. At this time, depending on the document writer, the first letter of a sentence or word may be expressed in capital letters, or all letters may be expressed in lowercase or uppercase letters. Therefore, unless all characters are unified into the same shape and size, there is a risk that even spellings with the same meaning will be recognized differently in a text analysis package.

S1102 단계는 동의어 정규화 단계이다. 동일한 의미를 가리키나 표현 방식이 다른 동의어에 대해서는 같은 단어로 취급하면 오류 발생을 줄일 수 있다. 또한 영어 단어를 한글로 표기하거나, 한글을 영어로 표기하는 경우가 있는데, 이와 같은 경우에서 텍스트 분석을 용이하게 하기 위해 하나로 통일하는 정규화 과정을 거친다.Step S1102 is a synonym normalization step. Treating synonyms that indicate the same meaning but have different expression methods as the same word can reduce the occurrence of errors. In addition, there are cases where English words are written in Hangul or Korean words are written in English, and in such cases, a normalization process is performed to unify them into one to facilitate text analysis.

S1103 단계는 영어 단어를 모두 명사로 취급하는 단계이다. konlpy 에서는 간혹 영어를 명사로 취급하지 않고 다른 품사로 취급한다. 그러나 한글 사이트에서 보통 영어로 표기하는 것은 외래어, 즉 명사인 경우가 있다.또한 기술적으로 중요한 의미를 가지는 단어를 누락하지 않기 위해, 영어 단어를 모두 명사로 취급하여 저장한다.Step S1103 is the step where all English words are treated as nouns. In konlpy, English words are sometimes treated not as nouns but as other parts of speech. However, in Korean sites, what is usually written in English is a foreign word, that is, a noun. In addition, in order not to omit words with technically important meaning, all English words are treated as nouns and stored.

S1104 단계는 한글 및 영어 이외의 문자를 제거하는 단계이다. 특수문자와 숫자는 쓸모 없는 경우가 많다. 예를 들어 ‘코로나19’ 같은 단어 또한 숫자를 제외한 코로나라는 단어만으로도 의미전달이 가능하다. 이러한 원리로 영어와 한글을 제외한 모든 문자가 제거되도록 한다. 여기에는 오탈자의 가능성이 있거나 단순 인터넷 유행어로 사용될 수 있는, 자음만으로 이루어진 것(ㅋㅋㅋ, ㅎㅎㅎ)도 포함된다.Step S1104 is a step of removing characters other than Korean and English. Special characters and numbers are often useless. For example, a word like ‘Corona 19’ can also convey meaning with just the word ‘Corona’ excluding the number. This principle ensures that all characters except English and Korean are removed. This also includes things made up of only consonants (hahaha, hahaha) that may contain typos or may be used as simple Internet buzzwords.

S1105 단계는 맞춤법 검사 단계이다. 같은 의미의 단어라도 맞춤법이 틀리다면 컴퓨터에서는 다른 단어로 취급될 수 있다. 예를 들어 ‘아버지가 가방에 들어가신다’ 와 ‘아버지가 가방에 들어 가신다’를 다르게 취급할 수 있다. 이러한 점을 방지하기 위해 맞춤법 검사를 통해 띄어쓰기와 외래어에 대한 한글 표기를 통일시킨다.Step S1105 is a spell check step. Even words with the same meaning may be treated as different words by the computer if they are spelled incorrectly. For example, ‘My father is going into my bag’ and ‘My father is going into my bag’ can be treated differently. To prevent this, the Hangul notation for spacing and foreign words is unified through spell check.

S1106 단계는 형태소 분류 단계이다. 예를 들어 ‘가방에 들어가신’를 형태소 분석을 진행하면 ‘가방/NNG+ 에/JKM + 들어가/VV+시/EPH +ㄴ다/EFN’로 분석이 되는데 이에서 의미가 있는 것은 ‘가방’과 ‘들어가’이다. 즉, NNG(일반 명사), NNP(고유 명사), NNB(의존 명사), NR(수사), NP(대명사), VV(동사), VA(형용사), VX(보조 용언), VCP(긍정 지정사), VCN(부정 지정사) 등의 품사 태깅에서 실제 문장에서 의미를 가지는 것은 명사와 동사이다. 반면, 나머지 품사는 문법적인 형식을 맞추기 위함이거나 혹은 문장을 수식해주는 용도이다. 따라서 형태소 분석을 통해 품사 태깅을 한 후 그중에서 명사와 동사를 추출해 문장의 핵심적인 의미를 가지지 않는 것을 제외한다.Step S1106 is a morpheme classification step. For example, if you perform a morphological analysis of 'entered the bag', it is analyzed as 'bag/NNG+ eh/JKM + enter/VV+si/EPH +ㄴ다/EFN'. In this, the meaningful things are 'bag' and 'enter'. am. That is, NNG (common noun), NNP (proper noun), NNB (dependent noun), NR (rhetor), NP (pronoun), VV (verb), VA (adjective), VX (auxiliary verb), VCP (positive specifier) ), VCN (indefinite noun), etc., in part-of-speech tagging, it is nouns and verbs that have meaning in actual sentences. On the other hand, the remaining parts of speech are used to match grammatical forms or to modify sentences. Therefore, after tagging parts of speech through morphological analysis, nouns and verbs are extracted from them and those that do not have the core meaning of the sentence are excluded.

S1107 단계는 명사 추출 단계이다. 조사, 어미 등을 제외한 명사만을 추출한다.Step S1107 is a noun extraction step. Extract only nouns excluding particles, endings, etc.

S1108 단계는 불용어 제거 단계이다. 비록 명사와 동사만을 추출해 의미를 도출하였다 하더라도 ‘있다’와 같이, 동사임에도 단순하게 문법적인 형식을 맞추기 위해 사용되는 단어가 있다. 이러한 경우 어떠한 핵심적인 의미를 가지지 않기 때문에 제외한다.Step S1108 is a stopword removal step. Even if the meaning is derived by extracting only nouns and verbs, there are words such as ‘there are’ that are used simply to match the grammatical form even though they are verbs. In this case, it is excluded because it does not have any core meaning.

도 4는 본 발명의 실시예에 따른 추출부(11)의 핵심 데이터 도출 모듈(113)에서 수행되는 벡터화 및 가중치 부여 과정을 설명하기 위한 참조도면이다.Figure 4 is a reference diagram for explaining the vectorization and weighting process performed in the core data derivation module 113 of the extraction unit 11 according to an embodiment of the present invention.

핵심 데이터 도출 모듈(113)은 추출된 전처리 데이터를 벡터화하여 검출 빈도를 산정할 수 있다. The core data derivation module 113 can calculate the detection frequency by vectorizing the extracted preprocessed data.

벡터화 과정은 텍스트 전처리 모듈(111)에서 수행된 전처리 과정 이후, 인공신경망에 입력될 수 있도록 하기 위함이다. 이때 사용되는 벡터화로는 카운트 기반 벡터화와 TF-IDF 기반 벡터화가 있다. 핵심 데이터 도출 모듈(113)은 TF-IDF 기반 모듈로 벡터화할 수 있다. 그 이유는, 카운트 기반 벡터화는 단순 단어의 빈도만을 고려하는 벡터화라 불용어까지 중요하다 인식할 수 있어 오류가 발생할 가능성이 있다. 특히, 한국어의 특성상 불용어를 완전히 제거할 수는 없어 TF-IDF 기반의 벡터화를 사용한다. 벡터화된 전처리 텍스트는 인공신경망에 입력되어 활성 함수로 사용된 소프트 맥스 회귀에 의해 각 분야별 확률이 도출될 수 있다.The vectorization process is to enable text to be input to an artificial neural network after the preprocessing process performed in the text preprocessing module 111. The vectorization used at this time includes count-based vectorization and TF-IDF-based vectorization. The core data derivation module 113 can be vectorized into a TF-IDF based module. The reason is that count-based vectorization is a vectorization that only considers the frequency of simple words, so even stop words can be recognized as important, which may lead to errors. In particular, due to the characteristics of the Korean language, stop words cannot be completely removed, so TF-IDF-based vectorization is used. Vectorized preprocessed text can be input into an artificial neural network and the probability for each field can be derived by soft max regression used as an activation function.

핵심 데이터 도출 모듈(113)은 전처리 데이터가 기술 분야의 세부분야 또는 주제 분야의 세부분야에 대해 기설정된 핵심 단어를 포함하는 경우 해당 세부분야에 가중치를 부여하여 핵심 데이터를 도출할 수 있다. The core data derivation module 113 may derive core data by assigning a weight to the subfield of the technical field or subject field if the preprocessed data includes key words preset for the subfield of the technical field or subject field.

불용어를 완전히 제거하기 힘들다는 점으로 TF-IDF 기반 벡터화가 사용되었으나 이는 반대로 document 별 빈출 단어에 대한 중요도를 낮추게 된다. 그러나 각각의 주제별로 핵심이 되는 단어와 자주 등장하는 단어는 중요하기에 전 단계에서 도출된 각 분야별 확률에 가중치를 더하는 방식으로 텍스트 벡터화와 인공신경망을 보완할 수 있다. 가중치의 추가는 만일 해당 분야의 특정 단어에 해당하는 단어가 input 텍스트에 존재한다면, 해당 분야의 확률에 가중치 0.07을 더하는 방식으로 진행한다. 도4의 경우, 빅데이터 부문에 자주 등장하는 단어인 ‘빅데이터’가 input 문서상에 존재한다면 빅데이터 부문에 가중치 0.07을 더할 수 있다.Because it is difficult to completely remove stop words, TF-IDF-based vectorization was used, but this lowers the importance of frequent words for each document. However, since key words and frequently appearing words for each topic are important, text vectorization and artificial neural networks can be complemented by adding weight to the probability of each field derived in the previous step. The addition of weight is done by adding a weight of 0.07 to the probability of the field if a word corresponding to a specific word in the field exists in the input text. In the case of Figure 4, if ‘big data’, a word that frequently appears in the big data section, exists in the input document, a weight of 0.07 can be added to the big data section.

본 발명의 실시예는 인공신경망의 성능을 좌우하는 은닉층의 개수가 많아질수록 오히려 인공신경망의 성능이 저하될 수 있다는 특징(vanishing gradient problem 기울기 소실 문제)를 고려하여 이를 보완할 수 있도록 RNN(Recent Neural Network)의 일종인 LSTM(Long Short-Term Memory model)을 기반으로 모델을 구축할 수 있다. 본 발명의 실시예에서 구축한 모델은 ①TF-IDF 가중치를 밀집행렬로 변환시키기 위한 임베딩 층 embedding layer(다음 층을 거치면 128개로 차원이 축소된다), ②64 메모리 셀을 가진 LSTM 레이어, ③Dense 레이어로 구성될 수 있다. 활성 함수로는 soft-max가 사용될 수 있다.The embodiment of the present invention considers the characteristic that the performance of the artificial neural network may deteriorate as the number of hidden layers that determine the performance of the artificial neural network increases (vanishing gradient problem) and uses an RNN (Recent Layer) to compensate for this. A model can be built based on LSTM (Long Short-Term Memory model), a type of Neural Network. The model constructed in the embodiment of the present invention consists of ① an embedding layer for converting TF-IDF weights into a dense matrix (the dimension is reduced to 128 after passing through the next layer), ② an LSTM layer with 64 memory cells, and ③ a Dense layer. It can be. Soft-max can be used as an activation function.

또한 인공신경망의 가중치를 조절하기 위해, 본 발명의 실시예는 확률적 경사 하강법을 사용할 수 있으며, learning-rate는 0.1로 설정할 수 있다. 실제치와 예측치의 차이를 줄이기 위한 손실 함수로는 cross-entropy가 사용될 수 있다. 학습 시 batch size는 10, epoch는 30으로 설정될 수 있다. 다만 이러한 세부 요인은 매칭 과정이 진행됨에 따라 변경될 수 있다.Additionally, to adjust the weights of the artificial neural network, embodiments of the present invention can use stochastic gradient descent, and the learning-rate can be set to 0.1. Cross-entropy can be used as a loss function to reduce the difference between actual and predicted values. During training, the batch size can be set to 10 and the epoch can be set to 30. However, these detailed factors may change as the matching process progresses.

도 5a 내지 도 5f는 본 발명의 실시예에 따른 매트릭스 생성부(13)에서 연구자 또는 연구실에 대한 기술 매트릭스 및 주제 매트릭스가 생성되는 과정을 설명하기 위한 참조도면이다. 도 5a 내지 도 5f 과정을 통해 생성되는 매트릭스는 연구자 개인, 연구팀의 개별 팀원 또는 개별 연구실마다 별개인 것이 유의한다. 도 5a 내지 도 5f는 일 실시예로서, 특정 연구자의 관심 데이터 및 핵심 데이터를 이용하여 매트릭스를 생성하는 과정이다.FIGS. 5A to 5F are reference diagrams for explaining the process of generating a technology matrix and a subject matrix for a researcher or laboratory in the matrix generator 13 according to an embodiment of the present invention. It is important to note that the matrices generated through the processes of FIGS. 5A to 5F are separate for each individual researcher, individual member of the research team, or individual laboratory. Figures 5A to 5F are an example of a process for generating a matrix using data of interest and core data of a specific researcher.

데이터베이스(10)에 저장된 데이터는 모두 문자열 형식으로 저장되어 있다. 다만, 이를 이용하기 위해 다음과 같은 벡터화 과정을 거친다. 우선 각각의 기술 분야와 주제 분야가 매핑되어 있는 (1 by 총 세부분야의 개수)의 영백터를 구축할 수 있다. 본 발명의 실시예는 10개의 세부분야로 구분된 기술 분야, 4개의 세부분야로 구분된 주제 분야인 경우이다. 따라서, 도 5a는 기술 분야에 대한 (1 by 10) 영벡터이며, 도 5b는 주제 분야에 대한 (1 by 4) 영벡터이다.All data stored in the database 10 is stored in string format. However, in order to use this, the following vectorization process is required. First, you can build a zero vector (1 by the total number of detailed fields) in which each technical field and subject field are mapped. The embodiment of the present invention is a technical field divided into 10 subfields and a subject field divided into 4 subfields. Accordingly, Figure 5A is the (1 by 10) zero vector for the technical field, and Figure 5B is the (1 by 4) zero vector for the subject field.

그리고 특정 연구자, 연구팀의 개별 팀원, 연구실의 관심 데이터가 해당하는 기술 분야의 세부분야 또는 주제 분야의 세부분야에 대해 n이 부여될 수 있다. 도 5c는 기술 세부분야에 n=1이 부여된 것으로, 연구자의 관심 데이터인 IoT, 영상처리, 자동제어기술, 데스크톱SW에 1이 부여되었음을 확인할 수 있다. 도 5d는 주제 세부분야에 n=1이 부여된 것으로, 연구자의 관심 데이터인 업무 자동화·지능화, 기업 분석·개선에 1이 부여되었음을 확인할 수 있다.In addition, n may be assigned to a subfield of a technical field or subfield of a subject field to which data of interest from a specific researcher, individual member of the research team, or laboratory corresponds. Figure 5c shows that n = 1 was assigned to the technical field, and it can be seen that 1 was assigned to IoT, image processing, automatic control technology, and desktop software, which are data of interest to researchers. Figure 5d shows that n = 1 was assigned to the subject subfield, and it can be seen that 1 was assigned to the data of interest to the researcher, such as work automation/intelligence and corporate analysis/improvement.

핵심 분야는 관심 분야보다 더 높은 선호도와 역량을 가지고 있다고 판단할 수 있으며, 따라서 핵심 데이터가 해당하는 세부분야에 3n 가중치를 추가하는 작업을 진행할 수 있다. 3n 가중치는 정수 중에서 3이 가장 정확도가 높아 이와같이 설정할 수 있다. 도 5e는 기술 세부분야에 3n=3이 부여된 것으로, 연구자의 핵심 데이터인 자동제어기술에 3이 부여되었음을 확인할 수 있다. 도 5f는 주제 세부분야에 3n=3이 부여된 것으로, 연구자의 핵심 데이터인 기업 분석·개선에 1이 부여되었음을 확인할 수 있다.It can be determined that the core field has higher preferences and capabilities than the field of interest, and therefore, the work of adding 3n weight to the detailed field to which the core data corresponds can be carried out. The 3n weight can be set like this because 3 is the most accurate among integers. Figure 5e shows that 3n = 3 was assigned to the technical detail field, and it can be seen that 3 was assigned to the automatic control technology, which is the researcher's core data. In Figure 5f, it can be seen that 3n = 3 was assigned to the subject subfield, and 1 was assigned to corporate analysis and improvement, which is the researcher's core data.

도 6a 내지 도 6d는 본 발명의 실시예에 따른 매트릭스 생성부(13)에서 연구팀에 대한 기술 매트릭스 및 주제 매트릭스가 생성되는 과정을 설명하기 위한 참조도면이다.FIGS. 6A to 6D are reference diagrams for explaining the process of generating a technology matrix and a subject matrix for a research team in the matrix generator 13 according to an embodiment of the present invention.

매칭 장치(1)는 연구 분야를 기반으로 하여 복수의 팀원을 포함한 연구팀과 연구자를 연계할 수 있다. 연구자가 매칭 대상이고, 매칭 후보가 복수의 연구팀인 경우를 가정할 수 있으며, 연구팀이 매칭 대상이고, 매칭 후보가 복수의 연구자인 반대의 경우를 가정할 수 있다. 두 경우 모두 전술한 도 1과 유사한 과정으로 매칭이 수행된다. 다만 이 경우(연구자-연구팀), 도 1에서의 연구자-연구실 매칭과 구분되도록 편의상 구조 및 데이터의 명칭을 구분하였다.The matching device (1) can connect researchers with a research team including multiple team members based on the research field. It can be assumed that a researcher is the matching target and the matching candidates are multiple research teams, and the opposite case can be assumed where the research team is the matching target and the matching candidates are multiple researchers. In both cases, matching is performed in a process similar to that of FIG. 1 described above. However, in this case (researcher-research team), the names of the structure and data were differentiated for convenience to distinguish them from the researcher-laboratory matching in Figure 1.

본 발명의 일 실시예인 도 6a의 경우, 제3 데이터베이스(105)(미도시)는 연구자의 데이터를 저장하는 구성으로, 세부분야로 기분류된 기술 분야 및 주제 분야에 대한 연구자의 제3 관심 데이터 및 연구자 이력 데이터를 저장할 수 있다. 제4 데이터베이스(107)(미도시)는 연구팀의 데이터를 저장하는 구성으로, 기술 분야 및 주제 분야에 대한 제4 관심 데이터 및 팀원 이력 데이터를 연구팀 팀원별로 저장할 수 있다. In the case of FIG. 6A, which is an embodiment of the present invention, the third database 105 (not shown) is a configuration that stores the researcher's data, and the researcher's third interest data on technical fields and subject areas classified as detailed fields. and researcher history data can be stored. The fourth database 107 (not shown) is configured to store data of the research team, and can store fourth interest data and team member history data for technical fields and subject areas for each research team member.

여기서 주목할 점은, 연구팀의 경우 복수의 팀원으로 구성되며, 이때 각 팀원의 개별 ‘팀원 이력 데이터’를 모두 고려한다는 점이다. 따라서, 추출부(11)는 제4 핵심 데이터를 추출함에 있어서, 연구팀의 최종 데이터를 추출하기 이전에 인공지능 알고리즘을 이용하여 팀원별 제4 핵심 데이터를 각각 추출할 수 있다.What is noteworthy here is that the research team consists of multiple team members, and at this time, each team member's individual ‘team member history data’ is taken into consideration. Therefore, when extracting the fourth core data, the extraction unit 11 can extract the fourth core data for each team member using an artificial intelligence algorithm before extracting the final data of the research team.

그 후, 매트릭스 생성부(13)는 연구 분야에 대해, 제3 관심 데이터 및 제3 핵심 데이터를 기반으로 연구자의 제3 매트릭스를 생성하고, 제4 관심 데이터 및 제4 핵심 데이터를 기반으로 연구팀의 제4 매트릭스를 생성할 수 있다. 연구팀이 매칭 대상 또는 매칭 후보인 경우에는, 매트릭스가 생성되는 방법은 전술한 도 5a 내지 도 5f와는 일부 상이하다.Thereafter, the matrix generator 13 generates the researcher's third matrix based on the third interest data and the third core data for the research field, and the research team's third matrix based on the fourth interest data and the fourth core data. A fourth matrix can be created. When the research team is a matching target or matching candidate, the method of generating the matrix is somewhat different from the above-described FIGS. 5A to 5F.

연구팀을 구성하는 복수의 팀원 각각에 대해 제4 관심 데이터가 해당하는 기술 분야의 세부분야 또는 주제 분야의 세부분야에 대해 n을 부여하고, 제4 핵심 데이터가 해당하는 세부분야에 3n을 부여한다. 그 후, 기술 분야 및 주제 분야의 세부분야에 대한 전체 팀원의 값을 더하여 최종적으로 연구팀의 제4 매트릭스가 생성된다.For each of the plurality of team members constituting the research team, n is assigned to the subfield of the technical field or topic field to which the fourth data of interest corresponds, and 3n is assigned to the subfield to which the fourth core data corresponds. Afterwards, the fourth matrix of the research team is finally created by adding the values of all team members for the subfields of the technical field and subject field.

보다 자세하게, 도 6a는 기술 분야의 세부분야에 대해, 각 팀원(팀원 A, 팀원 B, 팀원 C)의 제4 관심 데이터에 각각 n으로 1을 부여하고, 제4 핵심 데이터에 가중치 3n(=3)을 부여한 기술 매트릭스이다. 팀원 A의 관심 데이터는 IoT, 영상처리, 자동제어기술, 데스크톱 SW로서 각각 1이 부여되었다. 추출부(11)에서 팀원 A의 팀원 이력 데이터를 통해 추출된 핵심 데이터는 자동제어기술이므로, 기부여된 1에 가중치 3을 곱함으로써, 도 6a의 두 번째 행렬인 팀원 A의 기술 매트릭스가 생성된 것이다. 팀원 B 및 팀원 C도 이와 동일한 과정으로 수행되므로 생략한다. 도 6b는 주제 분야의 세부분야에 대한, 각 팀원(팀원 A, 팀원 B, 팀원 C)의 주제 매트릭스이다. 주제 매트릭스 또한 도 6a의 과정과 동일하게 수행될 수 있다. 도 6a 및 도 6b는 각각 팀원을 행, 기술 분야와 주제 분야의 세부분야를 열로 설정한 것이다.In more detail, Figure 6a shows that for the detailed fields of the technical field, n is assigned 1 to the fourth data of interest of each team member (team member A, team member B, and team member C), and a weight of 3n (=3) is given to the fourth core data. ) is a technology matrix given. Team member A's data of interest were given 1 each for IoT, image processing, automatic control technology, and desktop software. Since the core data extracted through the member history data of team member A in the extraction unit 11 is an automatic control technology, by multiplying the contribution of 1 by the weight of 3, the skill matrix of team member A, which is the second matrix in Figure 6a, is generated. will be. Team member B and team member C are also omitted since they are performed in the same process. Figure 6b is a topic matrix for each team member (team member A, team member B, and team member C) for the subfields of the subject area. The topic matrix can also be performed in the same manner as the process in FIG. 6A. Figures 6a and 6b show team members as rows and technical fields and subject areas as columns, respectively.

도 6c 및 도 6d는 동일한 세부분야에 대해 각 팀원들에게 부여된 값을 모두 더한 최종 기술 매트릭스 및 주제 매트릭스이다. 이렇듯, 복수의 팀원으로 구성된 연구팀의 경우에는, 각 팀원들의 관심 데이터와 핵심 데이터를 모두 고려하여 매트릭스를 생성한다.Figures 6c and 6d are the final skill matrix and topic matrix that add up all the values given to each team member for the same detailed field. In this way, in the case of a research team consisting of multiple team members, a matrix is created by considering all data of interest and core data of each team member.

분류부(15)는 연구 분야 각각에 대해, 연구자의 제3 매트릭스를 기준으로 연구팀의 제4 매트릭스를 비교하거나, 또는 제4 매트릭스를 기준으로 제3 매트릭스를 비교하여 기술 분야 또는 주제 분야에서의 일치 여부에 따라 연구팀 또는 연구자를 등급으로 분류할 수 있다.For each research field, the classification unit 15 compares the fourth matrix of the research team based on the third matrix of the researcher, or compares the third matrix based on the fourth matrix to ensure agreement in the technical field or subject field. Research teams or researchers can be classified into levels depending on whether

매칭부(17)는 제3 매트릭스와 제4 매트릭스 간 유사도를 비교하여, 분류부에서 분류된 연구팀 중 적어도 어느 하나를 연구자에게 제공하거나, 또는 연구자 중 적어도 어느 하나를 연구팀에 제공할 수 있다.The matching unit 17 may compare the similarity between the third matrix and the fourth matrix and provide at least one of the research teams classified in the classification unit to the researcher, or provide at least one of the researchers to the research team.

도 7a 및 도 7b는 단일 연구실에 대한 복수의 연구자 중 일부를 후보군으로 분류하기 위해 기술 매트릭스 및 주제 매트릭스의 세부분야의 일치 여부를 파악할 수 있는 매트릭스를 나타낸다. 매칭 대상(인풋 데이터)와 매칭 후보(추천 대상)의 핵심 분야 및 관심 분야가 전술한 도 5 또는 도 6과 같이 벡터화가 되었다면 복수의 매칭 후보를 후보군으로 분류하는 과정을 거친다. 도 7은 본 발명의 일 실시예로서, 매칭 대상인 연구실에 대해 매칭 후보 3명의 연구자의 연구 분야를 각각 비교한 것이다. 도 7a는 기술 매트릭스이며, 도 7b는 주제 매트릭스이다. 도 7a 및 도 7b의 매트릭스의 값은 임의로 부여한 값이다. Figures 7a and 7b show a matrix that can determine whether the detailed fields of the technology matrix and the subject matrix match in order to classify some of the plurality of researchers for a single laboratory into candidate groups. If the core fields and areas of interest of the matching object (input data) and the matching candidate (recommendation object) are vectorized as shown in Figure 5 or Figure 6 described above, a process is performed to classify the plurality of matching candidates into candidate groups. Figure 7 is an embodiment of the present invention, comparing the research fields of three matching candidate researchers with respect to the laboratory that is the matching target. Figure 7a is a description matrix and Figure 7b is a topic matrix. The values of the matrices in FIGS. 7A and 7B are arbitrarily assigned values.

후보군은 A군, B군, C군으로 구분할 수 있으며, 추천의 우선 순위는 후보 A군 > B군 > C군 순으로 높다. 예를들어, A군에서 3개 이상이 추천되지 않을 경우, B군에서 추가적으로 추천을 하며, 그럼에도 3개 이상의 추천되지 않는 경우에는 C군에서 추천한 것을 보완할 수 있다.Candidate groups can be divided into Group A, Group B, and Group C, and the priority of recommendation is high in the following order: Candidate Group A > Group B > Group C. For example, if three or more items are not recommended in group A, additional recommendations are made in group B, and if three or more items are not recommended, the recommendations in group C can be supplemented.

각 후보군을 나누는 기준은 다음과 같다. The criteria for dividing each candidate group are as follows.

A 후보군은 기술 매트릭스에서 매칭 대상의 최댓값이 있는 열과 매칭 후보의 최댓값이 있는 열이 일치하고(and), 주제 매트릭스에서 매칭 대상의 최댓값이 있는 열(세부분야)과 매칭 후보의 최댓값이 있는 열(세부분야)이 일치하는 경우이다. 즉, 도 7a를 참고하면, 기술 매트릭스에서 매칭 대상인 연구실의 최댓값 10은 자동제어기술이다. 자동제어기술에서 최댓값을 갖는 매칭 후보는 연구자1이다. 연구자2는 데스트톱sw에서 최댓값 3을 가지며, 연구자3은 IoT에서 최댓값 3을 갖는다. 그리고, 도 7b를 참고하면, 주제 매트릭스에서 매칭 대상인 연구실의 최댓값 10은 기업 분석 및 개선이다. 기업 분석 및 개선 분야에서 최댓값을 갖는 매칭 후보는 연구자1, 연구자2이다. 연구자3은 영리/개인에서 최댓값 3을 갖는다. 따라서, 기술 매트릭스와 주제 매트릭스 모두에서 최댓값이 있는 열(세부분야)가 일치하는 것은 연구자1이다. 연구자1이 A군에 해당된다.In candidate group A, the column with the maximum value of the matching target in the technology matrix matches the column with the maximum value of the matching candidate (and), and the column with the maximum value of the matching target (detail) in the subject matrix matches the column with the maximum value of the matching candidate (and). This is a case where the details (detailed fields) match. That is, referring to Figure 7a, the maximum value of 10 of the laboratory that is the matching target in the technology matrix is the automatic control technology. The matching candidate with the maximum value in the automatic control technology is researcher 1. Researcher 2 has the maximum value of 3 in Desktop SW, and Researcher 3 has the maximum value of 3 in IoT. And, referring to Figure 7b, the maximum value of 10 for the matching laboratory in the topic matrix is corporate analysis and improvement. The matching candidates with the highest values in the field of corporate analysis and improvement are Researcher 1 and Researcher 2. Researcher 3 has the maximum value of 3 in profit/private. Therefore, the column (subfield) with the maximum value in both the technology matrix and the subject matrix matches researcher 1. Researcher 1 belongs to group A.

B 후보군은 (기술 매트릭스는 고려하지 않고) 주제 매트릭스에서 매칭 대상의 최댓값이 있는 열(세부분야)과 매칭 후보의 최댓값이 있는 열(세부분야)이 일치하는 경우이다. B 후보군은 주제 매트릭스만을 고려하므로, 도 7b만 확인하면 충분하다. 전술한 바와 같이, 주제 매트릭스에서 매칭 대상인 연구실의 최댓값 10은 기업 분석 및 개선이며, 기업 분석 및 개선 분야에서 최댓값을 갖는 매칭 후보는 연구자1, 연구자2이다. 연구자1은 A군에 포함되므로, 연구자2가 B군에 해당된다.Candidate group B is a case where the column (detail) with the maximum value of the matching target and the column (detail) with the maximum value of the matching candidate in the topic matrix (without considering the technology matrix) match. Since candidate B only considers the topic matrix, it is sufficient to check only Figure 7b. As described above, the maximum value of 10 for the matching laboratory in the subject matrix is corporate analysis and improvement, and the matching candidates with the maximum value in the corporate analysis and improvement field are researcher 1 and researcher 2. Since researcher 1 is included in group A, researcher 2 is included in group B.

C 후보군은 A군 및 B군에 속하지 않은 경우이다. 도 7a 및 도 7b의 경우, 연구자3이다.Candidate C is a case that does not belong to Group A or Group B. In the case of Figures 7a and 7b, it is researcher 3.

도 8a 내지 도 8c는 본 발명의 실시예에 따른 추천 대상 후보인 A군 중에서 추천 우선순위를 선정하는 과정을 설명하기 위한 참조도면이다. 도 8a 및 도 8b는 매칭 대상인 연구실과 분류부(15)에서 A군으로 선정된 연구자a, 연구자b, 연구자c 간의 유사도 분석을 통해 A군 중에서 추천 우선순위를 선정하고자, 연구실과 연구자a 내지 연구자c의 매트리스를 병합한 것이다. 연구자a, 연구자b, 연구자c는 이미 연구실과 기술 매트릭스와 주제 매트릭스에서의 최댓값이 있는 열(세부분야)가 일치하는 A군임에 유의한다. 도 8a는 기술 매트릭스이며, 도 8b는 주제 매트릭스이다.Figures 8A to 8C are reference diagrams for explaining the process of selecting a recommendation priority from group A, which is a candidate for recommendation, according to an embodiment of the present invention. Figures 8a and 8b show the laboratory and researcher a or researcher to select recommendation priority among group A through similarity analysis between researcher a, researcher b, and researcher c selected as group A in the matching laboratory and the classification unit 15. It is a merge of the mattresses of c. Note that researcher a, researcher b, and researcher c are group A whose lab, column (detailed field) with the maximum value in the technology matrix and topic matrix match. Figure 8a is a description matrix and Figure 8b is a topic matrix.

이러한 과정은 매칭부(17)에서 정규화 모듈(171) 및 재배열 모듈(173)에서 수행될 수 있다. 먼저, 정규화 모듈(171)은 연구실, 연구자의 최댓값이 상이하므로, 기술 매트릭스 및 주제 매트릭스에서 각자의 최댓값으로 세부분야 전체의 값을 나눈다. 도 8a를 참고하면, 연구실의 경우, 10가지 기술 세부분야를 최댓값 10으로 나눈다. 연구자a 내지 연구자c의 경우 각자 최댓값 3으로 나눈다. 각자 최댓값으로 나누었으므로, 연구실 및 연구자a 내지 연구자c의 최댓값은 모두 1이 되면 정규화되었다. This process may be performed in the normalization module 171 and the reordering module 173 in the matching unit 17. First, since the maximum values of laboratories and researchers are different, the normalization module 171 divides the values of all subfields by their respective maximum values in the technology matrix and subject matrix. Referring to Figure 8a, in the case of a laboratory, 10 technical subfields are divided into a maximum value of 10. In the case of researchers A through C, each is divided by the maximum value of 3. Since each was divided by its maximum value, the maximum values of the laboratory and researcher A through researcher C were normalized when they all became 1.

다음으로, 재배열 모듈(173)은 본 발명의 목적에 부합시키기 위해, 기술 분야 및 주제 분야에서 각 최댓값이 해당하는 열(세부분야)를 제외한다. 그 이유는, 본 발명은 연구 분야에 대한 핵심적인 역량과 관심은 일치한 상태에서, 연구자 또는 연구팀이 서로 다른 분야에 관심과 역량, 지식이 있는 사람들끼리 모일 경우 연계 프로젝트를 더욱 잘 수행할 수 있다고 판단하여, 이러한 매칭을 수행하고자 하기 때문이다. 따라서, 본 발명은 최댓값이 있는 세부분야를 제외한 나머지 분야에서는 다른 분야에 관심 있는 대상을 추천하도록 설계하고 있다. 더불어, 본 발명은 추후 유사도 산출 모듈(175)에서 A군 및 B군에 대해 코사인 유사도가 0에 가까운 순서대로 추천함으로써 이를 더욱 보완하고 있다.Next, in order to meet the purpose of the present invention, the reordering module 173 excludes the columns (details) to which each maximum value corresponds from the technical field and subject field. The reason is that the present invention states that linked projects can be performed better when researchers or research teams gather with people with interests, capabilities, and knowledge in different fields while the core capabilities and interests in the research field are consistent. This is because we want to make a judgment and perform such matching. Therefore, the present invention is designed to recommend subjects of interest to other fields, excluding the detailed field with the maximum value. In addition, the present invention further complements this by later recommending groups A and B in the order in which the cosine similarity is close to 0 in the similarity calculation module 175.

그 후, 도 8c와 같이 도 8a의 기술 매트릭스와 도 8b의 주제 매트릭스를 결합하고, 유사도 산출 모듈(175)에서 매칭 대상인 연구실과의 코사인 유사도를 산출한다. 도 8c를 참고하면, 연구자a는 연구실과의 관계에서 코사이 유사도가 0.64, 연구자b는 0.414, 연구자 c는 0.311로, 코사인 유사도는 연구자a > 연구자b > 연구자c 순이다. 코사인 유사도는 1에 가까울수록 벡터의 유사도가 높은 것임으로 유사한 분야에 관심이 있는 것임을 나타내며, 반대로 0에 가까울수록 벡터의 유사도가 낮은 것임으로 서로 다른 분야에 관심있는 것임을 나타낼 수 있다. 따라서, 전술한 바와 같이, 본 발명은 핵심 데이터는 동일하되, 관심 데이터가 다른 그룹을 매칭하고자 하므로, A군인 도 8c에서는 코사인 유사도가 0에 가장 가까운 연구자c를 먼저 추천할 수 있다.Then, as shown in FIG. 8C, the technology matrix of FIG. 8A and the subject matrix of FIG. 8B are combined, and the similarity calculation module 175 calculates the cosine similarity with the matching laboratory. Referring to Figure 8c, researcher a's cosine similarity with the laboratory is 0.64, researcher b's is 0.414, and researcher c's is 0.311, and the cosine similarity is in the order of researcher a > researcher b > researcher c. The closer the cosine similarity is to 1, the higher the vector similarity, indicating interest in a similar field. Conversely, the closer it is to 0, the lower the vector similarity, indicating interest in different fields. Therefore, as described above, since the present invention seeks to match groups with the same core data but different data of interest, in Figure 8c, which is group A, researcher c whose cosine similarity is closest to 0 can be recommended first.

도 9는 본 발명의 실시예에 따른 추천 대상 후보인 B군 중에서 추천 우선순위를 선정하는 과정을 설명하기 위한 참조도면이다.Figure 9 is a reference diagram for explaining the process of selecting a recommendation priority among group B, which is a candidate for recommendation according to an embodiment of the present invention.

A군은 기술 및 주제 매트릭스의 최대 열이 일치해야 한다는 조건으로 인해, A군에서만 3개 이상의 추천이 어려울 수 있다. 그러한 경우 후보 B군에서 추가적으로 추천할 수 있다. B군은 매칭 대상의 주제 매트릭스 최댓값이 있는 열과 매칭 후보의 최댓값이 있는 열이 동일한 경우이다. B군 내에서의 추천 순위는 도 8a 내지 도 8c에서 전술한 A군과 거의 유사하게 진행된다. 즉, 본 발명의 목적에 따라, 핵심 주제 분야(최댓값이 있는 열)을 제외한 나머지 분야로 재구성한 매트릭스의 코사인 유사도가 0에 가까운 순서대로 추천한다. 그러므로 도 9의 경우에는, B군의 주제 매트릭스에서도 최댓값이 있는 세부분야인 ‘기업 분석 및 개선’ 열을 제외한다. 그리고 매칭 대상인 연구실과 매칭 후보인 연구자a 내지 연구자c와의 코사인 유사도를 산출한다. 도 9를 참고하면, 코사인 유사도는 연구자c > 연구자a > 연구자b 순이다. 따라서, B군인 도 9에서는 코사인 유사도가 0에 가장 가까운 연구자b를 먼저 추천할 수 있다.Due to the requirement that the maximum columns of the technology and topic matrices must match in Group A, it may be difficult to recommend more than 3 recommendations in Group A alone. In such cases, additional recommendations can be made from candidate B. Group B is a case where the column with the maximum value of the subject matrix of the matching target and the column with the maximum value of the matching candidate are the same. The recommendation ranking within Group B proceeds almost similarly to Group A described above in FIGS. 8A to 8C. In other words, for the purpose of the present invention, it is recommended in the order in which the cosine similarity of the reconstructed matrix is closest to 0, except for the core subject field (column with the maximum value). Therefore, in the case of Figure 9, the ‘Corporate Analysis and Improvement’ column, which is the subfield with the maximum value, is excluded from the topic matrix of group B. Then, the cosine similarity between the matching laboratory and the matching candidate researchers a to researcher c is calculated. Referring to Figure 9, the cosine similarity is in the order of researcher c > researcher a > researcher b. Therefore, in Figure 9, group B, researcher b whose cosine similarity is closest to 0 can be recommended first.

도 10은 본 발명의 따른 실시예로서, 따른 매칭 방법을 나타낸 순서도이다. 연구 분야를 기반으로 하여 연구자와 연구실을 연계하는 매칭 방법의, 제1 단계는 세부분야로 기분류된 기술 분야 및 주제 분야에 대한 연구자의 제1 관심 데이터 및 연구 이력 데이터를 수신할 수 있다(S310). 제2 단계는 인공지능 알고리즘을 이용하여 연구 이력 데이터로부터 제1 핵심 데이터를 추출할 수 있다(S320). 제3 단계는 기술 분야 및 주제 분야에 대한 연구실의 제2 관심 데이터 및 구인 데이터를 수신할 수 있다(S330). 제4 단계는 인공지능 알고리즘을 이용하여 구인 데이터부터 제2 핵심 데이터를 추출할 수 있다(S340). 제5 단계는 제1 관심 데이터 및 제1 핵심 데이터를 기반으로 기술 분야 및 주제 분야에 대해 연구자의 제1 매트릭스를 생성할 수 있다(S350). 제6 단계는 제2 관심 데이터 및 제2 핵심 데이터를 기반으로 기술 분야 및 주제 분야에 대해 연구실의 제2 매트릭스를 생성할 수 있다(S360). 제7 단계는 기술 분야 및 주제 분야 각각에 대해, 연구자의 제1 매트릭스를 기준으로 연구실의 제2 매트릭스를 비교하거나, 또는 제2 매트릭스를 기준으로 제1 매트릭스를 비교하여, 기술 분야 또는 주제 분야에서의 일치 여부에 따라 연구실 또는 연구자를 A등급 내지 C등급 중 어느 하나로 분류할 수 있다(S370). 제8 단계는 제1 매트릭스와 제2 매트릭스 간 유사도를 비교하여, 제7 단계(S370)에서 분류된 연구실 중 적어도 어느 하나를 연구자에게 제공하거나, 또는 연구자 중 적어도 어느 하나를 연구실에 제공할 수 있다(S380).Figure 10 is a flowchart showing a matching method according to an embodiment of the present invention. The first step of the matching method that connects researchers and laboratories based on research fields can receive the researcher's first interest data and research history data on technical fields and subject areas categorized as detailed fields (S310 ). In the second step, the first core data can be extracted from the research history data using an artificial intelligence algorithm (S320). The third step may receive the laboratory's secondary interest data and recruitment data for technical fields and subject areas (S330). In the fourth step, the second core data can be extracted from the job offer data using an artificial intelligence algorithm (S340). In the fifth step, a researcher's first matrix may be created for the technical field and subject field based on the first data of interest and the first core data (S350). In the sixth step, a second matrix of the laboratory may be created for the technical field and subject area based on the second data of interest and the second core data (S360). Step 7 is to compare the laboratory's second matrix with respect to the researcher's first matrix, for each technical field and subject area, or by comparing the first matrix with respect to the second matrix. Depending on whether there is a match, a laboratory or researcher can be classified as either Grade A or Grade C (S370). The eighth step compares the similarity between the first matrix and the second matrix, and provides at least one of the laboratories classified in the seventh step (S370) to the researcher, or provides at least one of the researchers to the laboratory. (S380).

제1 내지 제8 단계는 전술한 매칭 장치(1)의 실시예에서 수행되는 과정을 나타낸 것으로 각 단계의 의미와 의의를 전술한 바, 중복 설명은 생략한다.The first to eighth steps represent processes performed in the embodiment of the above-described matching device 1, and since the meaning and significance of each step has been described above, redundant description will be omitted.

한편, 전술한 연구 분야를 기반으로 하여 연구자와 연구실을 연계하는 매칭 방법은, 애플리케이션으로 구현되거나 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.Meanwhile, the matching method that connects researchers and laboratories based on the above-mentioned research fields can be implemented as an application or in the form of program instructions that can be executed through various computer components and recorded on a computer-readable recording medium. there is. A computer-readable recording medium may include program instructions, data files, data structures, etc., singly or in combination.

컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical recording media such as CD-ROMs and DVDs, and magneto-optical media such as floptical disks. media), and hardware devices specifically configured to store and perform program instructions, such as ROM, RAM, flash memory, etc. Examples of program instructions include not only machine language code such as that created by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device may be configured to operate as one or more software modules to perform processing according to the invention and vice versa.

이상에서 대표적인 실시예를 통하여 본 발명을 상세하게 설명하였으나, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 상술한 실시예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다. 그러므로 본 발명의 권리 범위는 설명한 실시예에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 특허청구범위와 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태에 의하여 정해져야 한다. Although the present invention has been described in detail through representative embodiments above, those skilled in the art will understand that various modifications can be made to the above-described embodiments without departing from the scope of the present invention. will be. Therefore, the scope of rights of the present invention should not be limited to the described embodiments, but should be determined not only by the claims described later, but also by all changes or modified forms derived from the claims and the concept of equivalents.

1 : 매칭 장치
10 : 데이터베이스
101 : 제1 데이터베이스
103 : 제2 데이터베이스
105 : 제3 데이터베이스
107 : 제4 데이터베이스
11 : 추출부
111 : 텍스트 전처리 모듈
113 : 핵심 데이터 도출 모듈
115 : 검증 모듈
13 : 매트릭스 생성부
15 : 분류부
17 : 매칭부
171 : 정규화 모듈
173 : 재배열 모듈
175 : 유사도 산출 모듈
177 : C군 판단 모듈
1: Matching device
10: database
101: first database
103: second database
105: Third database
107: 4th database
11: extraction unit
111: Text preprocessing module
113: Core data derivation module
115: verification module
13: Matrix generation unit
15: Classification section
17: Matching unit
171: Normalization module
173: Rearrangement module
175: Similarity calculation module
177: Group C judgment module

Claims (17)

연구 분야를 기반으로 하여 연구자와 연구실을 연계하는 매칭 장치에 있어서,
세부분야로 기분류된 연구 기술 분야(이하 ‘기술 분야’) 및 연구 주제 분야(이하 ‘주제 분야’)에 대한 연구자의 제1 관심 데이터 및 연구 이력 데이터를 저장하는 제1 데이터베이스;
상기 기술 분야 및 상기 주제 분야에 대한 연구실의 제2 관심 데이터 및 구인 데이터를 저장하는 제2 데이터베이스;
인공지능 알고리즘을 이용하여 상기 연구 이력 데이터로부터 제1 핵심 데이터를 추출하고, 상기 구인 데이터부터 제2 핵심 데이터를 추출하는 추출부;
상기 기술 분야 및 상기 주제 분야에 대해, 상기 제1 관심 데이터 및 상기 제1 핵심 데이터를 기반으로 상기 연구자의 제1 매트릭스를 생성하고, 상기 제2 관심 데이터 및 상기 제2 핵심 데이터를 기반으로 상기 연구실의 제2 매트릭스를 생성하는 매트릭스 생성부;
상기 기술 분야 및 상기 주제 분야 각각에 대해, 상기 연구자의 상기 제1 매트릭스를 기준으로 상기 연구실의 상기 제2 매트릭스를 비교하거나, 또는 상기 제2 매트릭스를 기준으로 상기 제1 매트릭스를 비교하여 상기 기술 분야 또는 상기 주제 분야에서의 일치 여부에 따라 상기 연구실 또는 상기 연구자를 등급으로 분류하는 분류부; 및
상기 제1 매트릭스와 상기 제2 매트릭스 간 유사도를 비교하여, 상기 분류부에서 분류된 상기 연구실 중 적어도 어느 하나를 상기 연구자에게 제공하거나, 또는 상기 연구자 중 적어도 어느 하나를 상기 연구실에 제공하는 매칭부;를 포함하는 것을 특징으로 하는 매칭 장치.
In a matching device that connects researchers and laboratories based on research field,
a first database that stores the researcher's primary interest data and research history data on research technology fields (hereinafter referred to as 'technology fields') and research topic fields (hereinafter referred to as 'subject fields') classified into detailed fields;
a second database storing second interest data and recruitment data of a laboratory for the technical field and the subject field;
an extraction unit that extracts first core data from the research history data using an artificial intelligence algorithm and extracts second core data from the job offer data;
For the technical field and the subject area, generate a first matrix of the researchers based on the first interest data and the first core data, and the research laboratory based on the second interest data and the second core data. a matrix generator that generates a second matrix;
For each of the technical field and the subject area, the second matrix of the laboratory is compared to the first matrix of the researcher, or the first matrix is compared to the second matrix to determine the technical field. or a classification unit that classifies the laboratory or the researcher into grades depending on whether there is agreement in the subject field; and
a matching unit that compares similarities between the first matrix and the second matrix and provides at least one of the laboratories classified in the classification unit to the researcher, or provides at least one of the researchers to the laboratory; A matching device comprising:
제 1 항에 있어서,
상기 기술 분야는 세부 분류로 IoT, 인공지능, 영상처리, 보안, 빅데이터, 모바일, 자동제어기술, 데스크톱 SW, 가상현실 및 블록체인 중 적어도 어느 하나를 포함하고,
상기 주제 분야는 세부 분류로 비영리/공공연구, 영리/개인, 업무 자동화·지능화 및 기업 분석·개선 중 적어도 어느 하나를 포함하는 것을 특징으로 하는 매칭 장치.
According to claim 1,
The technical field includes at least one of IoT, artificial intelligence, image processing, security, big data, mobile, automatic control technology, desktop software, virtual reality, and blockchain, as a detailed classification,
The subject field is a detailed classification that includes at least one of non-profit/public research, profit/private, work automation/intelligence, and corporate analysis/improvement. A matching device.
제 1 항에 있어서,
상기 제1 또는 제2 관심 데이터는,
상기 기술 분야 중 적어도 어느 하나 및 상기 주제 분야 중 적어도 어느 하나를 포함하고,
상기 제1 또는 제2 핵심 데이터는,
상기 기술 분야 중 어느 하나 및 상기 주제 분야 중 어느 하나를 포함하는 것을 특징으로 하는 매칭 장치.
According to claim 1,
The first or second data of interest is,
Includes at least one of the above technical fields and at least one of the above subject areas,
The first or second core data is,
A matching device comprising any one of the above technical fields and one of the above subject areas.
제 1 항에 있어서,
상기 추출부는,
상기 연구 이력 데이터 또는 상기 구인 데이터를 전처리하여 전처리 데이터를 생성하는 텍스트 전처리 모듈; 및
추출된 상기 전처리 데이터를 벡터화하여 검출 빈도를 산정하며, 상기 전처리 데이터가 상기 기술 분야의 세부분야 또는 상기 주제 분야의 세부분야에 대해 기설정된 핵심 단어를 포함하는 경우 해당 세부분야에 가중치를 부여하여 상기 핵심 데이터를 도출하는 핵심 데이터 도출 모듈;을 포함하며,
상기 핵심 데이터는 상기 기술 분야의 세부분야 중 어느 하나 또는 상기 주제 분야의 세부분야 중 어느 하나에 대한 정보인 것을 특징으로 하는 매칭 장치.
According to claim 1,
The extraction unit,
a text preprocessing module that generates preprocessed data by preprocessing the research history data or the job offer data; and
The extracted pre-processed data is vectorized to calculate the detection frequency, and if the pre-processed data includes key words preset for a sub-field of the technical field or a sub-field of the subject field, a weight is assigned to the sub-field. Includes a core data derivation module that derives core data,
A matching device, wherein the core data is information about one of the subfields of the technical field or one of the subfields of the subject field.
제 4 항에 있어서,
상기 추출부는,
상기 핵심 데이터 도출 모델에서 도출된 상기 핵심 데이터가 복수 개의 상기 기술 분야 또는 상기 주제 분야를 포함하는 상기 관심 데이터 중 어느 하나에 해당하는지 검증하는 검증 모듈을 더 포함하는 것을 특징으로 하는 매칭 장치.
According to claim 4,
The extraction unit,
A matching device further comprising a verification module that verifies whether the core data derived from the core data derivation model corresponds to one of the plurality of technical fields or the data of interest including the subject field.
제 4 항에 있어서,
상기 핵심 데이터 도출 모듈은,
TF-IDF 기반 모듈로 벡터화하는 것을 특징으로 하는 매칭 장치.
According to claim 4,
The core data derivation module is,
A matching device characterized by vectorization with a TF-IDF based module.
제 1 항에 있어서,
상기 매트릭스는 상기 기술 분야에 대한 기술 매트릭스 및 상기 주제 분야에 대한 주제 매트릭스를 포함하며,
상기 기술 매트릭스 또는 상기 주제 매트릭스는,
상기 관심 데이터가 해당하는 상기 기술 분야의 세부분야 또는 상기 주제 분야의 세부분야에 대해 n이 부여되고, 상기 핵심 데이터가 해당하는 세부분야에 3n 가중치가 부여되어 생성되는 것을 특징으로 하는 매칭 장치.
According to claim 1,
The matrix includes a technology matrix for the technical field and a subject matrix for the subject field,
The technology matrix or the subject matrix is:
A matching device, wherein n is given to a subfield of the technical field or a subfield of the subject field to which the data of interest corresponds, and a 3n weight is assigned to the subfield to which the key data corresponds.
제 7 항에 있어서,
매칭 대상인 상기 연구자에 대하여 매칭 후보인 복수의 상기 연구실 중 적어도 어느 하나를 추천하는 경우,
상기 기술 분야 또는 상기 주제 분야에 대해, 상기 연구자의 상기 제1 매트릭스의 최댓값이 해당하는 각각의 세부분야와 복수의 상기 제2 매트릭스의 최댓값이 해당하는 각각의 세부분야가 일치하는지를 기준으로 판단하며,
매칭 대상인 상기 연구실에 대하여 매칭 후보인 복수의 상기 연구자 중 적어도 어느 하나를 추천하는 경우,
상기 기술 분야 또는 상기 주제 분야에 대해, 상기 연구실의 상기 제2 매트릭스의 최댓값이 해당하는 각각의 세부분야와 복수의 상기 제1 매트릭스의 최댓값이 해당하는 각각의 세부분야가 일치하는지를 기준으로 판단하며,
상기 기술 분야 및 상기 주제 분야의 세부분야가 일치하는 연구실 또는 연구자를 A군,
상기 주제 분야의 세부분야만 일치하는 연구실 또는 연구자를 B군,
상기 A군 및 상기 B군이 아닌 연구실 또는 연구자를 C군으로 분류하는 것을 특징으로 하는 매칭 장치.
According to claim 7,
When recommending at least one of the plurality of laboratories that are matching candidates for the researcher who is the matching target,
With respect to the technical field or the subject field, it is determined based on whether each subfield corresponding to the maximum value of the first matrix of the researcher matches each subfield corresponding to the maximum value of the plurality of second matrices,
When recommending at least one of the plurality of researchers who are matching candidates for the laboratory that is the matching target,
With respect to the technical field or the subject field, it is determined based on whether each subfield corresponding to the maximum value of the second matrix of the laboratory matches each subfield corresponding to the maximum value of the plurality of first matrices,
Group A refers to laboratories or researchers whose technical fields and subfields match the above subject areas;
Group B refers to laboratories or researchers that match only the detailed fields of the above subject areas;
A matching device characterized in that it classifies laboratories or researchers other than Group A and Group B into Group C.
제 8 항에 있어서,
상기 매칭부는,
매칭 대상인 상기 연구자에 대하여 매칭 후보인 복수의 상기 연구실 중 적어도 어느 하나를 추천하는 경우, 상기 A군에 대하여,
상기 제1 매트릭스에 포함되는 상기 제1 기술 매트릭스 및 상기 제1 주제 매트릭스를 각각 정규화하고, 상기 제2 매트릭스에 포함되는 상기 제2 기술 매트릭스 및 상기 제2 주제 매트릭스를 각각 정규화하는 정규화 모듈;
상기 제1 또는 제2 기술 매트릭스, 상기 제1 또는 2 주제 매트릭스 중 값이 1인 셀을 삭제하고, 상기 제1 기술 매트릭스와 상기 제1 주제 매트릭스를 연결하여 상기 제1 매트릭스를 재배열하고, 상기 제2 기술 매트릭스와 상기 제2 주제 매트릭스를 연결하여 상기 제2 매트릭스를 재배열하는 재배열 모듈; 및
재배열된 상기 제1 매트릭스와 재배열된 복수의 상기 제2 매트릭스에 대한 코사인 유사도를 산출하는 유사도 산출 모듈을 포함하는 것을 특징으로 하는 매칭 장치.
According to claim 8,
The matching unit,
When recommending at least one of the plurality of laboratories that are matching candidates for the researcher who is the matching target, for group A,
a normalization module that normalizes the first technology matrix and the first topic matrix included in the first matrix, respectively, and normalizes the second technology matrix and the second topic matrix included in the second matrix, respectively;
Delete a cell with a value of 1 among the first or second technology matrix and the first or second topic matrix, rearrange the first matrix by connecting the first technology matrix and the first topic matrix, and a rearrangement module that rearranges the second matrix by connecting a second technology matrix and the second subject matrix; and
A matching device comprising a similarity calculation module that calculates a cosine similarity for the rearranged first matrix and the plurality of rearranged second matrices.
제 9 항에 있어서,
상기 매칭부는,
매칭 대상인 상기 연구자에 대하여 매칭 후보인 복수의 상기 연구실 중 적어도 어느 하나를 추천하는 경우, 상기 B군에 대하여,
상기 정규화 모듈은 상기 제1 및 제2 주제 매트릭스를 정규화하고,
상기 재배열 모듈은 상기 제1 및 제2 주제 매트릭스 중 값이 1인 셀을 삭제하여 재배열하고,
상기 유사도 산출 모듈은 재배열된 상기 제1 주제 매트릭스와 재배열된 복수의 상기 제2 주제 매트릭스에 대한 코사인 유사도를 산출하는 것을 특징으로 하는 매칭 장치.
According to clause 9,
The matching unit,
When recommending at least one of the plurality of laboratories that are matching candidates for the researcher who is the matching target, for group B,
the normalization module normalizes the first and second topic matrices,
The rearrangement module deletes and rearranges cells with a value of 1 among the first and second subject matrices,
The similarity calculation module is a matching device characterized in that it calculates cosine similarity for the rearranged first subject matrix and the plurality of rearranged second subject matrices.
제 9 항 또는 제 10 항에 있어서,
상기 매칭부는,
상기 A군 또는 상기 B군에 대하여, 상기 유사도 산출 모듈에서 상기 코사인 유사도가 낮은 상기 연구실을 우선 제공하는 것을 특징으로 하는 매칭 장치.
According to claim 9 or 10,
The matching unit,
A matching device, characterized in that for the group A or the group B, the similarity calculation module first provides the laboratory with the low cosine similarity.
제 8 항에 있어서,
상기 매칭부는,
매칭 대상인 상기 연구자에 대하여 매칭 후보인 복수의 상기 연구실 중 적어도 어느 하나를 추천하는 경우, 상기 C군에 대하여,
상기 제1 매트릭스에 속한 상기 제1 기술 매트릭스 및 상기 제1 주제 매트릭스를 연결하여 재배열하고, 상기 제2 기술 매트릭스와 상기 제2 주제 매트릭스를 연결하여 상기 제2 매트릭스를 재배열하고, 재배열된 상기 제1 매트릭스와 재배열된 복수의 상기 제2 매트릭스에 대한 코사인 유사도를 산출하는 C군 판단 모듈을 더 포함하는 것을 특징으로 하는 매칭 장치.
According to claim 8,
The matching unit,
When recommending at least one of the plurality of laboratories that are matching candidates for the researcher who is the matching target, for group C,
The first technology matrix and the first subject matrix belonging to the first matrix are connected and rearranged, the second technology matrix and the second subject matrix are connected and the second matrix is rearranged, and the rearranged A matching device further comprising a C group determination module that calculates cosine similarity for the first matrix and the plurality of rearranged second matrices.
제 12 항에 있어서,
상기 매칭부는,
상기 C군에 대하여, 상기 C군 판단 모듈에서 코사인 유사도가 큰 상기 연구실을 우선 제공하는 것을 특징으로 하는 매칭 장치.
According to claim 12,
The matching unit,
A matching device, characterized in that, for the group C, the group C judgment module first provides the laboratory with a high cosine similarity.
연구 분야를 기반으로 하여 복수의 팀원을 포함한 연구팀과 연구자를 연계하는 매칭 장치에 있어서,
세부분야로 기분류된 연구 기술 분야(이하 ‘기술 분야’) 및 연구 주제 분야(이하 ‘주제 분야’)에 대한 연구자의 제3 관심 데이터 및 연구자 이력 데이터를 저장하는 제3 데이터베이스;
상기 기술 분야 및 상기 주제 분야에 대한 제4 관심 데이터 및 팀원 이력 데이터를 연구팀 팀원별로 저장하는 제4 데이터베이스;
인공지능 알고리즘을 이용하여 상기 연구자 이력 데이터로부터 제3 핵심 데이터를 추출하고, 상기 팀원 이력 데이터부터 팀원별 제4 핵심 데이터를 각각 추출하는 추출부;
상기 기술 분야 및 상기 주제 분야에 대해, 상기 제3 관심 데이터 및 상기 제3 핵심 데이터를 기반으로 상기 연구자의 제3 매트릭스를 생성하고, 상기 제4 관심 데이터 및 상기 제4 핵심 데이터를 기반으로 상기 연구팀의 제4 매트릭스를 생성하는 매트릭스 생성부;
상기 기술 분야 및 상기 주제 분야 각각에 대해, 상기 연구자의 상기 제3 매트릭스를 기준으로 상기 연구팀의 상기 제4 매트릭스를 비교하거나, 또는 상기 제4 매트릭스를 기준으로 상기 제3 매트릭스를 비교하여 상기 기술 분야 또는 상기 주제 분야에서의 일치 여부에 따라 상기 연구팀 또는 상기 연구자를 등급으로 분류하는 분류부; 및
상기 제3 매트릭스와 상기 제4 매트릭스 간 유사도를 비교하여, 상기 분류부에서 분류된 상기 연구팀 중 적어도 어느 하나를 상기 연구자에게 제공하거나, 또는 상기 연구자 중 적어도 어느 하나를 상기 연구팀에 제공하는 매칭부;를 포함하는 것을 특징으로 하는 매칭 장치.
In a matching device that links researchers with a research team including multiple team members based on research field,
A third database that stores the researcher's third-party interest data and researcher history data on research technology fields (hereinafter referred to as "technology fields") and research topic fields (hereinafter referred to as "subject fields") categorized into detailed fields;
a fourth database storing fourth interest data and team member history data for the technical field and the subject field for each research team member;
an extraction unit that extracts third core data from the researcher history data using an artificial intelligence algorithm and extracts fourth core data for each team member from the team member history data;
For the technical field and the subject area, generate a third matrix of the researcher based on the third interest data and the third core data, and the research team based on the fourth interest data and the fourth core data. a matrix generator that generates a fourth matrix;
For each of the technical fields and the subject fields, the fourth matrix of the research team is compared with the third matrix of the researcher, or the third matrix is compared with the fourth matrix to determine the technical field. or a classification unit that classifies the research team or the researchers into grades according to whether there is agreement in the subject field; and
a matching unit that compares similarities between the third matrix and the fourth matrix and provides at least one of the research teams classified in the classification unit to the researcher, or provides at least one of the researchers to the research team; A matching device comprising:
제 14 항에 있어서,
상기 매트릭스는 상기 기술 분야에 대한 기술 매트릭스 및 상기 주제 분야에 대한 주제 매트릭스를 포함하며,
상기 기술 매트릭스 또는 상기 주제 매트릭스는,
상기 연구팀을 구성하는 복수의 팀원 각각에 대해 상기 제4 관심 데이터가 해당하는 상기 기술 분야의 세부분야 또는 상기 주제 분야의 세부분야에 대해 n이 부여되고, 상기 제4 핵심 데이터가 해당하는 세부분야에 3n이 부여된 후, 상기 기술 분야 및 상기 주제 분야의 세부분야에 대한 전체 팀원의 값을 더하여 생성되는 것을 특징으로 하는 매칭 장치.
According to claim 14,
The matrix includes a technology matrix for the technical field and a subject matrix for the subject field,
The technology matrix or the subject matrix is:
For each of the plurality of team members constituting the research team, n is assigned to the subfield of the technical field or the subfield of the subject field to which the fourth data of interest corresponds, and to the subfield to which the fourth core data corresponds. After 3n is assigned, a matching device is created by adding the values of all team members for the technical field and the subfields of the subject field.
연구 분야를 기반으로 하여 연구자와 연구실을 연계하는 매칭 방법에 있어서,
세부분야로 기분류된 연구 기술 분야(이하 ‘기술 분야’) 및 연구 주제 분야(이하 ‘주제 분야’)에 대한 연구자의 제1 관심 데이터 및 연구 이력 데이터를 수신하는 제1 단계;
인공지능 알고리즘을 이용하여 상기 연구 이력 데이터로부터 제1 핵심 데이터를 추출하는 제2 단계;
상기 기술 분야 및 상기 주제 분야에 대한 연구실의 제2 관심 데이터 및 구인 데이터를 수신하는 제3 단계;
인공지능 알고리즘을 이용하여 상기 구인 데이터부터 제2 핵심 데이터를 추출하는 제4 단계;
상기 제1 관심 데이터 및 상기 제1 핵심 데이터를 기반으로 상기 기술 분야 및 상기 주제 분야에 대해 상기 연구자의 제1 매트릭스를 생성하는 제5 단계;
상기 제2 관심 데이터 및 상기 제2 핵심 데이터를 기반으로 상기 기술 분야 및 상기 주제 분야에 대해 상기 연구실의 제2 매트릭스를 생성하는 제6 단계;
상기 기술 분야 및 상기 주제 분야 각각에 대해, 상기 연구자의 상기 제1 매트릭스를 기준으로 상기 연구실의 상기 제2 매트릭스를 비교하거나, 또는 상기 제2 매트릭스를 기준으로 상기 제1 매트릭스를 비교하여, 상기 기술 분야 또는 상기 주제 분야에서의 일치 여부에 따라 상기 연구실 또는 상기 연구자를 A등급 내지 C등급 중 어느 하나로 분류하는 제7 단계; 및
상기 제1 매트릭스와 상기 제2 매트릭스 간 유사도를 비교하여, 상기 제7 단계에서 분류된 상기 연구실 중 적어도 어느 하나를 상기 연구자에게 제공하거나, 또는 상기 연구자 중 적어도 어느 하나를 상기 연구실에 제공하는 제8 단계;를 포함하는 것을 특징으로 하는 매칭 방법.
In the matching method of linking researchers and laboratories based on research field,
A first step of receiving the researcher's first interest data and research history data on the research technology field (hereinafter referred to as 'technical field') and the research subject field (hereinafter referred to as 'subject field') classified into detailed fields;
A second step of extracting first core data from the research history data using an artificial intelligence algorithm;
a third step of receiving secondary interest data and recruitment data from a laboratory for the technical field and the subject area;
A fourth step of extracting second core data from the job offer data using an artificial intelligence algorithm;
A fifth step of generating a first matrix of the researchers for the technical field and the subject field based on the first interest data and the first core data;
A sixth step of generating a second matrix of the laboratory for the technical field and the subject field based on the second interest data and the second core data;
For each of the technical fields and the subject areas, by comparing the second matrix of the laboratory with respect to the first matrix of the researcher, or by comparing the first matrix with respect to the second matrix, the technology A seventh step of classifying the laboratory or the researcher into one of grades A to C depending on whether there is a match in the field or subject area; and
8, which compares the similarity between the first matrix and the second matrix and provides at least one of the laboratories classified in the seventh step to the researcher, or provides at least one of the researchers to the laboratory A matching method comprising: a step;
청구항 제16항의 매칭 방법을 프로세서가 수행하도록 하는 컴퓨터 판독 가능 기록매체에 저장된 컴퓨터 프로그램.A computer program stored in a computer-readable recording medium that causes a processor to perform the matching method of claim 16.
KR1020220031820A 2022-03-15 2022-03-15 Researcher matching device, matching method and computer program for industry-university collaboration project KR20230134711A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220031820A KR20230134711A (en) 2022-03-15 2022-03-15 Researcher matching device, matching method and computer program for industry-university collaboration project

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220031820A KR20230134711A (en) 2022-03-15 2022-03-15 Researcher matching device, matching method and computer program for industry-university collaboration project

Publications (1)

Publication Number Publication Date
KR20230134711A true KR20230134711A (en) 2023-09-22

Family

ID=88190069

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220031820A KR20230134711A (en) 2022-03-15 2022-03-15 Researcher matching device, matching method and computer program for industry-university collaboration project

Country Status (1)

Country Link
KR (1) KR20230134711A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117093935A (en) * 2023-10-16 2023-11-21 深圳海云安网络安全技术有限公司 Classification method and system for service system

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008004563A1 (en) 2006-07-03 2008-01-10 Intellectual Property Bank Corp. Researcher job-offer job-application matching system and joint research/joint venture matching system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008004563A1 (en) 2006-07-03 2008-01-10 Intellectual Property Bank Corp. Researcher job-offer job-application matching system and joint research/joint venture matching system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117093935A (en) * 2023-10-16 2023-11-21 深圳海云安网络安全技术有限公司 Classification method and system for service system

Similar Documents

Publication Publication Date Title
Le et al. Text classification: Naïve bayes classifier with sentiment Lexicon
JP4778474B2 (en) Question answering apparatus, question answering method, question answering program, and recording medium recording the program
Jain et al. “UTTAM” An Efficient Spelling Correction System for Hindi Language Based on Supervised Learning
Touahri et al. Studying the effect of characteristic vector alteration on Arabic sentiment classification
Oliveira et al. The influence of ner on the essay grading
Wosiak Automated extraction of information from Polish resume documents in the IT recruitment process
Touahri et al. Deep analysis of an Arabic sentiment classification system based on lexical resource expansion and custom approaches building
KR20230134711A (en) Researcher matching device, matching method and computer program for industry-university collaboration project
Nama et al. Sentiment analysis of movie reviews: A comparative study between the naive-bayes classifier and a rule-based approach
Khezzar et al. arHateDetector: detection of hate speech from standard and dialectal Arabic Tweets
Zhu et al. Twitter Sentiment analysis of covid vaccines
US20230039937A1 (en) Technologies for relating terms and ontology concepts
AKSOY et al. Comparison of the data matching performances of string similarity algorithms in big data
KR20220068937A (en) Standard Industrial Classification Based on Machine Learning Approach
Chen et al. Assessing readability of Thai text using support vector machines
James et al. Resume Shortlisting and Ranking with Transformers
Nejjari et al. Overview of opinion detection approaches in Arabic
Mursalin et al. A Deep Learning Approach for Recognizing Textual Emotion from Bengali-English Code-Mixed Data
Yucel Predictive Text Analytics and Text Classification Algorithms
Zahir Geographic disaggregation of textual social media data: A machine learning-based approach
Sati et al. Arabic text question answering from an answer retrieval point of view: A survey
Michal et al. Subjective? emotional? emotive?: Language combinatorics based automatic detection of emotionally loaded sentences
Obagbuwa et al. Supervised machine learning models for depression sentiment analysis
Ramadan et al. Identifying Equivalent Words from Different Arabic Dialects Using Deep Learning Techniques
Bhosale et al. Civil Complaints Management System by using Machine Learning Techniques