KR20230136423A

KR20230136423A - 기업에게 최적화된 정책을 추천하는 방법 및 장치

Info

Publication number: KR20230136423A
Application number: KR1020220034150A
Authority: KR
Inventors: 김유리안나
Original assignee: 주식회사 웰로
Priority date: 2022-03-18
Filing date: 2022-03-18
Publication date: 2023-09-26

Abstract

본 발명은 서버에 의해 수행되는 기업에게 최적화된 정책을 추천하는 방법에 관한 것으로서, (a) 정책기관 서버로부터 정책 데이터를 수집하고, 사용자 단말의 접속기록으로부터 유저 데이터 및 행동 데이터를 수집하는 단계; (b) 상기 정책 데이터와 유저 데이터를 비교 분석하여 상기 사용자 단말로 추천할 복수의 정책들을 포함하는 추천 후보군을 생성하는 단계; (c)상기 행동 데이터를 기반으로 상기 추천 후보군에 포함된 정책들의 순위를 설정하는 단계; 및 (d) 설정된 순위가 높은 순서에서 낮은 순서대로 상기 추천 후보군에 포함된 정책들을 상기 사용자 단말로 추천하는 단계를 포함하고, 상기 유저 데이터는, 상기 사용자단말로부터 입력 받은 기업의 매출액, 소재지, 종사업종, 종업원수, 설립년도 및 업태에 대한 정보 중 적어도 하나를 포함하는 것인, 기업에게 최적화된 정책을 추천하는 방법에 관한 것이다.

Description

기업에게 최적화된 정책을 추천하는 방법 및 장치{METHOD AND APPARATUS FOR RECOMMENDING POLICY OPTIMIZED FOR ENTERPRISE}

본 발명은 기업에게 최적화된 정책을 추천하는 방법 및 장치에 관한 것으로서, 보다 상세하게는, 태깅을 통하여 복수의 카테고리 별로 분류된 정책 데이터에 기반하여 사용자 단말로 기업을 대상으로 하는 정책을 추천하는 시스템 및 그 방법에 관한 것이다.

종래에는 일반적으로, 불특정 다수의 사용자를 대상으로 정책의 지원 독려를 위한 광고 및 홍보가 수행되어 왔다. 기업의 경우, 개인을 대상으로하는 정책은 지원이 되지 않음에도 불필요한 광고 및 홍보가 제공되어 해당 정책의 수행 효율이 감소하는 문제가 있으며, 정작 정책의 지원 대상이 되는 정책 내용은 제공되지 않는 문제가 있었다.

이와 관련하여, 정책을 집행해야 하는 정부기관 및 공공단체 등은 사전 수요조사, 대상자 발굴, 신청자 관리에 어려움을 토로하고 있으며, 정책을 신청해야 하는 기업 또는 기업측 정책 담당자는 현행 중이며 해당 기업이 대상인 정책에 대한 정보를 습득하기 어려운 실정이다. 따라서, 정책 지원 대상인 기업 사용자에게 현행 정책에 대한 정보를 제공할 수 있는 기술의 필요성이 대두된다.

본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 기업에게 최적화된 정책을 추천하는 방법 및 시스템을 제공하는 것을 일 기술적 과제로 한다.

또한, 본 발명은 사용자단말로부터 입력 받은 유저 데이터 외에도 사용자단말이 접속한 복수의 서버에 대한 행동 데이터를 분석하고, 분석한 데이터를 기반으로 해당 사용자가 누릴 수 있는 혜택 및 정책을 추천하여, 기업이 개인을 대상으로 하는 정책에 대한 정보를 제공받지 않도록 함으로써, 종래의 방식보다 높은 정책 수행율을 도모하는 것을 다른 기술적 과제로 한다.

본 발명이 해결하려는 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시 예에 따르는, 장치에 의해 수행되는 기업에게 최적화된 정책을 추천하는 방법은, (a) 정책기관 서버로부터 정책 데이터를 수집하고, 사용자 단말의 접속기록으로부터 유저 데이터 및 행동 데이터를 수집하는 단계; (b) 상기 정책 데이터와 유저 데이터를 비교 분석하여 상기 사용자 단말로 추천할 복수의 정책들을 포함하는 추천 후보군을 생성하는 단계; (c)상기 행동 데이터를 기반으로 상기 추천 후보군에 포함된 정책들의 순위를 설정하는 단계; 및 (d) 설정된 순위가 높은 순서에서 낮은 순서대로 상기 추천 후보군에 포함된 정책들을 상기 사용자 단말로 추천하는 단계를 포함하고, 상기 유저 데이터는, 상기 사용자단말로부터 입력 받은 기업의 매출액, 소재지, 종사업종, 종업원수, 설립년도 및 업태에 대한 정보 중 적어도 하나를 포함하는 것일 수 있다.

또한, 상기 정책 데이터는, 정책 기관에서 시행하는 정책에 관한 정책 공고문에서 기 설정된 정책 데이터 자연어 처리 학습 모델을 통해 추출된 키워드, 그리고, 식별자가 생성된 키워드를 기 설정된 카테고리 항목 별로 분류하도록 키워드와 카테고리 항목을 태깅한 태깅 정보를 포함하는 것일 수 있다.

또한, 상기 행동 데이터는, 상기 사용자 단말이 상기 서버 및 상기 정책기관 서버에 접속한 로그 데이터를 기반으로 파악되는 접속 시간 및 접속 세션 수를 포함하는 것일 수 있다.

또한, 상기 (b)단계는, 상기 정책 데이터에 포함된 상기 키워드 및 태깅 정보와 상기 유저 데이터에 포함된 정보들의 관련성이 기 설정된 수치값 이상 일치하는 정책들을 포함하도록 상기 추천 후보군을 생성하는 단계를 포함하는 것일 수 있다.

또한, 상기 (c)단계는, 상기 추천 후보군에 포함된 정책들 중에서 상기 행동 데이터의 접속 시간이 기 설정된 시간 이상이고 상기 접속 세션 수가 기 설정된 수치 이상인 정책들 각각의 접속 시간을 합한 값과 접속 세션 수를 합한 값을 기준으로, 상기 추천 후보군에 포함된 정책들 간의 순위를 재정렬하는 단계를 포함하는 것일 수 있다.

또한, 상기 (c)단계는, 상기 사용자 단말이 상기 서버에 처음 접속한 경우, 기 저장된 복수의 행동 데이터 중에서 상기 사용자 단말이 상기 서버에 처음 접속할 때 발생하는 행동 데이터와 관련성이 기 설정된 수치 이상인 유사 행동 데이터를 기초로 상기 추천 후보군에 포함된 정책들의 순위를 재정렬하는 단계를 포함하는 것일 수 있다.

또한, 상기 (d)단계는, 상기 추천 후보군에 포함된 정책들의 순위에 따라, 상기 사용자 단말의 인터페이스 상에서 순서대로 순위가 높은 정책에서 순위가 낮은 정책이 제공되되, 신규 정책이 상기 서버에 등록되는 경우 상기 신규 정책이 상기 인터페이스 상에서 최우선 순위로 제공되는 것일 수 있다.

본 발명의 일 실시 예에 따르는, 기업에게 최적화된 정책을 추천하는 장치는, 태깅된 정책 데이터를 이용하여 기업에게 정책을 추천하는 것을 수행하기 위한 프로그램이 저장된 메모리; 및 상기 프로그램을 실행하기 위한 프로세서를 포함하며, 상기 프로세서는, 정책기관 서버로부터 정책 데이터를 수집하고, 사용자 단말의 접속 기록으로부터 유저 데이터 및 행동 데이터를 수신하고, 상기 정책 데이터와 유저 데이터를 비교 분석하여 상기 사용자 단말로 추천할 복수의 정책들을 포함하는 추천 후보군을 생성하고, 상기 행동 데이터를 기반으로 상기 추천 후보군에 포함된 정책들의 순위를 설정하고, 설정된 순위가 높은 순서에서 낮은 순서대로 상기 추천 후보군에 포함된 정책들을 상기 사용자 단말로 추천하는 것을 수행하도록 구성되고, 상기 유저 데이터는, 상기 사용자단말로부터 입력 받은 기업의 매출액, 소재지, 종사업종, 종업원수, 설립년도 및 업태에 대한 정보 중 적어도 하나를 포함하는 것일 수 있다.

본 발명에 따르면, 개인 사용자의 유저 데이터에 기반한 정책 지원 정보를 탐색하여 사용자에게 맞춤형으로 제공할 수 있고, 이에 따라, 정책 대상이 되는 사용자가 용이하게 본인이 해당하는 정책을 누릴 수 있도록 할 수 있다.

또한, 본 발명에 따르면, 유저 데이터에 기반하여 산출된 복수의 정책들에 대하여 각 정책 별로 가중치와 적합도 등을 고려하여 가장 적합한 정책부터 순서대로 추천할 수 있다.

나아가, 기업의 경우, 개인을 대상으로하는 정책정보는 안내받지 않기 때문에, 기업 담당자가 정책 공고문에 대한 숙지가 미흡하더라도, 개인을 대상으로하는 정책에 지원하는 경우를 방지할 수 있다.

도1은 본 발명의 일 실시 예에 따르는, 태깅된 정책 데이터를 이용하여 기업에게 정책을 추천하는 시스템에 대한 구조도 이다.
도2는 본 발명의 일 실시 예에 따르는, 서버의 내부구성을 나타내는 블록도 이다.
도3a는 본 발명의 일 실시 예에 따르는, 정책 데이터 중 참조칼럼에 대한 예시도 이다.
도3b는 본 발명의 일 실시 예에 따르는, 정책 데이터 중 대상칼럼에 대한 예시도 이다.
도4는 본 발명의 일 실시 예에 따르는, 카테고리 항목에 대한 예시도 이다.
도5는 본 발명의 일 실시 예에 따르는, 식별자가 생성된 정책 공고문에 대한 예시도 이다.
도6은 본 발명의 일 실시 예에 따르는, 키워드가 기입된 카테고리 항목의 예시도 이다.
도7은 본 발명의 일 실시 예에 따르는, 유저데이터를 입력받는 입력UI에 대한 예시도 이다.
도8은 본 발명의 일 실시 예에 따르는, 사용자 단말 상에 표시되는 추천후보군에 대한 예시도 이다.
도9a는 본 발명의 일 실시 예에 따르는, 정책 데이터를 대상으로 자연어 처리를 수행하는 방법의 수행 순서도 이다.
도9b는 본 발명의 일 실시 예에 따르는, 자연어 처리가 완료된 데이터를 기초로 개인 또는 기업에게 정책을 추천하기 위한 태깅 과정을 자동화하는 방법의 수행 순서도 이다.
도9c는 본 발명의 일 실시 예에 따르는, 태깅된 정책 데이터를 이용하여 개인 또는 기업에게 정책을 추천하는 방법의 수행 순서도 이다.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.

본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다. 한편, '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, '~부'는 어드레싱 할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.

이하에서 언급되는 "단말"은 네트워크를 통해 서버나 타 단말에 접속할 수 있는 컴퓨터나 휴대용 단말기로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop), VR HMD(예를 들어, HTC VIVE, Oculus Rift, GearVR, DayDream, PSVR 등)등을 포함할 수 있다. 여기서, VR HMD 는 PC용 (예를 들어, HTC VIVE, Oculus Rift, FOVE, Deepon 등)과 모바일용(예를 들어, GearVR, DayDream, 폭풍마경, 구글 카드보드 등) 그리고 콘솔용(PSVR)과 독립적으로 구현되는 Stand Alone 모델(예를 들어, Deepon, PICO 등) 등을 모두 포함한다. 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 스마트폰(smart phone), 태블릿 PC, 웨어러블 디바이스뿐만 아니라, 블루투스(BLE, Bluetooth Low Energy), NFC, RFID, 초음파(Ultrasonic), 적외선, 와이파이(WiFi), 라이파이(LiFi) 등의 통신 모듈을 탑재한 각종 디바이스를 포함할 수 있다. 또한, "네트워크"는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷 (WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함한다. 무선 데이터 통신망의 일례에는 3G, 4G, 5G, 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 블루투스 통신, 적외선 통신, 초음파 통신, 가시광 통신(VLC: Visible Light Communication), 라이파이(LiFi) 등이 포함되나 이에 한정되지는 않는다.

본 발명은 정책 데이터를 대상으로 자연어 처리를 수행하고, 자연어 처리가 완료된 데이터를 기초로 개인 또는 기업에게 정책을 추천하기 위한 태깅을 수행한 후, 태깅이 완료된 정책 데이터를 이용하여 개인 또는 기업에게 정책을 추천하는 방법 및 그 장치에 관한 것으로서, 정책 공고문으로부터 소정의 정보를 수집하고, 수집한 정보를 기 설정된 알고리즘에 따라 분석 및 분류함으로써, 사용자에게 적용될 수 있거나 사용자가 해당하는 특정 정책에 대한 접근성을 높이기 위한 기술이다.

이하에서, 도 1 내지 도 9c를 참조하여, 본 발명의 일 실시예에 따르는 정책 데이터 자연어 처리 방법, 자연어 처리된 정책 데이터의 태깅 및 분류 방법과 분류된 정책 데이터를 기반으로 개인 또는 기업에게 정책을 추천하는 방법 및 그 장치에 대하여 차례대로 설명하도록 한다.

도1을 참조하면, 본 발명의 일 실시예에 따르는 시스템은, 서버(100), 정책기관 서버(200) 및 사용자 단말(300)로 구성될 수 있다.

도2를 참조하면, 본 발명의 일 실시예에 따르는 서버(100)는 정책 데이터를 대상으로 자연어 처리를 수행하는 방법, 자연어 처리가 완료된 데이터를 기초로 개인 또는 기업에게 정책을 추천하기 위한 태깅 과정을 자동화하는 방법 및 태깅이 완료된 정책 데이터를 이용하여 개인 또는 기업에게 정책을 추천하는 방법 중 적어도 하나 이상의 방법을 수행하는 프로그램(또는 애플리케이션)이 저장된 메모리와 위 프로그램을 실행하는 프로세서를 포함하는 장치일 수 있다. 여기서 프로세서는 메모리에 저장된 프로그램의 실행에 따라 다양한 기능을 수행할 수 있다.

다음으로, 정책기관 서버(200)는, 정부기관, 공공기관 및 민간 단체 등 정책을 시행하는 곳에서 운용되며, 현재 시행 중인 복수의 정책 및 정책 공고문에 대한 정보를 저장하고 있는 장치일 수 있다. 정책기관 서버(200)는 서버(100)와 통신망을 통하여 유선 또는 무선으로 연결될 수 있다.

본 발명의 일 실시예에 따르는 사용자 단말(300)은 서버(100)와 유선 또는 무선으로 연결되어 통신할 수 있는 것으로서, 스마트폰, 태블릿PC, PDA 및 데스크 탑 등의 형태로 구현될 수 있다.

먼저, 이하에서 본 발명의 일 실시예에 따르는 정책 데이터를 대상으로 자연어 처리를 수행하는 방법의 수행과정에 대하여 설명하도록 한다.

서버(100)는 정책기관 서버(200)에 접속하여 정책기관 서버(200)로부터 발행되는 정책 공고문을 수신하거나, 정책 기관 서버(200)가 운영하는 웹사이트 상에서 크롤링을 수행하여 정책 공고문을 수집할 수 있다.

서버(100)는 수집한 정책 공고문에 대하여 형태소 분석기를 이용하여 복수의 명사들을 추출한다.

도3a을 참조하면, 본 발명의 일 실시예에 따르는 서버(100)는 정책 공고문의 내용을 나타내는 텍스트를 참조 컬럼과 대상 컬럼으로 나누어 구분할 수 있다.

참조 컬럼은, 정책 공고문에 포함된 내용 중 정책명(서비스 명) 및 정책 목적(서비스 목적)을 포함하는 것일 수 있다.

또한, 도3b를 참조하면, 대상 컬럼은, 정책 공고문에 포함된 내용 중 지원대상, 지원내용 및 지원비용(예를 들어, 시설비, 운영비 및 인건비 등)을 포함하는 것일 수 있다.

서버(100)는 정책 공고문의 내용을 참조 컬럼 또는 대상 컬럼을 식별하고, 각각의 컬럼 내에서 명사들을 추출하며 명사들 각각이 등장하는 횟수를 산출할 수 있다.

이때, 본 발명의 일 실시예에서 명사를 추출하는데 활용될 수 있는 형태소 분석기는 KOMORAN, KoNLPy 및 Khaiii 형태소 분석기를 포함하며, 정책 공고문에 포함된 전체 텍스트를 인식하여 복수의 문장 성분을 추출하는 것일 수 있다.

예를 들어, 농번기 아이돌봄방 운영지원 사업에 관한 정책 공고문에 대하여 KOMORAN 형태소 분석기를 명사(문장성분)을 추출하는 경우, 해당 정책 공고문의 전체 텍스트 중, 참조 컬럼에 해당하는 서비스명에서 농번기, 아이, 돌봄, 운영 및 지원 등의 명사를 추출하고, 마찬가지로 대상 컬럼에서 서비스 목적, 지원내용 및 지원대상 등의 명사를 추출할 수 있다.

이후, 서버(100)는 임베딩(embedding)기법을 이용하여 상술한 바와 같은 과정에 따라 추출된 복수의 명사들 각각에 대한 수치화된 벡터(vector)를 생성할 수 있다.

이때, 기 설정된 알고리즘에 따라, 추출된 복수의 명사들 중에서, 동일한 의미를 나타내는 것으로 판단되는 복수의 명사들에 대하여는 동일한 벡터 값이 설정되고, 이와 유사한 의미를 나타내는 것으로 판단되는 다른 명사들에 대하여 해당 명사들에 설정된 벡터 값과 기 설정된 차이 이내로 인접한 벡터 값이 설정될 수 있다.

즉, 유사 의미를 지니는 것으로 판단되는 복수의 명사들 간에는 벡터 값의 차이가 작게 설정되고, 상이한 의미의 복수의 명사들 간에는 벡터 값의 크기가 크게 설정되어 각 명사들 간의 활용과 구분이 용이하도록 설정될 수 있다.

본 발명에서 활용되는 임베딩 기법 및 상술한 기 설정된 알고리즘은 사람이 쓰는 자연어를 기계가 이해할 수 있는 숫자형태인 벡터로 바꾼 결과 혹은 그 일련의 과정 전체를 의미하는 것으로서, 종래 기술에 해당하기 때문에 본 명세서에서는 자세히 설명하지 않는다.

상술한 바와 같이 설정된 벡터 값을 기반으로, 서버(100)는 설정된 벡터 값과 추출한 명사를 매칭하여 복수의 명사-벡터 쌍들을 생성할 수 있다.

이때, 정책 공고문 중 대상 컬럼에서 추출한 명사에 대하여 각 명사의 바로 앞에 위치하는 문장 성분과 각 명사의 바로 뒤에 위치하는 문장 성분을 포함하여 명사-벡터 쌍을 생성함으로써, 단순히 하나의 문장 성분과 벡터 쌍을 생성하는 것보다 문장의 문맥을 파악하기에 용이하도록 생성될 수 있다.

다음으로, 서버(100)는 명사-벡터 쌍들을 기초로 명사-벡터 사전을 생성한다. 본 발명의 일 실시예에 따르는 명사-벡터 사전은 복수의 정책 공고문에 대하여 정책 공고문의 내용에서 추출된 명사에 벡터 값을 나타내는 식별자를 생성하고 저장한 것으로, 명사-벡터 사전에 포함된 명사-벡터 쌍을 키워드로 정의한다.

키워드는 후술할 자연어 처리가 완료된 데이터를 기초로 복수의 카테고리 항목 별로 기 설정된 알고리즘에 따라 분류될 수 있다.

다음으로, 서버(100)는 명사-벡터 사전에 포함된 각 명사- 벡터 쌍들 간의 거리 값과 정책 공고문 내에서 어느 하나의 명사가 포함된 횟수를 기초로, 각 명사-벡터 쌍마다 가중치를 설정할 수 있다.

가중치는 추출된 명사들의 빈도를 기초로 추출 빈도가 높은 명사의 가중치가 추출 빈도가 낮은 명사의 가중치보다 크도록 설정되는 것으로, 정책 공고문 내에 해당 명사가 포함된 횟수가 많을수록 최대 가중치가 부여되어 순차적으로 횟수가 적은 명사까지 기 설정된 가중치 간격에 따라 설정될 수 있다.

즉, 가중치가 높게 부여된 명사는 정책 공고문에서 많이 언급된 명사로, 정책 공고문의 내용 중 핵심 내용에 해당하는 것으로 판단될 수 있으며, 후술할 정책 공고문 중 키워드를 추출하는 자연어 처리 학습 모델을 생성하는 데에 사용될 수 있다.

또한, 가중치는 패널티 가중치를 포함하여, 패널티 가중치를 기초로, 자연어 처리가 완료된 데이터를 기초로 개인에게 정책을 추천하기 위한 태깅을 수행하는 과정에서 정책 공고문으로부터 추출된 키워드와 해당 키워드에 대응되는 카테고리 항목 간의 관련성을 평가하는 데 활용될 수 있다.

다음으로, 서버(100)는 가중치 및 명사-벡터 사전을 기반으로 기계학습을 수행하여 정책 데이터 자연어 처리 학습 모델을 생성할 수 있다.

본 발명의 또 다른 실시예에 따르는 정책 데이터 자연어 처리 학습 모델은 KoBERT classifier, LSTM classifier 및 SVC 방식의 모델 중 어느 하나를 포함하는 것일 수 있으며, 적어도 하나 이상의 모델이 혼합된 것일 수 있다.

이 실시예에서, 정책 데이터 자연어 처리 학습 모델에 포함된 각각의 분류기(Classifier)는 복수 개의 옵션 값들 중에 어느 하나의 값을 추출해내는 것으로, 이진분류기(Binary Classifier)와 다중분류기(Muti Classifier)를 포함할 수 있다. 따라서, 정책 데이터 자연어 처리 학습 모델은 추출하고자 하는 데이터에 따라 이진분류기와 다중분류기를 취사 선택하여 사용하는 것일 수 있다.

또한, 정책 데이터 자연어 처리 학습 모델은 기 설정된 알고리즘에 따라 추출된 복수의 명사들 중 벡터 값이 일치하거나 기 설정된 차이 이내인 명사, 즉, 유사한 의미인 것으로 판단되는 명사들을 하나의 키워드로 분류하고, 명사-벡터 쌍들 및 분류된 키워드를 정책 데이터 자연어 처리 학습 모델의 학습 값 중 입력 값으로 설정하고, 키워드를 출력 값으로 설정하여 학습을 수행하여 생성될 수 있다.

상술한 바와 같이 생성된 정책 데이터 자연어 처리 학습 모델은, 학습 결과를 기초로 정책 공고문으로부터 새로운 명사가 입력되었을 때, 자동으로 키워드를 분류하여 출력할 수 있도록 구성될 수 있다.

다시 말해, 정책 데이터 자연어 처리 학습 모델이 생성된 이후, 서버(100)에 새로운 정책 공고문이 입력되는 경우, 정책 데이터 자연어 처리 학습 모델을 이용하여 새로운 정책 공고문으로부터 명사-벡터 쌍을 추출하고, 명사-벡터 사전(키워드)을 자동으로 갱신하고, 카테고리 항목과 태깅한 결과(분류 결과)를 출력할 수 있다.

도9a를 참조하면, 본 발명의 일 실시예에 따르는 정책 데이터를 대상으로 자연어 처리를 수행하는 방법은 다음과 같은 순서에 따라 수행될 수 있다.

먼저, 서버(100)가 정책기관 서버(200)로부터 정책 공고문을 수신하고, 형태소 분석기를 이용하여 정책 공고문으로부터 복수의 명사를 추출한다(S101).

추출한 명사에 대하여 임베딩기법을 통해 각 명사에 대한 수치화된 벡터를 생성하고, 복수의 명사-벡터 쌍을 생성한다(S102).

다음으로, 서버(100)는 복수의 명사-벡터 쌍을 포함하는 명사-벡터 사전을 생성한다(S103).

이후, 명사-벡터 사전에 포함된 각 명사- 벡터 쌍들 간의 거리값, 정책공고문 내에서 노출된 횟수를 기초로, 각 명사-벡터 쌍마다 가중치를 설정한다(S104).

상술한 과정을 통해 자연어 처리가 완료된 데이터를 기초로 개인에게 정책을 추천하기 위한 태깅 과정과, 태깅 과정을 자동화하는 방법은 다음과 같다.

먼저, 기 설정된 정책 데이터 자연어 처리 학습 모델을 통해 정책 공고문에서 추출된 키워드를 개체명 인식 모듈을 통하여, 기 설정된 카테고리 항목에 대응하는 키워드를 가중치를 고려하여 선별하고, 선별된 키워드에 대응되는 카테고리 항목을 나타내는 식별자를 생성한다.

이때, 정책추천의 대상이 개인인 경우, 추출된 키워드 중, 개인의 거주지, 종사업종, 소득, 연령, 성별 및 자녀 수 중 적어도 하나 이상과 관련된 키워드에 식별자가 생성된다.

반면, 정책추천의 대상이 기업인 경우에는, 기업의 매출액, 소재지, 종사업종, 종업원수, 설립년도 및 업태 중 적어도 하나 이상과 관련된 키워드에 식별자가 생성된다.

이를 통해, 본 발명은 정책 공고문의 문장 성분을 추출하는 과정에서는 해당 정책의 대상이 개인이건 기업이건 상관하지 않고 추출하나, 추출한 정책 데이터를 각각의 카테고리 항목 별로 태깅하는 과정에서는 개인과 기업을 대상으로 하는 정책을 구분하여 태깅 과정을 수행할 수 있다.

본 발명에서 의미하는 태깅은, 추출된 키워드 별로 식별자가 생성되어, 각각의 식별자에 따라 카테고리 항목 별로 분류되는 것을 의미한다.

만일, 기 설정된 카테고리 항목에 대응하는 키워드가 선별되지 않는 경우, 상기 개체명 인식 모듈을 이용하여 상기 정책 공고문의 문맥을 다시 파악하고, 상기 카테고리 항목에 대응하는 다른 키워드를 선별하는 과정이 수행될 수 있다.

예를 들어, 서비스명[생활발명 발굴지원], 서비스목적[고학력 경력 단절 여성의 아이디어 창출과 경제활동 참여를 높여 우리 경제의 새로운 혁신과 재도약의 기반 마련]이라는 정책이 있다고 가정하면, 이 정책은 서비스명만으로는 여성 대상자만을 위한 정책인지 여부를 알 수 없지만, 서비스 목적에 설정된 가중치와 정책 데이터 자연어 처리 학습 모델의 문맥파악을 통해, “성별” 카테고리 항목 이외에 새로운 카테고리 항목인 "성별-제외" 카테고리에 해당 키워드가 선별될 수 있다.

따라서, 본 발명은 하나의 명사에 생성된 식별자를 기반으로 카테고리 항목을 분류하는 것이 아닌, 추출한 명사의 바로 앞과 뒤로 위치한 문장성분을 함께 키워드로 선별함으로써, ‘여성은 제외’라는 문맥의 정책이 있을 때, 이를 읽어내지 못하고 해당 키워드의 카테고리 항목을 ‘여성’으로 분류하게 되는 것을 방지할 수 있다.

정책 공고문의 문맥 파악은, 상술한 바와 같이 해당 키워드에 대응하는 명사-벡터 쌍의 바로 앞에 위치한 문장성분과 바로 뒤에 위치한 문장 성분을 추가하여 카테고리 항목과 태깅하는 과정을 재수행 하는 것일 수 있으며, 기 설정된 카테고리 항목에 대응하는 키워드가 선별될 때까지 반복하여 수행되는 것일 수 있다.

도4에 도시된 바와 같이, 카테고리 항목은, 성별, 학력, 직장, 가구원, 기혼여부, 자녀 수 및 자녀 유무, 소관기관 유형, 지원유형, 신청절차, 수집유형 및 대상특성 등 복수의 항목으로 구성될 수 있으며, 정책 추천의 대상이 개인인 경우, 개인의 거주지, 종사업종, 소득, 연령, 성별 및 자녀 수를 포함하고, 정책 추천의 대상이 기업인 경우에는, 기업의 매출액, 소재지, 종사업종, 종업원수, 설립년도 및 업태를 추가로 포함하여 구성될 수 있다.

또한, 각각의 카테고리 항목 별로 해당 카테고리 항목으로 기입하여 분류할 식별자가 미리 설정될 수 있다.

예를 들어, 지역을 나타내는 식별자가 LOC, 근로자 수를 나타내는 식별자가 NOH, 기한을 나타내는 식별자가 DUR로 미리 설정되었다고 가정하였을 때, 도5에 도시된 바와 같이, 정책 공고문으로부터 추출한 명사의 뒤에 식별자가 생성되어 병기되는 태깅 과정이 수행될 수 있으며, 이 식별자들은 후술할 분류 결과표 생성에 활용될 수 있다.

다음으로, 서버(100)는 상기 식별자를 기준으로, 선별된 키워드를 해당 키워드에 대응하는 카테고리 항목에 기입하여 분류 결과표를 생성한다.

이때, 정책 추천 대상이 개인인 경우에는 거주지, 종사업종, 소득, 연령, 성별 및 자녀 수와 관련된 키워드를, 정책 추천 대상이 기업인 경우에는 기업의 매출액, 소재지, 종사업종, 종업원수, 설립년도 및 업태와 관련된 키워드를 기 설정된 알고리즘에 따라 정책 공고문에 대응하는 정책의 소관기관 카테고리, 정책 명칭 카테고리 및 지원대상 카레고리 중 어느 하나의 카테고리 항목으로 분류하여 분류 결과표를 생성한다.

도6을 참조하면, 분류 결과표는 도시된 바와 같이 생성된 식별자 중 동일한 식별자에 해당하는 키워드가 복수개가 존재하는 경우, 하나의 카테고리 항목에 복수개의 키워드를 매칭할 수 있다.

예를 들어, 카테고리 항목이 소관 기관=경상북도 성주군인 경우, 정책 공고문으로부터 경상북도 또는 성주군과 유사한 것으로 판단되는 복수의 식별자를 포함하는 키워드가 해당 카테고리 항목으로 기입되어 분류될 수 있다.

본 발명의 추가 실시예에 따르면, 앞서 설명한 기계학습의 결과물인 정책 데이터 자연어 처리 학습 모델에 의해 식별자를 기준으로 기 설정된 알고리즘에 따라 각각의 카테고리 항목과 그에 대응하는 키워드를 매칭하고, 매칭된 키워드를 해당 카테고리 항목에 기입한 분류 결과표가 생성될 수 있으며, 적어도 둘 이상의 카테고리 항목을 결합한 하나의 항목에 대한 키워드를 매칭하고, 매칭된 키워드를 해당 항목에 병합하여 기입한 분류 결과표가 생성될 수도 있다.

도9b를 참조하면, 본 발명의 일 실시예에 따르는 자연어 처리가 완료된 데이터를 기초로, 개인 또는 기업에게 정책을 추천하기 위한 태깅 과정을 자동화하는 방법의 수행 순서는 다음과 같다.

먼저, 서버(100)는 기 설정된 자연어 처리 기계학습모델을 통해 정책공고문에서 추출된 키워드 입력을 수신한다(S201).

다음으로, 개체명 인식 모듈을 이용하여, 복수의 카테고리 항목에 대응하는 각각의 키워드를 가중치를 기초로 선별하고, 선별된 키워드에 카테고리 항목을 나타내는 식별자를 생성한다(S202).

이후, 생성된 식별자를 기준으로, 식별자가 생성된 복수의 키워드를 각각 해당하는 카테고리 항목에 기입하여 분류 결과표를 완성한다(S203).

상술한 바와 같이 생성된 분류 결과표를 기반으로, 서버(100)는 태깅이 완료된 정책 데이터를 이용하여 개인 또는 기업에게 정책을 추천할 수 있다.

서버(100)는 정책기관 서버(200)로부터 수집한 정책 데이터 외에도, 사용자 단말(300)의 접속 기록으로부터 유저 데이터 및 행동 데이터를 수집할 수 있다.

여기서 정책 데이터는, 상술한 자연어 처리 및 태깅 과정을 통해 생성된 키워드에 대한 정보와 분류 결과표를 포함할 수 있다.

다시 말해, 정책 데이터는, 정책 기관에서 시행하는 정책에 관한 정책 공고문에서 기 설정된 정책 데이터 자연어 처리 학습 모델을 통해 추출된 키워드, 그리고, 식별자가 생성된 키워드를 기 설정된 카테고리 항목 별로 분류하도록 키워드와 카테고리 항목을 태깅한 태깅 정보를 포함하는 것일 수 있다.

또한, 유저 데이터는, 정책 추천의 대상이 개인인 경우, 사용자 단말(300)로부터 입력 받은 개인의 거주지, 종사업종, 소득, 연령, 성별 및 자녀 수에 대한 정보 중 적어도 하나를 포함하는 것일 수 있다.

마찬가지로, 정책 추천의 대상이 기업인 경우에는, 사용자 단말(300)로부터 입력 받은 기업의 매출액, 소재지, 종사업종, 종업원수, 설립년도 및 업태에 대한 정보 중 적어도 하나를 포함하는 것일 수 있다.

도7을 참조하면, 본 발명의 일 실시예에 따르는 서버(100)는 사용자 단말(300)로 입력UI를 제공하여 정책 추천 대상이 개인인지 기업인지에 따라 필요로하는 정보를 수집할 수 있다.

이어서, 행동 데이터는 사용자 단말(300)이 서버(100) 및 정책기관 서버(200)에 접속한 로그 데이터를 기반으로 파악되는 접속 시간 및 접속 세션 수를 포함하는 것일 수 있다.

서버(100)는 정책 데이터와 유저 데이터를 비교 분석하여 상기 사용자 단말(300)로 추천할 복수의 정책들을 포함하는 추천 후보군을 생성하는데, 정책 데이터에 포함된 상기 키워드 및 태깅 정보와 유저 데이터에 포함된 정보들의 관련성이 기 설정된 수치 값 이상 일치하는 정책들을 포함하도록 상기 추천 후보군을 생성한다.

이때, 서버(100)는 사용자가 사용자 단말(300)을 통해 입력한 정보를 기반으로, 정책 데이터와 유저 데이터 간의 교집합에 해당하는 정책을 선별하여 최초 추천 후보군을 생성할 수 있다.

추가로 서버(100)는 최로 추천 후보군을 행동 데이터를 기반으로 최초 추천 후보군에 포함된 정책들 간의 순위를 설정하는 과정을 수행한다.

서버(100)는 추천 후보군에 포함된 정책들 중에서 각 유저 데이터 중 행동 데이터의 접속 시간이 기 설정된 시간 이상이고 접속 세션 수가 기 설정된 수치 이상인 정책들 각각의 접속 시간을 합한 값과 접속 세션 수를 합한 값을 기준으로, 상기 추천 후보군에 포함된 정책들 간의 순위를 재정렬한다.

예를 들어, 사용자 단말(300)이 추천 후보군에 포함된 복수의 정책에 대하여 각 정책을 제공하는 인터넷 세션에 얼마나 오래 접속하였는지 여부와 얼마나 많이 접속하였는지 여부를 기준으로 사용자 단말(300)이 오래 그리고 많이 접속한 정책을 사용자가 주목하는 정책인 것으로 판단하여 이를 우선적으로 추천하는데 활용할 수 있다.

만일 사용자 단말(300)이 서버(100)에 처음 접속한 경우라면, 서버(100)는 기 저장된 복수의 행동 데이터 중에서 사용자 단말(300)이 서버(100)에 처음 접속할 때 발생하는 행동 데이터와 관련성이 기 설정된 수치 이상인 유사 행동 데이터를 기초로 추천 후보군에 포함된 정책들의 순위를 재정렬할 수 있으며 유저 데이터를 통한 순위 재정렬 또한 가능하다.

도8을 참조하면, 사용자 단말(300)로 제공되는 추천 후보군은 도시된 바와 같이 복수의 정책을 포함할 수 있으며, 각각의 정책은 해당 정책의 수행기관종류 및 수행기관명, 정책명 및 지원기간이 표시되어 제공될 수 있다.

예를 들어, 유저 데이터가 30세, 미혼 직장인K씨인 사용자 단말(300)이 최초로 서버(100)에 접속한 경우, 이와 유사한 30세, 미혼 직장인P씨의 유저 데이터가 순위 재정렬에 활용될 수 있으며, K씨의 사용자 단말(300)의 행동 데이터가 청년 내일 채움 공제 정책에서 오랜 시간 많이 접속한 것으로 파악되는 경우, 청년 내일 채움 공제 정책이 K씨의 사용자 단말(300)로 추천될 수 있다.

이와 마찬가지로, 유저 데이터가 S그룹, 유통업, 연 매출 100억인 사용자 단말(300)이 최초로 서버(100)에 접속한 경우, 이와 유사한 유저 데이터를 유통업, 연 매출 90억인 Y산업의 유저 데이터가 순위 재정렬에 활용될 수 있으며, S그룹 사용자 단말(300)의 행동 데이터가 해외 수출 지원 사업 정책에서 오랜 시간 자주 접속한 것으로 파악되는 경우, 해외 수출 지원 사업 정책이 S그룹의 사용자 단말(300)로 제공될 수 있다.

도9c를 참조하면, 본 발명의 일 실시예에 따르는, 태깅이 완료된 정책 데이터를 이용하여 개인 또는 기업에게 정책을 추천하는 방법은 다음과 같은 순서로 수행될 수 있다.

먼저, 서버(100)가 정책기관 서버(200)로부터 정책 데이터를 수집하고, 사용자 단말(300)의 접속기록으로부터 유저데이터 및 행동데이터를 수집한다(S301).

이후, 자연어 처리와 태깅이 완료된 정책 데이터를 유저데이터를 매칭하여 복수의 정책을 포함하는 추천후보군을 생성한다(S302) .

다음으로, 행동데이터를 기반으로 추천후보군의 순위를 재설정한다(S303).

그리고, 정렬된 추천후보군에 포함된 정책을 순위가 높은 순에서 낮은 순으로 사용자 단말(300)로 추천한다(S304).

본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.

본 발명의 방법 및 시스템은 특정 실시예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수 있다.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

100: 서버 200: 정책기관 서버
300: 사용자 단말

Claims

서버에 의해 수행되는 기업에게 최적화된 정책을 추천하는 방법에 있어서,
(a) 정책기관 서버로부터 정책 데이터를 수집하고, 사용자 단말의 접속기록으로부터 유저 데이터 및 행동 데이터를 수집하는 단계;
(b) 상기 정책 데이터와 유저 데이터를 비교 분석하여 상기 사용자 단말로 추천할 복수의 정책들을 포함하는 추천 후보군을 생성하는 단계;
(c)상기 행동 데이터를 기반으로 상기 추천 후보군에 포함된 정책들의 순위를 설정하는 단계; 및
(d) 설정된 순위가 높은 순서에서 낮은 순서대로 상기 추천 후보군에 포함된 정책들을 상기 사용자 단말로 추천하는 단계를 포함하고,
상기 유저 데이터는,
상기 사용자단말로부터 입력 받은 기업의 매출액, 소재지, 종사업종, 종업원수, 설립년도 및 업태에 대한 정보 중 적어도 하나를 포함하는 것인, 기업에게 최적화된 정책을 추천하는 방법.
제1항에 있어서,
상기 정책 데이터는,
정책 기관에서 시행하는 정책에 관한 정책 공고문에서 기 설정된 정책 데이터 자연어 처리 학습 모델을 통해 추출된 키워드, 그리고, 식별자가 생성된 키워드를 기 설정된 카테고리 항목 별로 분류하도록 키워드와 카테고리 항목을 태깅한 태깅 정보를 포함하는 것인, 기업에게 최적화된 정책을 추천하는 방법.
제1항에 있어서,
상기 행동 데이터는,
상기 사용자 단말이 상기 서버 및 상기 정책기관 서버에 접속한 로그 데이터를 기반으로 파악되는 접속 시간 및 접속 세션 수를 포함하는 것인, 기업에게 최적화된 정책을 추천하는 방법.
제2항에 있어서,
상기 (b)단계는,
상기 정책 데이터에 포함된 상기 키워드 및 태깅 정보와 상기 유저 데이터에 포함된 정보들의 관련성이 기 설정된 수치값 이상 일치하는 정책들을 포함하도록 상기 추천 후보군을 생성하는 단계를 포함하는 것인, 기업에게 최적화된 정책을 추천하는 방법.
제3항에 있어서,
상기 (c)단계는,
상기 추천 후보군에 포함된 정책들 중에서 상기 행동 데이터의 접속 시간이 기 설정된 시간 이상이고 상기 접속 세션 수가 기 설정된 수치 이상인 정책들 각각의 접속 시간을 합한 값과 접속 세션 수를 합한 값을 기준으로, 상기 추천 후보군에 포함된 정책들 간의 순위를 재정렬하는 단계를 포함하는 것인, 기업에게 최적화된 정책을 추천하는 방법.
제1항에 있어서,
상기 (c)단계는,
상기 사용자 단말이 상기 서버에 처음 접속한 경우, 기 저장된 복수의 행동 데이터 중에서 상기 사용자 단말이 상기 서버에 처음 접속할 때 발생하는 행동 데이터와 관련성이 기 설정된 수치 이상인 유사 행동 데이터를 기초로 상기 추천 후보군에 포함된 정책들의 순위를 재정렬하는 단계를 포함하는 것인, 기업에게 최적화된 정책을 추천하는 방법.
제1항에 있어서,
상기 (d)단계는,
상기 추천 후보군에 포함된 정책들의 순위에 따라, 상기 사용자 단말의 인터페이스 상에서 순서대로 순위가 높은 정책에서 순위가 낮은 정책이 제공되되, 신규 정책이 상기 서버에 등록되는 경우 상기 신규 정책이 상기 인터페이스 상에서 최우선 순위로 제공되는 단계를 포함하는 것인, 기업에게 최적화된 정책을 추천하는 방법.
기업에게 최적화된 정책을 추천하는 장치에 있어서,
태깅된 정책 데이터를 이용하여 기업에게 정책을 추천하는 것을 수행하기 위한 프로그램이 저장된 메모리; 및
상기 프로그램을 실행하기 위한 프로세서를 포함하며,
상기 프로세서는, 정책기관 서버로부터 정책 데이터를 수집하고, 사용자 단말의 접속 기록으로부터 유저 데이터 및 행동 데이터를 수신하고, 상기 정책 데이터와 유저 데이터를 비교 분석하여 상기 사용자 단말로 추천할 복수의 정책들을 포함하는 추천 후보군을 생성하고, 상기 행동 데이터를 기반으로 상기 추천 후보군에 포함된 정책들의 순위를 설정하고, 설정된 순위가 높은 순서에서 낮은 순서대로 상기 추천 후보군에 포함된 정책들을 상기 사용자 단말로 추천하는 것을 수행하도록 구성되고,
상기 유저 데이터는, 상기 사용자단말로부터 입력 받은 기업의 매출액, 소재지, 종사업종, 종업원수, 설립년도 및 업태에 대한 정보 중 적어도 하나를 포함하는 것인, 기업에게 최적화된 정책을 추천하는 장치.