KR102649918B1 - 대규모 언어 모델 기반 맞춤형 복지 정책 추천 시스템 - Google Patents

대규모 언어 모델 기반 맞춤형 복지 정책 추천 시스템 Download PDF

Info

Publication number
KR102649918B1
KR102649918B1 KR1020230072114A KR20230072114A KR102649918B1 KR 102649918 B1 KR102649918 B1 KR 102649918B1 KR 1020230072114 A KR1020230072114 A KR 1020230072114A KR 20230072114 A KR20230072114 A KR 20230072114A KR 102649918 B1 KR102649918 B1 KR 102649918B1
Authority
KR
South Korea
Prior art keywords
search
keyword
weight
user
question
Prior art date
Application number
KR1020230072114A
Other languages
English (en)
Inventor
전진호
임근석
Original Assignee
(주)복지이십사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)복지이십사 filed Critical (주)복지이십사
Priority to KR1020230072114A priority Critical patent/KR102649918B1/ko
Application granted granted Critical
Publication of KR102649918B1 publication Critical patent/KR102649918B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Artificial Intelligence (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Child & Adolescent Psychology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명의 실시예에 따르면, 사용자 단말기로부터 단어 또는 문장 형태의 질문을 수신하는 질문 수신부; 상기 질문에서 대규모 언어 모델을 활용하여 키워드를 추출하는 질문 분석부; 상기 키워드를 기반으로 검색식을 생성하는 검색식 생성부; 및 복지 정책과 관련된 다수의 정보들 중 상기 검색식을 기반으로 검색된 결과를 상기 사용자 단말기에 제공하는 검색 결과 제공부를 포함하는, 맞춤형 복지 정책 추천 시스템이 제공된다.

Description

대규모 언어 모델 기반 맞춤형 복지 정책 추천 시스템{SYSTEM FOR RECOMMENDING CUSTOMIZED WELFARE POLICY BASED ON LARGE LANGUAGE MODEL}
본 발명은 대규모 언어 모델 기반 맞춤형 복지 정책 추천 시스템에 관한 것으로, 보다 상세하게는, 대규모 언어 모델에 기반한 챗봇 기술과 검색 방법론을 결합하여 맞춤형 복지 정책을 추천해줄 수 있도록 하는 시스템에 관한 것이다.
공공 행정서비스는 소수의 서비스 제공자가 다수의 서비스 이용객을 상대하며, 단순 반복적인 질의와 응답, 그리고 정형화된 정보요구와 답변으로 구성되어 있다. 대부분의 공공 기관들은 이러한 요구사항에 대응하기 위하여 홈페이지 또는 콜센터가 포함된 통합 민원센터를 운영하고 있다. 최근에는 통합 민원 센터의 인바운드 문의 사항에 적극적으로 대응하기 위하여 정형적인 답변이 이루어지는 공공 행정 서비스부문에서 챗봇이 적극적으로 도입되고 있다. 공공 행정 서비스의 챗봇이 적용된 해외 사례는 미국농무부(USDA)의 메신저 챗봇기반 'Ask Karen'서비스로 신뢰도 높은 식품 안전 및 검사 서비스에 관한 정보를 제공하고 있다. Ask Karen은 식품 안전과 검사 서비스를 제공받기 위한 수 많은 절차들을 통합 및 연계하여 각 절차의 수행에 따르는 비용을 절감하였으며, 메신저 플랫폼을 통하여 서비스를 제공함으로써 일반 사용자에게 거부감 없는 서비스 환경을 구축하였다.
국내에서도 콜센터의 질의응답을 챗봇으로 변경하고, 공공기관의 데이터를 수집하여 챗봇으로 대답하도록 하는 플랫폼이 연구 및 개발되었는데, 예를 들면, 고객 단말로부터 발신 호(Call)가 수신되고, 고객 단말로부터 상담 내용을 수신하는 경우, 수신된 상담 내용인 음성을 실시간으로 텍스트로 변환하도록 제어하고, 상담 내용으로부터 생성된 답변 텍스트를 수신하여 음성으로 변환하도록 제어하고, 생성된 음성 답변을 고객 단말로 실시간으로 전송할 때, 텍스트에 대응하는 상담 내용에 대한 답변을 챗봇으로 전달하는 기술, 모집단 그룹에 속한 동종-유사 단어들 중 사용자 빈도수가 가장 높은 단어를 대표 단어로 선정한 후, 대표 단어를 포함하는 정보제공 요청정보에 응답하는 사용자 맞춤형 공공지식 정보를 사용자 통신 단말기의 인공지능 메신저를 통해 실시간으로 제공하는 기술 등이 제안되었다.
다만, 행정 서비스라는 것 자체가 증명이나 민원 서비스도 포함하지만, 한 사람이 태어나고 죽을 때까지 국가가 국민에게 보장해야 하는 여러가지 복지 서비스도 포함하는데, 복지 서비스가 어떤 것이 있는지를 알아야 신청할 수 있는 구조이기 때문에, 아직도 복지혜택을 신청하지 못해 굶어죽거나 생활고와 빈곤에 자살하는 안타까운 뉴스가 전해지고 있으며, OECD 국가 중 자살률 1위라는 불명예를 벗지 못하고 있다. 막상 복지 서비스를 인지했다 할지라도 자신에게 해당이 되지 않는 경우도 많고 신청하려고 해도 절차가 너무나 복잡해서 중도에 포기하는 사례도 많다. 이를 위하여 정부는 각종 인공지능 또는 빅데이터 분석을 통하여 복지의 사각지대를 찾아내려고 예산을 투입하지만 결과는 나아진 것이 없다. 이에, 행정민원서비스 전용 챗봇을 제공하면서 개인마다 적용대상인 생애주기별 복지정책을 안내 및 홍보해줄 수 있는 플랫폼의 연구 및 개발이 요구된다.
본 발명은 전술한 종래기술의 문제점을 해결하기 위한 것이다.
본 발명의 목적은, 사용자가 단어 또는 문장의 형식으로 복지 정책에 대한 질문을 입력하는 것만으로, 이에 대한 답변을 제공하되, 질문에 대한 분석을 통해 키워드를 추출하고, 일정 기준에 따라 검색식을 생성하며, 이를 통해 검색을 수행함으로써, 사용자 의도에 부합하는 검색 결과가 도출될 수 있으며, 도출된 검색 결과를 대화 형식으로 사용자에게 제공할 수 있도록 하는 것이다..
본 발명의 목적들은 이상에서 언급한 목적들로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.
상술한 목적을 달성하기 위한 본 발명의 일 실시예에 따르면, 사용자 단말기로부터 단어 또는 문장 형태의 질문을 수신하는 질문 수신부; 상기 질문에서 대규모 언어 모델을 활용하여 키워드를 추출하는 질문 분석부; 상기 키워드를 기반으로 검색식을 생성하는 검색식 생성부; 및 복지 정책과 관련된 다수의 정보들 중 상기 검색식을 기반으로 검색된 결과를 상기 사용자 단말기에 제공하는 검색 결과 제공부를 포함하는, 맞춤형 복지 정책 추천 시스템이 제공된다.
상기 검색식 생성부는, 추출된 상기 키워드들을 기반으로 키워드 쌍을 생성하되, 키워드들 간의 상관성에 따라, 상관성이 가장 높은 키워드 쌍 및 상관성이 가장 낮은 키워드 쌍을 추출할 수 있다.
상기 검색식 생성부는, 상기 상관성이 가장 낮은 키워드 쌍을 1순위 검색 키워드 쌍으로 설정하고, 상기 상관성이 가장 높은 키워드 쌍을 2순위 검색 키워드 쌍으로 설정할 수 있다.
본 발명의 실시예에 따르면, 사용자가 단어 또는 문장의 형식으로 복지 정책에 대한 질문을 입력하는 것만으로, 이에 대한 답변을 제공하되, 질문에 대한 분석을 통해 키워드를 추출하고, 일정 기준에 따라 검색식을 생성하며, 이를 통해 검색을 수행함으로써, 사용자 의도에 부합하는 검색 결과가 도출될 수 있으며, 도출된 검색 결과를 대화 형식으로 사용자에게 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른 맞춤형 복지 정책 추천 시스템의 구성을 개략적으로 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른 서비스 서버의 상세 동작 및 내부 구성을 설명하기 위한 블록도이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
이하에서는, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 맞춤형 복지 정책 추천 시스템의 구성을 개략적으로 나타내는 도면이다.
도 1을 참조하면, 일 실시예에 따른 시스템은, 사용자 단말기(100), 서비스 서버(200), 행정기관 서버(300)를 포함하여 구성될 수 있다.
사용자 단말기(100), 서비스 서버(200), 행정기관 서버(300)는 통신망, 예를 들면, 이동통신망, 근거리 통신망(LAN: Local Area Network), 도시권 통신망(MAN: Metropolitan Area Network), 광역 통신망(WAN: Wide Area Network), 월드와이드웹(WWW: World Wide Web), 무선통신망(WiFi: Wireless Fidelity)을 통해 상호 통신할 수 있다.
사용자 단말기(100)는 연산 기능을 갖추고 있으며, 외부와 통신할 수 있는 기기라면 어떠한 형태로 구현되어도 무방하다. 사용자 단말기(100)는 예를 들면 스마트폰, 태블릿 PC, 데스크톱, 랩탑 노트북, PDA 등으로 구현될 수 있으나, 이에 제한되는 것은 아니다.
사용자 단말기(100)는 서비스 서버(200)에 사용자의 복지 정책 관련 질문을 전송하는 기능을 수행하고, 서비스 서버(200)로부터 이에 대한 응답 정보를 수신한다.
서비스 서버(200)는 사용자 단말기(100)로부터 수신된 문장을 분석하고, 이를 토대로, 검색 쿼리를 생성하여, 생성된 검색 쿼리에 기반하여 복지 정책을 검색하는 기능을 수행한다.
행정기관 서버(300)는 복지 정책 또는 복지 상품을 제공하는 다수의 기관에 의해 운영되는 서버로서, 다양한 복지 정책 및 복지 상품에 대한 정보를 서비스 서버(200)에 제공하는 기능을 수행한다.
도 2는 본 발명의 일 실시예에 따른 서비스 서버(200)의 상세 동작 및 내부 구성을 설명하기 위한 블록도이다.
도 2를 참조하면, 서비스 서버(200)는 질문 수신부(210), 질문 분석부(220), 검색식 생성부(230), 검색 결과 제공부(240)를 포함하여 구성될 수 있다.
질문 수신부(210), 질문 분석부(220), 검색식 생성부(230), 검색 결과 제공부(240)는 외부 장치와 통신할 수 있는 프로그램 모듈 또는 하드웨어들일 수 있다. 이러한 프로그램 모듈 또는 하드웨어는 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈의 형태로 서비스 서버(200) 또는 이와 통신 가능한 다른 장치에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억 장치 상에 저장될 수 있다. 한편, 이러한 프로그램 모듈 또는 하드웨어들은 본 발명에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다.
질문 수신부(210)는 사용자 단말기(100)로부터 단어 또는 문장으로 이루어진 질문을 수신하는 기능을 수행한다. 사용자는 복지 정책과 관련된 질문을 사용자 단말기(100)를 통해 작성하여 전송할 수 있고, 질문 수신부(210)는 이러한 질문을 수신한다. 질문은 예를 들면, “치매노인 무료 옷 제공”과 같은 질문일 수 있다.
질문 수신부(210)는 질문 입력을 위한 채팅창 등의 인터페이스를 제공할 수 있으며, 사용자는 해당 인터페이스를 통해 질문을 대화 형식으로 입력할 수 있다.
질문 분석부(220)는 머신러닝 알고리즘을 이용하여 해당 사용자 단말기(100)로부터 수신된 질문을 분석하는 기능을 수행한다.
본 발명은 머신러닝(Machine Learning)의 일종인 딥러닝(Deep Learning) 기술을 이용한 학습 방법으로서, 지도 학습(Supervised Learning) 알고리즘을 사용하며, 신경망(Neural Network)에 기반한 콘볼루션 신경망(CNN)을 채용하였고, 콘볼루션 신경망을 구조화하여 신경망 내에 하위 신경망을 넣는 방식을 채용하였다. 참고로, 콘볼루션 신경망은 특징값을 직접 스스로 추출하고 이에 대한 분류까지 수행한다.
머신러닝은 인공지능의 한 분야로서, 패턴인식과 컴퓨터 학습 이론의 연구로부터 진화한 분야이다. 머신러닝은 주위 환경을 학습 요소로서 사용하여 지식베이스를 개선한다. 개선된 지식베이스를 이용하여 특정 작업을 수행하게 되고, 작업을 수행하는 동안에 얻은 정보는 다시 학습 요소에 반영된다. 머신러닝은 이러한 방식으로 경험적 데이터를 기반으로 학습을 하고 예측을 수행하며 스스로의 성능을 향상시키는 시스템과 이를 위한 알고리즘을 연구하고 구축하는 기술이다. 머신러닝의 알고리즘들은 입력 데이터를 기반으로 예측이나 결정을 이끌어내기 위해 특정한 모델을 구축하는 방식을 사용한다.
머신러닝은 학습 전략에 따라 암기 학습과 새로운 지식을 직접적으로 부여하는 방식, 지도 학습 방식, 유추에 의한 학습 방식, 귀납적 학습 방식 등으로 분류될 수 있다.
암기 학습과 새로운 지식의 직접적인 부여 방식은 추론이나 지식의 변형이 필요치 않다. 이러한 학습 방식의 변형으로는, 외부 객체 또는 프로그램에 의해 구축 및 변경되는 학습방식, 주어진 사실이나 데이터에 대한 기억으로만 학습이 이루어지고 입력 정보 위한 추론이 없는 방식 등이 있다.
지도 학습 방식은 입력된 정보들을 내부적인 표현 기법으로 변환시키고, 새로운 정보는 기존의 원천적 지식과 통합하는 방식이다. 외부에서는 머신러닝 시스템의 지식을 증식시키기 위해 정보들을 적절히 조합하여 머신러닝 시스템에 부여한다. 여러가지 지도를 실행 프로그램으로 변형하기 위해서는, 지도를 요구하는 요구 단계, 외부의 지도를 내부 표현으로 변환하는 해석 단계, 지도의 수준과 실행 요소가 적용하는 수준의 차이를 줄이기 위해 연산자로 변환하는 연산자화 단계, 기존의 지식과 새로운 지식을 합병하는 합병 단계, 새롭게 만들어진 지식을 평가하는 평가 단계를 거쳐야 한다.
유추 학습 방식은 이미 존재하는 정보를 변형 또는 증식시켜 새로운 사실을 습득하는 방식으로서, 지식의 변형 과정에서 원하는 새로운 개념이나 기술에 대한 강한 유사성을 도출하여 이것을 새로운 상황에서 유용하게 이용하는 방식이다. 이미 만들어진 컴퓨터 프로그램을 원래 설계된 것과는 다르게 운용되는 프로그램으로 변형하는 데 이용될 수 있을 것이다. 이는 암기 학습 또는 지도 학습 방식에 비해 좀 더 많은 추론이 요구되는 방식이다.
귀납적 학습 방식은 어떤 개념에 대해서 그 개념을 잘 설명하는 예(긍정적 예, positive example)와 개념을 부정하는 예(부정적 예, counterexample 또는 negative example)들의 집합이 주어질 때, 부정적인 예들의 성질을 배제하면서 모든 긍정적인 예들의 성질을 잘 묘사하는 일반적인 개념 묘사를 추론해낸다. 이 학습 방식은 인공 지능 분야에서 가장 많이 연구되어 왔던 방식이다. 추론에 드는 노력은 지도 학습 방식보다 훨씬 많으며, 외부에서 일반적인 개념이 주어지지 않는다면 유추에 의한 학습보다도 추론에 드는 노력이 더 많아지게 된다. 이 방식은, 외부에서 예를 제공하는 방식, 시스템 내에서 예를 생성하여 제공하는 방식, 외부 환경에서 예제들을 제공하는 방식, 긍정적인 예제들만 이용하는 방식, 긍정적/부정적 예제들을 모두 이용하는 방식 등으로 분류될 수 있다.
딥러닝은 머신러닝의 일종으로 신경망 기반의 복잡도가 큰 모델이다. 기존의 신경망 모델이 한 개의 은닉층을 사용한 비교적 단순한 모델인 것에 비해서 딥러닝 모델은 아주 많은 수의 은닉층을 사용한다. 인간 뇌의 시각피질에서도 V1, V2, V4 등 점차적으로 복잡한 정보를 추출하는 일련의 신경층들이 발견되며 딥러닝은 이러한 구조를 모사한 머신러닝 모델이다. 예를 들어, 하위층에서는 비교적 단순한 정보처리(예, 라인 탐지)를 수행하고, 상위층으로 갈수록 점차 복잡한 정보(예, 에지 검출과 물체 인식)를 추출하는 구조를 사용하는 것으로 알려져 있다.
딥러닝의 핵심 아이디어는 기존에는 복잡한 문제를 풀기 위해서 특징 추출과 패턴 분류의 두 단계로 분리하여 문제를 해결하던 방식을 하나의 단계로 통합하여 해결하는 자동화로 볼 수 있다. 기존에는 먼저 데이터 전처리 및 가공을 통해서 문제 해결에 적합한 특징들을 추출한 다음, 이를 학습 데이터로 하여 패턴 분류기를 훈련시키는 두 개의 단계로 문제를 해결하였다. 딥러닝 구조는 특징 추출을 위한 전처리 단계를 전체 학습 프로세스에 포함시킴으로써 가공되지 않은 원래 데이터를 직접 학습하도록 하는 통합된 문제해결 방식을 취한다. 딥러닝 구조는 전처리 과정을 통해서 손실될 수도 있는 정보를 기계가 자동으로 추출해서 활용할 수 있다. 즉 기존의 전처리 방법이나 소위 feature engineering을 통해 배제되었던 해의 영역 조차도 탐색함으로써 더욱 유용한 정보를 추출하여 활용할 수 있다.
딥러닝 모델의 성과가 향상될 수 있었던 것은 대규모 데이터로 대규모 모델을 학습시킬 수 있었기 때문이며, 이에 크게 기여한 것이 콘볼루션 신경망이다. 즉, 콘볼루션 신경망은 차원수가 아주 높은 데이터로부터 유용한 특징과 표현을 자동으로 추출하기 위해 컨볼루션 커널(convolution kernels)을 사용하고, 이를 통해 위치가 달라도 같은 파라미터값을 갖게 되며, 파라미터의 수를 줄임으로써 학습해야 하는 차원의 수를 줄일 수 있다. 콘볼루션 신경망 모델을 사용함으로써 과다학습이 방지되고 유용한 특징이 추출될 수 있다.
콘볼루션 신경망은 기본적으로 감독학습 문제를 풀도록 설계되어 있고, 입력데이터를 분류하기 위한 변별적 학습에 초점이 맞춰져 있다. 이는 패턴 분류 성능을 향상시킬 수 있고, 아주 많은 수의 뉴런층을 사용하여 복잡한 특징과 표현을 스스로 구축할 수 있다. 콘볼루션 신경망은 종래의 신경망이 가지는 은닉 계층(Hidden layer)의 완전 접속 계층(Fully connected layer)에 콘볼루션 계층(Convolution layer) 및 보조 표본화 계층(Sub-sampling layer)을 추가하고 구조적으로 세분화하여 성능을 향상시킨 신경망 이다. 이러한 콘볼루션 신경망을 활용한 딥러닝은 다른 기법들과 비교하여 매우 우수한 정확도를 보인다.
콘볼루션 신경망은 특징추출을 콘볼루션으로 하고, 분류 행위를 신경망으로 수행한다.
콘볼루션과 서브샘플링(subsampling)을 반복하면, 추출된 특징이 남게 되고, 신경망의 각 입력단자에 입력하면, 학습이 이루어지게 된다.
일 실시예에 따르면, 질문 분석부(220)는 위와 같은 딥러닝 알고리즘을 통해 학습된 대규모 언어 모델(LLM: Large Language Model)을 활용하여, 사용자 질문을 분석할 수 있다. 분석의 목적은 맞춤형 복지 정책을 검색할 수 있도록 하는 검색 쿼리를 획득하기 위함이다.
일 실시예에 따르면, 질문 분석부(220)는 사용자의 질문 정보 내에서 키워드를 추출하여 사용자의 질문 취지를 분석하는 기능을 수행한다.
위의 예, 즉, “치매노인 무료 옷 제공”이라는 질문에서, 키워드는 “치매”, “노인”, “무료”, “옷”일 수 있다. 키워드 추출은 공지의 자연어 분석 모델 또는 형태소 분석 알고리즘 등을 통해 이루어질 수 있다. 질문 분석부(220)는 딥러닝 학습의 대상이 되는 수많은 질문을 통한 대규모 언어 모델을 통해, 상기 키워드들로부터 질문의 취지를 분석하는 기능을 수행한다.
키워드들 간의 상관성 정도는 딥러닝을 통해서 학습될 수 있다. 예를 들어, 과거 수많은 질문 데이터에 있어서, 하나의 질문에 함께 포함되는 빈도가 높은 키워드들 간의 상관성 정도는 그렇지 않은 키워드들 간의 상관성 정도보다 높게 책정될 수 있다. 과거 수많은 질문 데이터는 데이터베이스화되어 있을 수 있다.
예를 들어, “치매”, “노인”, “무료”, “옷”의 키워드들에 있어서, “치매”, “노인”이 함께 질문에 포함된 빈도수가 제1 값이고, “지매”, “무료”가 함께 질문에 포함된 빈도수가 제2 값이고, “치매”, “옷”이 함께 질문에 포함된 빈도수가 제3 값이고, “무료”, “옷”이 함께 질문에 포함된 빈도수가 제4 값이며, 제1 값>제2 값>제3 값>제4값의 관계가 성립할 때, 빈도수가 가장 높은 키워드의 쌍(“치매”, “노인”)과 빈도수가 가장 낮은 키워드의 쌍(“무료”, “옷”)을 추출한다.
빈도수가 가장 낮은 키워드의 쌍은 질문의 핵심 취지로서 활용하고, 빈도수가 가장 높은 키워드의 쌍은 추후 검색 시의 모집단을 추출하는 데에 활용할 수 있는 것이다.
검색식 생성부(230)는 질문 분석부(220)에 의해 분석된 결과, 즉, 질문에 포함된 키워드들의 상관성 정도에 따라 추출되는 키워드 쌍을 통해, 검색식을 생성하는 기능을 수행한다.
일 실시예에 따르면, 함께 질문에 포함된 빈도수가 가장 낮은 키워드 쌍이 1순위 검색 키워드가 되고, 함께 질문에 포함된 빈도수가 가장 높은 키워드 쌍이 2순위 검색 키워드가 된다.
위의 예에서, 1순위 검색 키워드 쌍은 “무료”, “옷”이 되고, 2순위 검색 키워드 쌍은 “치매”, “노인”이 된다.
검색식은, 순위가 높은 키워드 쌍을 앞에 배치하고, 순위가 낮은 키워드 쌍을 뒤에 배치하는 방식, 즉, 순위가 높은 키워드 쌍으로부터 순차적으로 키워드 쌍을 배치하는 방식으로 생성될 수 있다.
예를 들면, 상기 예에서, 검색식(즉, 검색 쿼리)은 “무료 옷 치매 노인”이 된다. 함께 질문에 포함된 빈도수가 가장 낮은 키워드 쌍의 우선순위를 보다 높게 부여하는 것은, 해당 사용자가 다른 사용자와는 다르게 해당 키워드 쌍과 관련된 특유의 정보를 획득하려는 취지를 반영하기 위함이다.
검색 결과 제공부(240)는 상기와 같이 생성된 검색식을 통해 검색을 수행한다. 검색은, 행정기관 서버(300)에서 제공되는 다수의 복지 정책 정보를 대상으로 이루어질 수 있다. 검색 시, 검색 후보가 되는 대상들에는 차등적인 가중치가 적용될 수 있다. 이에는, 당해 질문을 전송한 사용자 단말기(100)의 위치 정보 및 상기 2순위 검색 키워드(즉, 동일 질문에 포함되는 빈도가 가장 높은 키워드 쌍)가 활용될 수 있다.
먼저, 위치 정보를 토대로, 해당 위치를 기준으로 일정 반경 내의 다수의 사용자 단말기(100)에서 과거 전송한 질문에 있어서, 당해 생성된 검색식의 1순위 검색 키워드와 유사한 검색 키워드로서 검색된 결과들 중, 사용자가 선택(클릭)한 검색 결과에 대해서는 제1 가중치를 부여한다. 제1 가중치를 적용함에 있어서는 검색 키워드 간 유사성에 따라 차등적으로 부여될 수 있다.
즉, 제1 사용자에 대해 당해 생성된 검색식의 1순위 검색 키워드(“무료”, “옷”), 및 과거 제2 사용자에 대해 생성된 검색식의 1순위 검색 키워드가 유사할수록 상기 제2 사용자가 검색 결과들 중 직접 선택(클릭)한 특정 검색 결과에는 높은 가중치가 부여될 수 있다. 예를 들어, 상기 예에서, 제2 사용자에 대해 생성된 1순위 검색 키워드는 “노인”, “옷”이고, 제3 사용자에 대해 생성된 1순위 검색 키워드는 “무료”, “옷”인 경우, 제3 사용자의 검색 키워드가 제1 사용자의 검색 키워드와 상대적으로 더 유사하므로, 제3 사용자에 의해 선택된 검색 결과에는 더 높은 가중치가 부여될 수 있다.
또한, 2순위 검색 키워드를 토대로, 이와 유사한 2순위 검색 키워드가 생성된 사용자들이 과거 선택한 검색 결과에 대해서는 제2 가중치를 부여할 수 있다. 제2 가중치는 제1 가중치보다 작은 값일 수 있다. 이는, 복지 정책의 특성상 사용자의 거주 지역에서 제공하는 정책에 대한 관심도가 더 높기 때문에, 사용자의 위치와 관계되는 제1 가중치가 더 높게 부여되도록 하는 것이다.
제2 가중치 또한 키워드 간의 유사성에 기초하여 차등적으로 부여될 수 있다. 즉, 제1 사용자에 대해 당해 생성된 검색식의 2순위 검색 키워드(“치매”, “노인”), 및 과거 제2 사용자에 대해 생성된 검색식의 2순위 검색 키워드가 유사할수록 상기 제2 사용자가 검색 결과들 중 직접 선택(클릭)한 특정 검색 결과에는 높은 가중치가 부여될 수 있다. 예를 들어, 상기 예에서, 제2 사용자에 대해 생성된 2순위 검색 키워드는 “노인”, “독거”이고, 제3 사용자에 대해 생성된 2순위 검색 키워드는 “치매”, 노인”인 경우, 제3 사용자의 검색 키워드가 제1 사용자의 검색 키워드와 상대적으로 더 유사하므로, 제3 사용자에 의해 선택된 검색 결과에는 더 높은 가중치가 부여될 수 있다. 본 명세서에서, 선택이란, 최종적으로 검색 결과로서 제공된 정보 중 사용자가 해당 정보의 상세 내용을 확인하기 위해 선택 또는 클릭하는 액션을 의미한다.
검색 결과 제공부(240)는 검색 쿼리를 통해 검색을 수행하되, 각 검색 결과 후보군에 상기와 같은 방식으로 각 후보들에 대해 차등적 가중치를 부여하여 검색을 수행한다. 검색 대상이 되는 자료들은 복지 용구에 대한 정보 및 비급여 상품 정보르르 모두 포함하는 개념일 수 있고, 검색에 대한 에러가 발생하면, 검색 쿼리를 기반으로 재검색을 수행할 수 있다.
검색 결과, 즉, 검색된 복지 정보의 리스트는 1순위 키워드와의 매칭 정도가 가장 높은 순으로 정렬될 수 있고, 각 검색 결과와 상기 1순위 키워드 간의 매칭 정도에는 상기 설명한 차등적 가중치가 적용될 수 있다. 즉, 각 후보군에 대해 가중치를 적용하고, 1순위 키워드와의 매칭 정도를 산출하여, 매칭 정도의 순서로 검색 결과가 정렬될 수 있다.
이렇게 정렬된 검색 결과에 대해서는 그대로 사용자 단말기(100)에 제공될 수 있고, 제공된 검색 결과 중 사용자가 선택하여 상세 정보를 확인한 검색 결과에 대해서는 데이터베이스화하여 향후 검색 시 가중치 적용 기반 정보로서 활용할 수 있다.
또한, 사용자가 질문을 입력한 인터페이스를 통해 질문에 대한 답변을 제공하는 방식으로 템플릿을 생성하여 제공할 수도 있다.
일 실시예에 따르면, 사용자가 단어 또는 문장의 형식으로 복지 정책에 대한 질문을 입력하는 것만으로, 이에 대한 답변을 제공하되, 질문에 대한 분석을 통해 키워드를 추출하고, 일정 기준에 따라 검색식을 생성하며, 이를 통해 검색을 수행함으로써, 사용자 의도에 부합하는 검색 결과가 도출될 수 있으며, 도출된 검색 결과를 대화 형식으로 사용자에게 제공할 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100: 사용자 단말기
200: 서비스 서버
300: 행정기관 서버
210: 질문 수신부
220: 질문 분석부
230: 검색식 생성부
240: 검색 결과 제공부

Claims (3)

  1. 사용자 단말기로부터 단어 또는 문장 형태의 질문을 수신하는 질문 수신부;
    상기 질문에서 대규모 언어 모델을 활용하여 키워드를 추출하는 질문 분석부;
    상기 키워드를 기반으로 검색식을 생성하는 검색식 생성부; 및
    복지 정책과 관련된 다수의 정보들 중 상기 검색식을 기반으로 검색된 결과를 상기 사용자 단말기에 제공하는 검색 결과 제공부를 포함하고,
    상기 검색식 생성부는,
    추출된 상기 키워드들을 기반으로 키워드 쌍을 생성하되, 키워드들 간의 상관성에 따라, 상관성이 가장 높은 키워드 쌍 및 상관성이 가장 낮은 키워드 쌍을 추출하고, 상기 상관성이 가장 낮은 키워드 쌍을 제1 선순위 검색 키워드 쌍으로 설정하고, 상기 상관성이 가장 높은 키워드 쌍을 제1 후순위 검색 키워드 쌍으로 설정하며,
    상기 검색 결과 제공부는,
    상기 사용자 단말기의 위치를 기준으로 일정 반경 내의 다수 사용자 단말기로부터 과거 전송된 질문에 대해 제공된 검색 결과에 대해 사용자가 선택한 검색 결과들에 차등적으로 제1 가중치를 부여하되, 상기 과거 전송된 질문으로부터 생성된 검색식의 제2 선순위 검색 키워드 쌍에 의해 검색된 검색 결과 중 사용자가 선택한 검색 결과에 대해서는 상기 제1 가중치를 부여하고, 상기 제2 선순위 검색 키워드 쌍이 상기 제1 선순위 검색 키워드 쌍과 유사할수록, 상기 제1 가중치는 더 높게 부여되며,
    상기 과거 전송된 질문으로부터 생성된 검색식의 제2 후순위 검색 키워드 쌍에 의해 검색된 검색 결과 중 사용자가 선택한 검색 결과에 대해서는 제2 가중치를 부여하고, 상기 제2 후순위 검색 키워드 쌍이 상기 제1 후순위 검색 키워드 쌍과 유사할수록, 상기 제2 가중치는 더 높게 부여되며,
    상기 제1 가중치는, 상기 제2 가중치보다 높게 설정되고,
    상기 검색 결과 제공부는,
    상기 제1 가중치 및 제2 가중치가 부여된 검색 결과들을 후보군으로 하여, 상기 제1 선순위 검색 키워드 쌍과의 매칭 정도가 높은 순으로 검색 결과를 상기 사용자 단말기에 제공하되, 상기 매칭 정도 산출 시에는 상기 후보군 각각에 상기 제1 가중치 및 제2 가중치가 적용되는, 맞춤형 복지 정책 추천 시스템.
  2. 삭제
  3. 삭제
KR1020230072114A 2023-06-05 2023-06-05 대규모 언어 모델 기반 맞춤형 복지 정책 추천 시스템 KR102649918B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230072114A KR102649918B1 (ko) 2023-06-05 2023-06-05 대규모 언어 모델 기반 맞춤형 복지 정책 추천 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230072114A KR102649918B1 (ko) 2023-06-05 2023-06-05 대규모 언어 모델 기반 맞춤형 복지 정책 추천 시스템

Publications (1)

Publication Number Publication Date
KR102649918B1 true KR102649918B1 (ko) 2024-03-20

Family

ID=90483149

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230072114A KR102649918B1 (ko) 2023-06-05 2023-06-05 대규모 언어 모델 기반 맞춤형 복지 정책 추천 시스템

Country Status (1)

Country Link
KR (1) KR102649918B1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150082754A (ko) * 2014-01-07 2015-07-16 한국전자통신연구원 위키피디아의 콘텐츠를 기반으로 하는 정보검색 장치 및 정보검색 방법
KR20200080571A (ko) * 2018-12-27 2020-07-07 에스케이 주식회사 키워드와 관계 정보를 이용한 정보 검색 시스템 및 방법
KR102275986B1 (ko) * 2020-10-12 2021-07-13 동국대학교 산학협력단 솔루션 기반 데이터 분석 및 예측 장치 및 동작 방법
KR20230003184A (ko) * 2020-05-28 2023-01-05 제이에프이 스틸 가부시키가이샤 정보 검색 시스템
KR20230013540A (ko) * 2021-07-19 2023-01-26 (주)복지이십사 머신러닝 기반 비대면 복지 신청 서비스 제공 방법 및 시스템
KR102534131B1 (ko) * 2020-07-30 2023-06-05 예스이십사 주식회사 대화 형식 기반의 도서 추천 서비스 제공 방법 및 그를 위한 장치

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150082754A (ko) * 2014-01-07 2015-07-16 한국전자통신연구원 위키피디아의 콘텐츠를 기반으로 하는 정보검색 장치 및 정보검색 방법
KR20200080571A (ko) * 2018-12-27 2020-07-07 에스케이 주식회사 키워드와 관계 정보를 이용한 정보 검색 시스템 및 방법
KR20230003184A (ko) * 2020-05-28 2023-01-05 제이에프이 스틸 가부시키가이샤 정보 검색 시스템
KR102534131B1 (ko) * 2020-07-30 2023-06-05 예스이십사 주식회사 대화 형식 기반의 도서 추천 서비스 제공 방법 및 그를 위한 장치
KR102275986B1 (ko) * 2020-10-12 2021-07-13 동국대학교 산학협력단 솔루션 기반 데이터 분석 및 예측 장치 및 동작 방법
KR20230013540A (ko) * 2021-07-19 2023-01-26 (주)복지이십사 머신러닝 기반 비대면 복지 신청 서비스 제공 방법 및 시스템

Similar Documents

Publication Publication Date Title
CN111026842B (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
US11429405B2 (en) Method and apparatus for providing personalized self-help experience
US11238132B2 (en) Method and system for using existing models in connection with new model development
Misaghian et al. An approach for requirements prioritization based on tensor decomposition
CN111625715B (zh) 信息提取方法、装置、电子设备及存储介质
CN112257841A (zh) 图神经网络中的数据处理方法、装置、设备及存储介质
US20230334286A1 (en) Machine-learning method and system to optimize health-care resources using doctor-interpretable entity profiles
Seret et al. A new knowledge-based constrained clustering approach: Theory and application in direct marketing
CN110377733A (zh) 一种基于文本的情绪识别方法、终端设备及介质
Bawack et al. Where information systems research meets artificial intelligence practice: towards the development of an AI capability framework
CN117494051A (zh) 一种分类处理的方法、模型训练的方法以及相关装置
Sirbu et al. Multimodal semi-supervised learning for disaster tweet classification
CN113342944B (zh) 一种语料泛化方法、装置、设备及存储介质
Mawane et al. A cluster validity for optimal configuration of Kohonen maps in e-learning recommendation
KR102649918B1 (ko) 대규모 언어 모델 기반 맞춤형 복지 정책 추천 시스템
KR102039292B1 (ko) 키워드 기반 질의응답 도출방법, 장치 및 프로그램
CN114065767B (zh) 一种威胁情报的分类及演化关系分析方法
US20230134798A1 (en) Reasonable language model learning for text generation from a knowledge graph
JP2022075642A (ja) 説明可能な予測に基づく共同議論のための討論者システム
CN111615178B (zh) 识别无线网络类型及模型训练的方法、装置及电子设备
KR102072940B1 (ko) 설문조사 기반 자동 기사 생성을 위한 방법 및 시스템
KR102039294B1 (ko) 인공지능 기반 질의 응답을 통한 포상관광지 획득 방법, 장치 및 프로그램
CN113761837B (zh) 实体关系类型确定方法、装置和设备及存储介质
CN114328797B (zh) 内容搜索方法、装置、电子设备、存储介质及程序产品
JP7385077B1 (ja) 検索支援システム、検索支援方法及びプログラム

Legal Events

Date Code Title Description
GRNT Written decision to grant