KR102571826B1 - 사용자의 검색 정보에 기초하여 웹 페이지를 추천하는 방법, 장치, 및 시스템 - Google Patents

사용자의 검색 정보에 기초하여 웹 페이지를 추천하는 방법, 장치, 및 시스템 Download PDF

Info

Publication number
KR102571826B1
KR102571826B1 KR1020220086667A KR20220086667A KR102571826B1 KR 102571826 B1 KR102571826 B1 KR 102571826B1 KR 1020220086667 A KR1020220086667 A KR 1020220086667A KR 20220086667 A KR20220086667 A KR 20220086667A KR 102571826 B1 KR102571826 B1 KR 102571826B1
Authority
KR
South Korea
Prior art keywords
webpage
candidate
question
group
classification
Prior art date
Application number
KR1020220086667A
Other languages
English (en)
Inventor
노현빈
최태영
Original Assignee
(주)뤼이드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)뤼이드 filed Critical (주)뤼이드
Priority to KR1020220086667A priority Critical patent/KR102571826B1/ko
Priority to US18/352,361 priority patent/US20240020346A1/en
Application granted granted Critical
Publication of KR102571826B1 publication Critical patent/KR102571826B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)

Abstract

본 출원의 일 실시예에 따른 교육 컨텐츠 추천 방법은, 사용자의 검색 정보를 획득하는 단계; 상기 검색 정보에 기초하여 후보 웹페이지 세트를 획득하는 단계; 상기 후보 웹페이지 세트에 포함된 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하는 단계; 상기 분류 결과에 기초하여 대상 웹페이지를 결정하는 단계; 및 상기 결정된 대상 웹페이지를 송신하는 단계;를 포함한다.

Description

사용자의 검색 정보에 기초하여 웹 페이지를 추천하는 방법, 장치, 및 시스템{METHOD FOR, DEVICE FOR, AND SYSTEM FOR RECOMMENDING AN WEB PAGE BASED ON A SEARCH INFORMATION OF AN USER}
본 출원은 교육 컨텐츠 추천 방법, 교육 컨텐츠 추천 장치 및 교육 컨텐츠 추천 시스템에 관한 것이다. 구체적으로 본 출원은 사용자의 검색 정보에 기반하여 교육 컨텐츠를 추천하기 위한 교육 컨텐츠 추천 방법, 교육 컨텐츠 추천 장치 및 교육 컨텐츠 추천 시스템에 관한 것이다.
인공 지능 기술이 발전하면서 사용자의 학습 실력을 진단하고, 진단 결과에 기반하여 교육 컨텐츠를 추천하는 교육 기술 분야가 주목받고 있다. 특히 사용자의 이해도를 고려하여 사용자에게 최적의 풀이 컨텐츠나 웹페이지를 제공하는 기술이 요구되고 있다.
그러나 종래의 기술들은 문제에 대응되는 풀이만을 제공하거나 사용자의 검색 정보에 기초하여 '신뢰도'가 높은 웹페이지만을 선별하는 데에 목적을 두고 있었다. 또한 사용자의 검색 정보에 기초하여 사용자의 학습 능력 정보를 연산하기 위한 신경망 모델을 훈련시켜 학습 능력 정보를 연산하고, 이에 기반하여 교육 컨텐츠를 추천하는 기술이 연구되고 있으나, 사용자의 검색 정보에 기반하여 사용자의 학습 능력 정보를 연산하기 위한 신경망 모델을 구축하는 것은 막대한 비용과 시간이 소요되며 난이도가 높다는 측면에서 현실적인 제약이 존재하는 실정이다.
이에, 사용자의 검색 정보에 대응하여 최적의 교육 컨텐츠를 사용자에게 제공하기 위한 새로운 교육 컨텐츠 추천 방법 및 장치의 개발이 요구된다.
삭제
(특허문헌 1) 대한민국 공개특허공보 제10-2020-0119358호 (2020년 10월 20일)
본 발명이 해결하고자 하는 일 과제는, 사용자의 검색 정보와 관련성이 높은 교육 컨텐츠를 결정하기 위한 교육 컨텐츠 추천 방법, 교육 컨텐츠 추천 장치 및 교육 컨텐츠 추천 시스템을 제공하는 것이다.
본 발명이 해결하고자 하는 과제가 상술한 과제로 제한되는 것은 아니며, 언급되지 아니한 과제들은 본 명세서 및 첨부된 도면으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 방법은, 사용자의 검색 정보를 획득하는 단계; 상기 검색 정보에 기초하여 후보 웹페이지 세트를 획득하는 단계; 상기 후보 웹페이지 세트에 포함된 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하는 단계; 상기 분류 결과에 기초하여 대상 웹페이지를 결정하는 단계; 및 상기 결정된 대상 웹페이지를 송신하는 단계;를 포함하되, 상기 제1 웹페이지 군 및 상기 제2 웹페이지 군으로 분류하는 단계는, 언어 모델을 통하여 상기 후보 웹페이지들의 컨텐츠를 분석하는 단계; 상기 분석 결과에 따라 제1 분류 질문을 생성하는 단계; 및 상기 생성된 제1 분류 질문에 기초하여 상기 후보 웹페이지들을 상기 제1 웹페이지 군 및 상기 제2 웹페이지 군으로 분류하는 단계:를 더 포함할 수 있다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치는, 상기 사용자 단말기와 통신하는 송수신부; 및 상기 송수신부를 통하여 사용자의 검색 정보를 획득하고, 상기 검색 정보에 기초하여 대상 웹 페이지를 결정하도록 구성된 컨트롤러;를 포함하되, 상기 컨트롤러는, 사용자의 검색 정보를 획득하고, 상기 검색 정보에 기초하여 후보 웹페이지 세트를 획득하고, 상기 후보 웹페이지 세트에 포함된 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하고, 상기 분류 결과에 기초하여 대상 웹페이지를 결정하고, 상기 결정된 대상 웹페이지를 송신하도록 구성되되, 상기 컨트롤러는, 상기 제1 웹페이지 군 및 상기 제2 웹페이지 군으로 분류하는 단계는, 언어 모델을 통하여 상기 후보 웹페이지들의 컨텐츠를 분석하고, 상기 분석 결과에 따라 분류 질문을 생성하고, 상기 생성된 분류 질문에 기초하여 상기 후보 웹페이지들을 상기 제1 웹페이지 군 및 상기 제2 웹페이지 군으로 분류하도록 구성될 수 있다.
본 발명의 과제의 해결 수단이 상술한 해결 수단들로 제한되는 것은 아니며, 언급되지 아니한 해결 수단들은 본 명세서 및 첨부된 도면으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 방법 및 교육 컨텐츠 추천 장치에 따르면, 사용자의 검색 정보에 대하여 관련성이 높은 컨텐츠를 포함하거나 사용자의 이해도와 가장 적합한 컨텐츠를 포함하는 대상 웹페이지를 선별할 수 있는 효과를 제공할 수 있다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 방법 및 교육 컨텐츠 추천 장치에 따르면, 분류 질문을 생성하여 사용자에게 적합한 대상 웹페이지를 신속하게 획득할 수 있다.
본 발명의 효과가 상술한 효과들로 제한되는 것은 아니며, 언급되지 아니한 효과들은 본 명세서 및 첨부된 도면으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확히 이해될 수 있을 것이다.
도 1은 본 출원의 일 실시예에 따른 교육 컨텐츠 추천 시스템의 개략도이다.
도 2는 본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치의 동작들을 도시한 도면이다.
도 3은 본 출원의 일 실시예에 따른 교육 컨텐츠 추천 방법을 도시한 순서도이다.
도 4는 본 출원의 일 실시예에 따른 S3000 단계를 구체화한 순서도이다.
도 5는 본 출원의 일 실시예에 따른 후보 웹페이지들을 분류하는 일 양상을 도시한 도면이다.
도 6은 본 출원의 일 실시예에 따른 S3200 단계를 구체화한 순서도이다.
도 7은 본 출원의 일 실시예에 따른 지니 지수에 기초하여 분류 질문을 생성하는 일 양상을 도시한 도면이다.
도 8은 본 출원의 일 실시예에 따른 S3300 단계를 구체화한 순서도이다.
도 9은 본 출원의 일 실시예에 따른 넥스트 토큰 프리딕션(Next token prediction)을 통하여 후보 웹페이지들을 분류하는 일 양상을 도시한 도면이다.
본 출원의 상술한 목적, 특징들 및 장점은 첨부된 도면과 관련된 다음의 상세한 설명을 통해 보다 분명해질 것이다. 다만, 본 출원은 다양한 변경을 가할 수 있고 여러 가지 실시예들을 가질 수 있는 바, 이하에서는 특정 실시예들을 도면에 예시하고 이를 상세히 설명하고자 한다.
명세서 전체에 걸쳐서 동일한 참조번호들은 원칙적으로 동일한 구성요소들을 나타낸다. 또한, 각 실시예의 도면에 나타나는 동일한 사상의 범위 내의 기능이 동일한 구성요소는 동일한 참조부호를 사용하여 설명하며, 이에 대한 중복되는 설명은 생략하기로 한다.
본 출원과 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 출원의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자(예를 들어, 제1, 제2 등)는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다.
또한, 이하의 실시예에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다.
이하의 실시예에서, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
이하의 실시예에서, 포함하다 또는 가지다 등의 용어는 명세서상에 기재된 특징, 또는 구성요소가 존재함을 의미하는 것이고, 하나 이상의 다른 특징들 또는 구성요소가 부가될 가능성을 미리 배제하는 것은 아니다.
도면에서는 설명의 편의를 위하여 구성 요소들이 그 크기가 과장 또는 축소될 수 있다. 예컨대, 도면에서 나타난 각 구성의 크기 및 두께는 설명의 편의를 위해 임의로 나타낸 것으로, 본 발명이 반드시 도시된 바에 한정되지 않는다.
어떤 실시예가 달리 구현 가능한 경우에 특정한 프로세스의 순서는 설명되는 순서와 다르게 수행될 수도 있다. 예를 들어, 연속하여 설명되는 두 프로세스가 실질적으로 동시에 수행될 수도 있고, 설명되는 순서와 반대의 순서로 진행될 수 있다.
이하의 실시예에서, 구성 요소 등이 연결되었다고 할 때, 구성 요소들이 직접적으로 연결된 경우뿐만 아니라 구성요소들 중간에 구성 요소들이 개재되어 간접적으로 연결된 경우도 포함한다.
예컨대, 본 명세서에서 구성 요소 등이 전기적으로 연결되었다고 할 때, 구성 요소 등이 직접 전기적으로 연결된 경우뿐만 아니라, 그 중간에 구성 요소 등이 개재되어 간접적으로 전기적 연결된 경우도 포함한다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 방법은, 사용자의 검색 정보를 획득하는 단계; 상기 검색 정보에 기초하여 후보 웹페이지 세트를 획득하는 단계; 상기 후보 웹페이지 세트에 포함된 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하는 단계; 상기 분류 결과에 기초하여 대상 웹페이지를 결정하는 단계; 및 상기 결정된 대상 웹페이지를 송신하는 단계;를 포함하되, 상기 제1 웹페이지 군 및 상기 제2 웹페이지 군으로 분류하는 단계는, 언어 모델을 통하여 상기 후보 웹페이지들의 컨텐츠를 분석하는 단계; 상기 분석 결과에 따라 제1 분류 질문을 생성하는 단계; 및 상기 생성된 제1 분류 질문에 기초하여 상기 후보 웹페이지들을 상기 제1 웹페이지 군 및 상기 제2 웹페이지 군으로 분류하는 단계:를 더 포함할 수 있다.
본 출원의 일 실시예에 따르면, 상기 제1 분류 질문은, 상기 제1 웹페이지 군으로 분류될 후보 웹페이지의 수와 상기 제2 웹페이지 군으로 분류될 후보 웹페이지 수의 차이가 최소가 되도록 생성된 질문일 수 있다.
본 출원의 일 실시예에 따르면, 상기 제1 분류 질문을 생성하는 단계는, 상기 분석 결과에 기초하여 제1 질문을 생성하고, 상기 후보 웹페이지의 컨텐츠에 기초하여 상기 후보 웹페이지 세트에 포함된 후보 웹페이지들과 상기 제1 질문 간의 제1 지니 지수를 획득하는 단계; 상기 분석 결과에 기초하여 제2 질문을 생성하고, 상기 후보 웹페이지의 컨텐츠에 기초하여 상기 후보 웹페이지 세트에 포함된 후보 웹페이지들과 상기 제2 질문 간의 제2 지니 지수를 획득하는 단계; 및 상기 제1 지니 지수와 상기 제2 지니 지수를 비교하고, 비교 결과에 기초하여 상기 제1 질문과 상기 제2 질문 중 어느 하나를 상기 제1 분류 질문으로 결정하는 단계;를 더 포함할 수 있다.
본 출원의 일 실시예에 따르면, 상기 제1 분류 질문으로 결정하는 단계는, 상기 제1 지니 지수와 상기 제2 지니 지수 중에서 더 큰 값을 가지는 지니 지수에 대응되는 질문을 상기 제1 분류 질문으로 결정하는 단계;를 더 포함할 수 있다.
본 출원의 일 실시예에 따르면, 상기 생성된 제1 분류 질문에 기초하여 상기 후보 웹페이지들을 상기 제1 웹페이지 군 및 상기 제2 웹페이지 군으로 분류하는 단계는, 넥스트 토큰 프리딕션(Next token prediction)을 통하여 상기 후보 웹페이지의 컨텐츠가 상기 생성된 제1 분류 질문에 해당하는지 여부를 연산하는 단계; 및 상기 후보 웹페이지의 컨텐츠가 상기 생성된 제1 분류 질문에 해당하는 경우에는 상기 후보 웹페이지를 상기 제1 웹페이지 군으로 분류하고, 상기 후보 웹페이지의 컨텐츠가 상기 생성된 제1 분류 질문에 해당하지 않는 경우에는 상기 후보 웹페이지를 상기 제2 웹페이지 군으로 분류하는 단계;를 더 포함할 수 있다.
본 출원의 일 실시예에 따르면, 상기 분류 결과에 기초하여 대상 웹페이지를 결정하는 단계는, 상기 제1 웹페이지 군에 포함된 후보 웹페이지의 컨텐츠의 분석 결과에 따라 제2 분류 질문을 생성하는 단계; 상기 생성된 제2 분류 질문에 기초하여 상기 제1 웹페이지 군에 포함된 후보 웹페이지들을 제3 웹페이지 군 및 제4 웹페이지 군으로 분류하는 단계; 및 상기 분류 결과에 기초하여 상기 제3 웹페이지 군 및 상기 제4 웹페이지 군 중 어느 하나의 군에 포함된 후보 웹페이지를 상기 대상 웹페이지로 결정하는 단계;를 더 포함할 수 있다.
본 출원의 일 실시예에 따르면, 상기 제2 분류 질문은, 상기 제3 웹페이지 군으로 분류될 후보 웹페이지의 수와 상기 제4 웹페이지 군으로 분류될 후보 웹페이지 수의 차이가 최소가 되도록 생성된 질문일 수 있다.
본 출원의 일 실시예에 따르면, 상기 교육 컨텐츠 추천 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체가 제공될 수 있다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치는, 상기 사용자 단말기와 통신하는 송수신부; 및 상기 송수신부를 통하여 사용자의 검색 정보를 획득하고, 상기 검색 정보에 기초하여 대상 웹 페이지를 결정하도록 구성된 컨트롤러;를 포함하되, 상기 컨트롤러는, 사용자의 검색 정보를 획득하고, 상기 검색 정보에 기초하여 후보 웹페이지 세트를 획득하고, 상기 후보 웹페이지 세트에 포함된 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하고, 상기 분류 결과에 기초하여 대상 웹페이지를 결정하고, 상기 결정된 대상 웹페이지를 송신하도록 구성되되, 상기 컨트롤러는, 상기 제1 웹페이지 군 및 상기 제2 웹페이지 군으로 분류하는 단계는, 언어 모델을 통하여 상기 후보 웹페이지들의 컨텐츠를 분석하고, 상기 분석 결과에 따라 분류 질문을 생성하고, 상기 생성된 분류 질문에 기초하여 상기 후보 웹페이지들을 상기 제1 웹페이지 군 및 상기 제2 웹페이지 군으로 분류하도록 구성될 수 있다.
이하에서는 도 1 내지 도 9를 참고하여 본 출원의 실시예들에 따른 교육 컨텐츠 추천 방법, 교육 컨텐츠 추천 장치, 및 교육 컨텐츠 추천 시스템에 관하여 설명한다.
도 1은 본 출원의 일 실시예에 따른 교육 컨텐츠 추천 시스템(10)의 개략도이다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 시스템(10)은 사용자 단말(100) 및 교육 컨텐츠 추천 장치(1000)를 포함할 수 있다.
사용자 단말(100)은 교육 컨텐츠 추천 장치(1000) 혹은 임의의 외부장치로부터 문제 데이터베이스를 획득할 수 있다. 예를 들어, 사용자 단말(100)은 문제 데이터베이스에 포함된 일부 문제를 수신하고, 수신한 문제들을 사용자에게 디스플레이할 수 있다. 이어 사용자는 제시된 문제에 대한 응답을 사용자 단말(100)에 입력할 수 있다. 사용자 단말(100)은 사용자의 응답에 기초하여 학습 데이터를 획득하고, 사용자의 학습 데이터를 교육 컨텐츠 추천 장치(1000)로 송신할 수 있다. 여기서, 학습 데이터란, 사용자가 풀이한 문제 식별 정보, 이에 대한 사용자의 응답 정보 및/또는 정오답 정보 등을 포괄하는 의미일 수 있다. 한편, 사용자 단말(100)은 사용자의 식별 정보를 교육 컨텐츠 추천 장치(1000)로 송신할 수 있다.
또한, 사용자 단말(100)은 사용자의 검색 정보를 획득하고, 사용자의 검색 정보를 교육 컨텐츠 추천 장치(1000)로 송신할 수 있다. 여기서, 검색 정보란, 사용자의 검색과 관련된 로그 데이터, 검색과 관련된 문제 식별 정보, 검색 쿼리, 및 검색 쿼리로부터 유래된 임의의 유형의 정보를 포괄하는 의미일 수 있다. 로그 데이터는 검색이 수행된 시간 데이터 및 검색 결과의 열람 시간 데이터 등을 포함할 수 있다. 문제 식별 정보는 사용자가 검색한 문제를 나타내는 임의의 정보를 포괄하는 의미일 수 있다.
또한, 사용자 단말(100)은 교육 컨텐츠 추천 장치(1000)로부터 분류 질문을 수신할 수 있다. 이때, 사용자 단말(100)은 분류 질문에 대한 사용자의 응답을 획득하고, 사용자의 응답을 교육 컨텐츠 추천 장치(1000)로 송신할 수 있다. 나아가 사용자 단말(100)은 교육 컨텐츠 추천 장치(1000)로부터 추천 컨텐츠를 수신하고, 수신된 추천 컨텐츠를 사용자에게 디스플레이할 수 있다. 여기서 추천 컨텐츠란 교육과 관련된 웹 페이지, 검색과 관련된 문제에 대한 풀이, 및 추천 문제 등 검색 정보에 기반하여 획득된 임의의 교육과 관련된 컨텐츠를 의미할 수 있다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치(1000)는 송수신부(1100), 메모리(1200) 및 컨트롤러(1300)를 포함할 수 있다.
송수신부(1100)는 사용자 단말(100)을 포함한 임의의 외부 기기와 통신을 수행할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 송수신부(1100)를 통해, 사용자 단말(100)로부터 사용자의 학습 데이터, 사용자 식별 정보 및/또는 검색 정보를 수신하거나 분류 질문과 추천 컨텐츠를 사용자 단말(100)로 송신할 수 있다.
교육 컨텐츠 추천 장치(1000)는, 송수신부(1100)를 통해 네트워크에 접속하여 각종 데이터를 송수신할 수 있다. 송수신부(1100)는 크게 유선 타입과 무선 타입을 포함할 수 있다. 유선 타입과 무선 타입은 각각의 장단점을 가지므로, 경우에 따라서 교육 컨텐츠 추천 장치(1000)에는 유선 타입과 무선 타입이 동시에 마련될 수도 있다. 여기서, 무선 타입의 경우에는 주로 와이파이(Wi-Fi) 같은 WLAN(Wireless Local Area Network) 계열의 통신 방식을 이용할 수 있다. 또는, 무선 타입의 경우에는 셀룰러 통신, 예컨대, LTE, 5G 계열의 통신 방식을 이용할 수 있다. 다만, 무선 통신 프로토콜이 상술한 예시에 제한되는 것은 아니며, 임의의 적절한 무선 타입의 통신 방식을 이용하는 것도 가능하다. 유선 타입의 경우에는 LAN(Local Area Network)이나 USB(Universal Serial Bus) 통신이 대표적인 예이며 그 외의 다른 방식도 가능하다.
메모리(1200)는 각종 정보를 저장할 수 있다. 메모리(1200)에는 각종 데이터가 임시적으로 또는 반영구적으로 저장될 수 있다. 메모리(1200)의 예로는 하드 디스크(HDD: Hard Disk Drive), SSD(Solid State Drive), 플래쉬 메모리(flash memory), 롬(ROM: Read-Only Memory), 램(RAM: Random Access Memory) 등이 있을 수 있다. 메모리(1200)는 교육 컨텐츠 추천 장치(1000)에 내장되는 형태나 탈부착 가능한 형태로 제공될 수 있다. 메모리(1200)에는 교육 컨텐츠 추천 장치(1000)를 구동하기 위한 운용 프로그램(OS: Operating System)이나 교육 컨텐츠 추천 장치(1000)의 각 구성을 동작시키기 위한 프로그램을 비롯해 교육 컨텐츠 추천 장치(1000)의 동작에 필요한 각종 데이터가 저장될 수 있다.
컨트롤러(1300)는 교육 컨텐츠 추천 장치(1000)의 전반적인 동작을 제어할 수 있다. 예컨대, 컨트롤러(1300)는 후술할 사용자의 검색 정보를 획득하는 동작, 후보 웹페이지 세트를 획득하는 동작, 후보 웹페이지 세트에 포함된 후보 웹페이지들을 분류하는 동작, 분류 결과에 기초하여 대상 웹페이지를 결정하는 동작 등을 포함하여 교육 컨텐츠 추천 장치(1000)의 전반적인 동작을 제어할 수 있다. 구체적으로 컨트롤러(1300)는 메모리(1200)로부터 교육 컨텐츠 추천 장치(1000)의 전반적인 동작을 위한 프로그램을 로딩하여 실행할 수 있다. 컨트롤러(1300)는 하드웨어나 소프트웨어 또는 이들의 조합에 따라 AP(Application Processor), CPU(Central Processing Unit)나 이와 유사한 장치로 구현될 수 있다. 이때, 하드웨어적으로는 전기적 신호를 처리하여 제어 기능을 수행하는 전자 회로 형태로 제공될 수 있으며, 소프트웨어적으로는 하드웨어적 회로를 구동시키는 프로그램이나 코드 형태로 제공될 수 있다.
이하에서는 도 2 내지 도 9를 참고하여 본 출원의 실시예들에 따른 교육 컨텐츠 추천 장치(1000)의 동작과 교육 컨텐츠 추천 방법에 대하여 구체적으로 서술한다.
도 2는 본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치(1000)의 동작들을 도시한 도면이다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치(1000)는 송수신부(1100)를 통하여 사용자의 검색 정보를 획득할 수 있다. 여기서, 검색 정보란, 사용자의 검색과 관련된 로그 데이터, 검색과 관련된 문제 식별 정보, 검색 쿼리, 및 검색 쿼리로부터 유래된 임의의 유형의 정보를 포괄하는 의미일 수 있다. 구체적으로 교육 컨텐츠 추천 장치(1000)는 사용자 단말(100)로부터 사용자 단말(100)에 입력된 사용자의 검색 정보를 획득할 수 있다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치(1000)는, 송수신부(1100)를 통하여 복수의 후보 웹페이지들을 포함하는 후보 웹페이지 세트를 획득할 수 있다. 구체적으로 교육 컨텐츠 추천 장치(1000)는 데이터베이스에 저장된 복수의 후보 웹페이지들을 포함하는 후보 웹페이지 세트를 획득할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 사용자의 검색 정보에 기초하여 후보 웹페이지 세트를 획득할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 사용자의 검색 정보에 기반하여 데이터베이스를 검색하여 사용자의 검색 정보와 관련된 컨텐츠를 포함하는 후보 웹페이지들을 포함하는 후보 웹페이지 세트를 획득할 수 있다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치(1000)는, 후보 웹페이지 세트에 포함된 후보 웹페이지들을 분류하는 동작을 수행할 수 있다. 구체적으로 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지에 포함된 컨텐츠를 분석하고, 분석 결과에 기반하여 분류 질문을 생성하고, 생성된 분류 질문에 기초하여 후보 웹페이지들을 제1 웹페이지 군과 제2 웹페이지 군으로 분류할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 언어 모델(language model)을 통하여 후보 웹페이지의 컨텐츠를 분석하고, 분석 결과에 기초하여 분류 질문을 생성할 수 있다. 여기서, 분류 질문은 제1 웹페이지 군으로 분류될 후보 웹페이지의 수와 제2 웹페이지 군으로 분류될 후보 웹페이수의 수의 차이가 최소가 되도록 생성된 질문일 수 있다. 또는 분류 질문은 제1 웹페이지 군으로 분류될 후보 웹페이지의 수와 제2 웹페이지 군으로 분류될 후보 웹페이수의 수의 차이가 미리 결정된 값 이내가 되도록 생성된 질문일 수 있다. 분류 질문을 생성하는 내용에 대하여는 도 6 및 도 7과 관련하여 보다 구체적으로 서술하기로 한다.
이때, 교육 컨텐츠 추천 장치(1000)는 분류 질문에 기초하여 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류할 수 있다. 구체적으로, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지의 컨텐츠가 생성된 분류 질문에 해당하는지 여부를 연산하고, 연산 결과에 기초하여 후보 웹페이지 세트에 포함된 후보 웹페이지들을 제1 웹페이지 군과 제2 웹페이지 군으로 분류할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 넥스트 토큰 프리딕션(next token prediction)을 통하여 후보 웹페이지의 컨텐츠가 분류 질문에 해당하는 지 여부를 연산하거나 판단하도록 구현될 수 있다. 넥스트 토큰 프리딕션이란, 제1 정보가 주어졌을 때, 제2 정보가 제1 정보의 다음 정보일 확률을 예측하기 위한 임의의 알고리즘을 포괄하는 의미일 수 있다. 이때, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지의 컨텐츠가 분류 질문에 해당하거나 관련되는 경우에는 후보 웹페이지를 제1 웹페이지 군으로 분류하고, 후보 웹페이지의 컨텐츠가 분류 질문에 해당하지 않거나 관련되지 않는 경우에는 후보 웹페이지를 제1 웹페이지 군이 아닌 제2 웹페이지 군으로 분류하도록 구성될 수 있다. 넥스트 토큰 프리딕션을 이용하여 후보 웹 페이지들을 분류하는 내용에 대하여는 도 8 및 도 9과 관련하여 보다 구체적으로 서술하기로 한다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치(1000)는 분류 결과에 기초하여 후보 웹페이지 세트로부터 대상 웹페이지를 결정할 수 있다.
일 예로 교육 컨텐츠 추천 장치(1000)는 전술한 분류 질문을 생성하고 분류 질문에 기초하여 후보 웹페이지들을 분류하는 동작을 복수 회 반복하여 대상 웹페이지를 결정할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 제1 분류 질문을 생성하고 생성된 제1 분류 질문을 이용하여 후보 웹페이지의 컨텐츠가 제1 분류 질문과 관련성이 있는지 여부에 따라 후보 웹페이지들을 제1 웹페이지 군과 제2 웹페이지 군으로 분류할 수 있다. 이때, 교육 컨텐츠 추천 장치(1000)는 제2 분류 질문을 생성하고, 제1 웹페이지 군(또는 제2 웹페이지 군)으로 분류된 후보 웹페이지들을 제3 웹페이지 군과 제4 웹페이지 군으로 분류할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 넥스트 토큰 프리딕션을 통하여 후보 웹페이지의 컨텐츠가 제2 분류 질문에 해당하는 지 여부를 예측하거나 연산하여, 후보 웹페이지들을 제3 웹페이지 군과 제4 웹페이지 군으로 분류할 수 있다. 교육 컨텐츠 추천 장치(1000)는 이러한 후보 웹페이지들을 분류하는 동작을 복수 회 반복하여 수행하도록 구성될 수 있으며, 이때, 교육 컨텐츠 추천 장치(1000)는 분류 결과에 기초하여 대상 웹페이지를 결정할 수 있다. 이를 통하여 본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치(1000)는 사용자의 검색 정보에 대하여 관련성이 높은 컨텐츠를 포함하거나 사용자의 검색 정보에 최적의 컨텐츠를 포함하는 대상 웹페이지를 선별할 수 있는 효과를 제공할 수 있다.
한편, 본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치(1000)는 송수신부(1100)를 통하여 결정된 대상 웹페이지를 사용자 단말(100)을 포함한 임의의 외부 장치(혹은 임의의 외부 서버)로 송신하는 동작을 수행할 수 있다.
이하에서는 도 3 내지 도 9를 참고하여 본 출원의 일 실시예에 따른 교육 컨텐츠 추천 방법에 대하여 보다 구체적으로 서술하기로 한다. 본 출원의 일 실시예에 따른 교육 컨텐츠 추천 방법은 교육 컨텐츠 추천 장치(1000)에 의하여 수행될 수 있다. 교육 컨텐츠 추천 방법을 설명함에 있어서, 앞서 설명한 내용과 중복되는 일부 실시예는 생략될 수 있으나, 이는 설명의 편의를 위한 것일 뿐이며, 제한적으로 해석되어서는 아니된다.
도 3은 본 출원의 일 실시예에 따른 교육 컨텐츠 추천 방법을 도시한 순서도이다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 방법은 사용자의 검색 정보를 획득하는 단계(S1000), 후보 웹페이지 세트를 획득하는 단계(S2000), 후보 웹페이지 세트에 포함된 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하는 단계(S3000), 분류 결과에 기초하여 대상 웹페이지를 결정하는 단계(S4000), 및 결정된 대상 웹페이지를 송신하는 단계(S5000)를 포함할 수 있다.
사용자의 검색 정보를 획득하는 단계(S1000)에서는, 교육 컨텐츠 추천 장치(1000)는 송수신부(1100)를 통하여 사용자의 검색 정보를 획득할 수 있다. 여기서, 검색 정보란, 사용자의 검색과 관련된 로그 데이터, 검색과 관련된 문제 식별 정보, 검색 쿼리, 및 검색 쿼리로부터 유래된 임의의 유형의 정보를 포괄하는 의미일 수 있다. 구체적으로 교육 컨텐츠 추천 장치(1000)는 사용자 단말(100)로부터 사용자 단말(100)에 입력된 사용자의 검색 정보를 획득할 수 있다.
후보 웹페이지 세트를 획득하는 단계(S2000)에서는, 교육 컨텐츠 추천 장치(1000)는 송수신부(1100)를 통하여 복수의 후보 웹페이지들을 포함하는 후보 웹페이지 세트를 획득할 수 있다. 구체적으로 교육 컨텐츠 추천 장치(1000)는 데이터베이스로부터 복수의 후보 웹페이지들을 포함하는 후보 웹페이지 세트를 획득할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 사용자의 검색 정보에 기반하여 데이터베이스를 검색하여 사용자의 검색 정보와 관련된 컨텐츠를 포함하는 후보 웹페이지들로 구성된 후보 웹페이지 세트를 획득할 수 있다.
후보 웹페이지 세트에 포함된 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하는 단계(S3000)에서는, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지 세트에 포함된 후보 웹페이지의 컨텐츠를 분석할 수 있다. 나아가 후보 웹페이지 세트에 포함된 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하는 단계(S3000)에서는, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지의 컨텐츠의 분석 결과에 기반하여 분류 질문을 생성하고, 분류 질문에 기초하여 후보 웹페이지들을 제1 웹페이지 군과 제2 웹페이지 군으로 분류할 수 있다.
구체적으로 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지에 포함된 컨텐츠에 기반하여 복수의 질문을 생성하고, 후보 웹페이지들과 각 질문 간의 지니 지수(gini index)를 획득하고, 지니 지수를 비교하여 복수의 질문들 중에서 분류 질문을 결정할 수 있다. 지니 지수란, 목표 라벨이 아닌 다른 라벨이 선택될 확률을 정량화한 지수로서 지니 지수가 1에 가까울수록 목표 라벨이 선택될 확률과 다른 라벨이 선택될 확률이 동일해짐을 의미한다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지들에 포함된 각 컨텐츠에 기반하여 제1 질문과 제2 질문을 포함한 복수의 질문을 생성할 수 있다. 이때, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지들과 제1 질문과의 제1 지니 지수와 후보 웹페이지들과 제2 질문과의 제2 지니 지수를 획득하고, 제1 지니 지수와 제2 지니 지수를 비교하여 제1 질문과 제2 질문 중에서 분류 질문을 결정할 수 있다.
나아가, 교육 컨텐츠 추천 장치(1000)는 제1 웹페이지 군으로 분류될 후보 웹페이지의 수와 제2 웹페이지 군으로 분류될 후보 웹페이지의 수의 차이가 최소가 되도록(예컨대, 제1 웹페이지 군으로 분류될 후보 웹페이지의 수와 제2 웹페이지 군으로 분류될 후보 웹페이지의 수의 차이가 실질적으로 동일하도록) 분류 질문을 생성할 수 있다.
이때, 교육 컨텐츠 추천 장치(1000)는 생성된 분류 질문에 기초하여 후보 웹페이지들을 제1 웹페이지 군과 제2 웹페이지 군으로 분류할 수 있다. 구체적으로 교육 컨텐츠 추천 장치(1000)는 넥스트 토큰 프리딕션 알고리즘을 통하여 후보 웹페이지에 포함된 컨텐츠가 분류 질문에 해당하는지 여부 또는 후보 웹페이지에 포함된 컨텐츠가 분류 질문에 해당할 확률을 연산하고, 연산 결과에 기초하여 후보 웹페이지들을 제1 웹페이지 군과 제2 웹페이지 군으로 분류할 수 있다.
후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하는 단계(S3000)에 대하여는 도 4 내지 도 9를 참고하여 보다 자세하게 서술하기로 한다.
분류 결과에 기초하여 대상 웹페이지를 결정하는 단계(S4000)에서는, 교육 컨텐츠 추천 장치(1000)는 S3000 단계에서의 후보 웹페이지들의 분류 결과에 기초하여 사용자에게 추천할 교육 컨텐츠인 대상 웹페이지를 결정하거나 선택할 수 있다.
한편 도 3에서는 도시하지는 않았지만 본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치(1000)는 전술한 분류 질문을 생성하고, 생성된 분류 질문에 기초하여 후보 웹페이지들을 분류하는 동작을 복수 회 반복하여 대상 웹페이지를 결정할 수 있다. 전술한 바와 같이, S3000 단계에서는, 교육 컨텐츠 추천 장치(1000)는 제1 분류 질문을 생성하고 생성된 제1 분류 질문을 이용하여 제1 웹페이지 군과 제2 웹페이지 군으로 분류할 수 있다. 이때, 교육 컨텐츠 추천 장치(1000)는 제1 웹페이지 군(또는 제2 웹페이지 군)에 포함된 후보 웹페이지의 컨텐츠의 분석 결과에 따라 추가적인 제2 분류 질문을 생성하고, 제1 웹페이지 군(또는 제2 웹페이지 군)으로 분류된 후보 웹페이지들을 제3 웹페이지 군과 제4 웹페이지 군으로 분류할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지의 컨텐츠에 기반하여 제3 질문과 제4 질문을 포함한 복수의 질문을 생성하고, 제3 질문과 분류된 후보 웹페이지의 컨텐츠 간의 제3 지니 지수 및 제4 질문과 분류된 후보 웹페이지의 컨텐츠 간의 제4 지니 지수를 획득하고, 제3 지니 지수와 제4 지니 지수를 비교하여 제3 질문과 제4 질문 중에서 제2 분류 질문을 결정할 수 있다.
나아가 교육 컨텐츠 추천 장치(1000)는 제2 분류 질문에 기초하여 분류된 후보 웹페이지들을 제3 웹페이지 군과 제4 웹페이지 군으로 추가적으로 분류할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 넥스트 토큰 프리딕션 알고리즘을 통하여 분류된 후보 웹페이지의 컨텐츠가 제2 분류 질문에 해당하는지 여부 또는 분류된 후보 웹페이지의 컨텐츠가 제2 분류 질문에 해당할 확률을 연산하고, 연산 결과에 기초하여 분류된 후보 웹페이지들을 제3 웹페이지 군과 제4 웹페이지 군으로 분류할 수 있다. 구체적으로 교육 컨텐츠 추천 장치(1000)는 제1 웹페이지 군(혹은 제2 웹페이지 군)으로 분류된 후보 웹페이지의 컨텐츠가 제2 분류 질문에 해당하는 경우에는 후보 웹페이지를 제3 웹페이지 군으로 분류하고, 제1 웹페이지 군(혹은 제2 웹페이지 군)으로 분류된 후보 웹페이지의 컨텐츠가 제2 분류 질문에 해당하지 않는 경우에는 후보 웹페이지를 제4 웹페이지 군으로 분류할 수 있다. 한편 제2 분류 질문은, 제1 분류 질문과 유사하게, 제3 웹페이지 군으로 분류될 후보 웹페이지의 수와 제4 웹페이지 군으로 분류될 후보 웹페이지 수의 차이가 최소가 되거나 미리 정해진 값 이내가 되도록, 생성된 질문인 것을 특징으로 할 수 있다.
즉 도 3에서는 도시하지는 않았지만, 본 출원의 일 실시예에 따른 분류 결과에 기초하여 대상 웹페이지를 결정하는 단계(S4000)는, 제1 웹페이지 군(또는 제2 웹페이지 군)에 포함된 후보 웹페이지의 컨텐츠의 분석 결과에 따라 제2 분류 질문을 생성하는 단계; 생성된 제2 분류 질문에 기초하여 제1 웹페이지 군에 포함된 후보 웹페이지들을 제3 웹페이지 군 및 제4 웹페이지 군으로 분류하는 단계; 및 분류 결과에 기초하여 제3 웹페이지 군 및 제4 웹페이지 군 중 어느 하나의 군에 포함된 후보 웹페이지를 대상 웹페이지로 결정하는 단계;를 더 포함할 수 있다.
결정된 대상 웹페이지를 송신하는 단계(S5000)에서는, 교육 컨텐츠 추천 장치(1000)는 송수신부(1100)를 통하여 결정된 대상 웹페이지를 사용자 단말(100)을 포함한 임의의 외부 장치(혹은 임의의 외부 서버)로 송신하는 동작을 수행할 수 있다.
이하에서는 도 4 내지 도 9를 참고하여 본 출원의 일 실시예에 따른 후보 웹페이지 세트에 포함된 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하는 단계(S3000)를 보다 구체적으로 설명하기로 한다.
도 4 및 도 5를 참고한다. 도 4는 본 출원의 일 실시예에 따른 S3000 단계를 구체화한 순서도이다. 도 5는 본 출원의 일 실시예에 따른 후보 웹페이지들을 분류하는 일 양상을 도시한 도면이다.
본 출원의 일 실시예에 따른 후보 웹페이지 세트에 포함된 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하는 단계(S3000)는 언어 모델(language model)을 통하여 후보 웹페이지들의 컨텐츠를 분석하는 단계(S3100), 제1 분류 질문을 생성하는 단계(S3200), 및 제1 분류 질문에 기초하여 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하는 단계(S3300)를 더 포함할 수 있다.
언어 모델(language model)을 통하여 후보 웹페이지들의 컨텐츠를 분석하는 단계(S3100)에서는, 교육 컨텐츠 추천 장치(1000)는 언어 모델(예컨대, GPT-3, BERT)을 통하여 후보 웹페이지들의 컨텐츠를 분석할 수 있다. 예컨대, 언어 모델은 후보 웹페이지에 포함된 컨텐츠의 데이터를 획득하고, 컨텐츠의 데이터에 기초하여 분석 결과를 출력할 수 있다. 이때, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지들의 컨텐츠의 분석 결과를 획득할 수 있다.
제1 분류 질문을 생성하는 단계(S3200)에서는, 교육 컨텐츠 추천 장치(1000)는 제1 분류 질문을 생성할 수 있다. 구체적으로 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지들을 분류하는 데 기준이 되는 제1 분류 질문을 생성할 수 있다. 일 예로, 교육 컨텐츠 추천 장치(1000)는 제1 웹페이지 군으로 분류될 후보 페이지의 수(예컨대, 도 5의 a 개)와 제2 웹페이지 군으로 분류된 후보 페이지의 수(예컨대, 도 5의 b 개)가 최소가 되도록(혹은 제1 웹페이지 군으로 분류될 후보 페이지의 수와 제2 웹페이지 군으로 분류된 후보 페이지의 수가 실질적으로 동일하도록) 제1 분류 질문을 생성하거나 그러한 제1 분류 질문을 생성하기 위한 인공지능 모델을 훈련시킬 수 있다.
일 예로, 교육 컨텐츠 추천 장치(1000)는 지니 지수를 이용하여 분류 질문을 생성하거나 결정할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지 세트에 포함된 후보 웹페이지의 컨텐츠 정보에 기반하여 제1 질문과 제2 질문을 포함하여 복수의 질문을 생성할 수 있다. 이때, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지 세트의 컨텐츠와 제1 질문 간의 제1 지니 지수와 후보 웹페이지 세트의 컨텐츠와 제2 질문 간의 제2 지니 지수를 획득할 수 있으며, 제1 지니 지수와 제2 지니 지수를 비교하고 비교 결과에 기초하여 제1 질문과 제2 질문 중에서 제1 분류 질문을 결정할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 제1 지니 지수와 제2 지니 지수를 비교하여 더 큰 값을 가지는 지니 지수에 대응되는 질문을 제1 분류 질문으로 결정할 수 있다.
일 예로, 교육 컨텐츠 추천 장치(1000)는 제1 분류 질문에 해당하는 컨텐츠를 포함하는 후보 페이지의 수(a개)와 제1 분류 질문에 해당하는 컨텐츠를 포함하지 않는 후보 페이지의 수(b개)의 차이가 최소가 되도록(혹은 제1 웹페이지 군으로 분류될 후보 페이지의 수와 제2 웹페이지 군으로 분류된 후보 페이지의 수가 실질적으로 동일하도록) 제1 분류 질문을 생성하거나 결정할 수 있다. 구체적으로 교육 컨텐츠 추천 장치(1000)는 제1 질문과 제2 질문을 생성하고, 전술한 넥스트 토큰 프리딕션 알고리즘을 통하여 후보 웹페이지 세트에 포함된 후보 웹페이지의 컨텐츠가 제1 질문에 해당되는지 여부와 후보 웹페이지 세트에 포함된 후보 웹페이지의 컨텐츠가 제2 질문에 해당되는지 여부를 연산할 수 있다. 이때, 교육 컨텐츠 추천 장치(1000)는 제1 질문에 해당하는 컨텐츠를 포함하는 후보 페이지의 수와 제1 질문에 해당하는 컨텐츠를 포함하지 않는 후보 페이지의 수의 제1 차이와 제2 질문에 해당하는 컨텐츠를 포함하는 후보 페이지의 수와 제2 질문에 해당하는 컨텐츠를 포함하지 않는 후보 페이지의 수의 제2 차이를 연산하고, 제1 차이와 제2 차이를 비교하여 더 작은 차이 값을 가지는 질문을 제1 분류 질문으로 결정할 수 있다.
다만 이는 예시에 불과하며, 교육 컨텐츠 추천 장치(1000)는 임의의 적절한 방법을 통하여 제1 웹페이지 군으로 분류될 후보 페이지의 수와 제2 웹페이지 군으로 분류된 후보 페이지의 수가 최소가 되도록 분류되기 위한 제1 분류 질문을 생성할 수 있을 것이다.
제1 분류 질문에 기초하여 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하는 단계(S3300)에서는, 교육 컨텐츠 추천 장치(1000)는 S3200 단계를 통하여 생성된 제1 분류 질문을 이용하여 후보 웹페이지들을 제1 웹페이지 군과 제2 웹페이지 군으로 분류할 수 있다.
일 예로, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지 컨텐츠의 분석 결과에 기초하여 후보 웹페이지의 컨텐츠가 제1 분류 질문에 해당하는 지 여부를 판단하거나 예측할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 넥스트 토큰 프리딕션(next token prediction) 알고리즘을 통하여 후보 웹페이지의 컨텐츠가 제1 분류 질문에 해당할 확률 또는 해당 여부를 연산할 수 있다. 이때, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지의 컨텐츠가 제1 분류 질문에 해당하는 경우에는 해당 후보 웹페이지를 제1 웹페이지 군으로 분류하고, 후보 웹페이지의 컨텐츠가 제1 분류 질문에 해당하지 않는 경우에는 해당 후보 웹페이지를 제2 웹페이지 군으로 분류할 수 있다. 혹은 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지의 컨텐츠가 제1 분류 질문에 해당할 확률이 미리 정해진 값보다 크거나 같은 경우에는 해당 후보 웹페이지를 제1 웹페이지 군으로 분류하고, 후보 웹페이지의 컨텐츠가 제1 분류 질문에 해당할 확률이 미리 정해진 값보다 작거나 같은 경우에는 해당 후보 웹페이지를 제2 웹페이지 군으로 분류할 수 있다. 넥스트 토큰 프리딕션 알고리즘을 이용하여 후보 웹페이지들을 분류하는 내용에 대하여는 도 8 및 도 9에서 보다 구체적으로 서술하기로 한다.
이하에서는 도 6 및 도 7을 참고하여, 본 출원의 일 실시예에 따른 제1 분류 질문을 생성하는 일 양상을 보다 구체적으로 서술하기로 한다. 도 6은 본 출원의 일 실시예에 따른 S3200 단계를 구체화한 순서도이다. 도 7은 본 출원의 일 실시예에 따른 지니 지수에 기초하여 분류 질문을 생성하는 일 양상을 도시한 도면이다.
본 출원의 일 실시예에 따른 제1 분류 질문을 생성하는 단계(S3200)는, 제1 질문을 생성하고 후보 웹페이지 세트에 포함된 후보 웹페이지들과 제1 질문 간의 제1 지니 지수를 획득하는 단계(S3210), 제2 질문을 생성하고 후보 웹페이지 세트에 포함된 후보 웹페이지들과 제2 질문 간의 제2 지니 지수를 획득하는 단계(S3220), 제1 지니 지수와 제2 지니 지수를 비교하고, 비교 결과에 기초하여 제1 질문과 제2 질문 중에서 어느 하나를 제1 분류 질문으로 결정하는 단계(S3230)를 더 포함할 수 있다.
제1 질문을 생성하고 후보 웹페이지 세트에 포함된 후보 웹페이지들과 제1 질문 간의 제1 지니 지수를 획득하는 단계(S3210)에서는, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지 세트에 포함된 후보 웹페이지의 컨텐츠 정보에 기반하여 제1 질문을 생성할 수 있다. 이때, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지 세트에 포함된 후보 웹페이지의 컨텐츠와 생성된 제1 질문 간의 제1 지니 지수를 획득할 수 있다.
제2 질문을 생성하고 후보 웹페이지 세트에 포함된 후보 웹페이지들과 제2 질문 간의 제2 지니 지수를 획득하는 단계(S3220)에서는, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지 세트에 포함된 후보 웹페이지의 컨텐츠 정보에 기반하여 제2 질문을 생성할 수 있다. 이때, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지 세트에 포함된 후보 웹페이지의 컨텐츠와 생성된 제2 질문 간의 제2 지니 지수를 획득할 수 있다.
제1 지니 지수와 제2 지니 지수를 비교하고, 비교 결과에 기초하여 제1 질문과 제2 질문 중에서 어느 하나를 제1 분류 질문으로 결정하는 단계(S3230)에서는, 교육 컨텐츠 추천 장치(1000)는 제1 지니 지수와 제2 지니 지수를 비교하고, 비교 결과에 기초하여 제1 질문과 제2 질문 중에서 제1 분류 질문을 결정할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 제1 지니 지수와 제2 지니 지수를 비교하여 제1 지니 지수와 제2 지니 지수 중에서 더 큰 값을 가지는 지니 지수에 대응되는 질문을 제1 분류 질문으로 결정할 수 있다. 다만 이는 예시에 불과하며 본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치(1000)는 임의의 적절한 방법을 이용하여 분류 질문을 결정하도록 구현될 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 복수의 질문들 각각과 후보 웹페이지 간의 지니 지수를 획득하고, 지니 지수 순서대로 복수의 질문들을 정렬하고, 가장 높은 지니 지수에 대응되는 질문을 분류 질문으로 결정하거나 생성하도록 구현될 수도 있다.
이하에서는 도 8 및 도 9를 참고하여, 본 출원의 일 실시예에 따른 후보 웹페이지들을 분류하는 일 양상을 보다 구체적으로 서술하기로 한다. 도 8은 본 출원의 일 실시예에 따른 S3300 단계를 구체화한 순서도이다. 도 9은 본 출원의 일 실시예에 따른 넥스트 토큰 프리딕션(Next token prediction)을 통하여 후보 웹페이지들을 분류하는 일 양상을 도시한 도면이다.
본 출원의 일 실시예에 따른 제1 분류 질문에 기초하여 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하는 단계(S3300)는, 넥스트 토큰 프리딕션(next token prediction)을 통하여 후보 웹페이지의 컨텐츠가 제1 분류 질문에 해당하는지 여부를 연산하는 단계(S3310), 및 후보 웹페이지의 컨텐츠가 제1 분류 질문에 해당하는 경우에는 후보 웹페이지를 제1 웹페이지 군으로 분류하고, 후보 웹페이지의 컨텐츠가 제1 분류 질문에 해당하지 않는 경우에는 후보 웹페이지를 제2 웹페이지 군으로 분류하는 단계(S3320)를 더 포함할 수 있다.
넥스트 토큰 프리딕션(next token prediction)을 통하여 후보 웹페이지의 컨텐츠가 제1 분류 질문에 해당하는지 여부를 연산하는 단계(S3310)에서는, 교육 컨텐츠 추천 장치(1000)는 넥스트 토큰 프리딕션 알고리즘을 이용하여 후보 웹페이지의 컨텐츠 정보가 제1 분류 질문에 해당하는 지 여부 또는 후보 웹페이지의 컨텐츠 정보가 제1 분류 질문에 해당할 확률을 예측하거나 연산할 수 있다. 구체적으로 교육 컨텐츠 추천 장치(1000)는 제1 분류 질문과 후보 웹페이지의 컨텐츠 정보에 기반하여 후보 웹페이지의 컨텐츠 정보가 제1 분류 질문에 부합할 확률을 연산할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 제1 후보 웹페이지의 제1 컨텐츠가 제1 분류 질문에 부합할 확률을 연산하거나 제1 후보 웹페이지의 제1 컨텐츠가 제1 분류 질문에 해당하는 지 여부를 연산할 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 제2 후보 웹페이지의 제2 컨텐츠가 제1 분류 질문에 부합할 확률을 연산하거나 제2 후보 웹페이지의 제2 컨텐츠가 제1 분류 질문에 해당하는 지 여부를 연산할 수 있다. 구체적으로 사용자의 검색 정보가 “우주가 탄생”과 관련된 경우, “에너지 보존 법칙을 아시나요?” 및/또는 “종교적 관점의 설명을 원하시나요?”와 같은 분류 질문에 생성될 수 있다. 이때, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지에 포함된 컨텐츠 정보가 분류 질문에 해당하는 지 여부나 후보 웹페이지에 포함된 컨텐츠 정보가 분류 질문과 관련될 확률을 연산할 수 있다.
후보 웹페이지의 컨텐츠가 제1 분류 질문에 해당하는 경우에는 후보 웹페이지를 제1 웹페이지 군으로 분류하고, 후보 웹페이지의 컨텐츠가 제1 분류 질문에 해당하지 않는 경우에는 후보 웹페이지를 제2 웹페이지 군으로 분류하는 단계(S3320)에서는, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지의 컨텐츠가 제1 분류 질문에 해당하거나 후보 웹페이지의 컨텐츠가 제1 분류 질문과 관련될 확률이 미리 정해진 값보다 큰 확률로 연산된 경우에는 후보 웹페이지를 제1 웹페이지 군으로 분류할 수 있다. 반면, 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지의 컨텐츠가 제1 분류 질문에 해당하지 않거나 후보 웹페이지의 컨텐츠가 제1 분류 질문과 관련될 확률이 미리 정해진 값보다 작은 확률로 연산된 경우에는 후보 웹페이지를 제2 웹페이지 군으로 분류할 수 있다.
예컨대, '우주의 탄생'과 관련된 사용자의 검색 정보에 대응하여 '에너지 보존 법칙과 관련되나요?'와 같은 분류 질문이 생성된 경우에, 후보 웹페이지의 컨텐츠가 에너지 보존 법칙과 관련된 내용을 포함하는 경우 또는 후보 웹페이지의 컨텐츠가 에너지 보존 법칙과 관련될 확률이 미리 정해진 값보다 크거나 같은 경우에는 교육 컨텐츠 추천 장치(1000)는 해당 후보 웹페이지를 제1 웹페이지 군으로 분류할 수 있다. 반면, 후보 웹페이지의 컨텐츠가 에너지 보존 법칙과 관련된 내용을 포함하지 않는 경우 또는 후보 웹페이지의 컨텐츠가 에너지 보존 법칙과 관련될 확률이 미리 정해진 값보다 작은 경우에는 교육 컨텐츠 추천 장치(1000)는 해당 후보 웹페이지를 제2 웹페이지 군으로 분류할 수 있다.
다만 상술한 예시는 설명의 편의를 위한 것일 뿐, 이에 제한적으로 해석되어서는 아니되며, 교육 컨텐츠 추천 장치(1000)는 임의의 사용자의 검색 정보에 대응하여 생성된 임의의 분류 질문을 이용하여 후보 웹페이지들을 분류하도록 구현될 수 있을 것이다.
한편, 본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치(1000)는 생성된 분류 질문을 사용자 단말(100)에 제공하고, 사용자 단말(100)로부터 분류 질문에 대한 사용자의 응답을 획득하고, 사용자의 응답에 기초하여 후보 웹페이지들을 제1 웹페이지 군과 제2 웹페이지 군으로 분류하도록 구현될 수도 있다. 예컨대, 미분과 적분의 개념에 대한 사용자의 검색 정보에 대하여 '어떤 수준의 설명을 원하시나요?'와 같은 분류 질문이 생성된 경우에, 교육 컨텐츠 추천 장치(1000)는 사용자 단말(100)을 통하여, 제1 응답(예컨대, 고등학교 이하), 제2 응답(예컨대, 대학교 이상 비전공생), 및 제3 응답(예컨대, 수학 전공생) 중 어느 하나에 해당하는 사용자의 응답을 획득하고, 사용자의 응답에 기초하여 후보 웹페이지들을 분류하거나 필터링하도록 구현될 수 있다.
한편, 본 출원의 일 실시예에 따른 교육 컨텐츠 추천 장치(1000)는 전술한 바와 같이 분류 질문을 생성하고 생성된 분류 질문에 해당하는 지 여부에 따라 후보 웹페이지들을 분류하는 단계를 복수 회 수행하도록 구현될 수 있다. 예컨대, 교육 컨텐츠 추천 장치(1000)는 에너지 보존 법칙과 관련된 내용을 포함하여 제1 웹페이지 군으로 분류된 후보 웹페이지들에 대하여, '종교적인 내용과 관련되나요?'와 같은 추가적인 분류 질문을 생성할 수 있으며, 추가적인 분류 질문에 해당하는 지 여부 혹은 해당할 확률을 연산하여 제1 웹페이지 군으로 분류된 후보 웹페이지들을 제3 웹페이지 군 및 제4 웹페이지 군으로 분류할 수 있다. 나아가 교육 컨텐츠 추천 장치(1000)는 후보 웹페이지들을 분류하는 동작을 미리 정해진 횟수만큼 반복하여 수행할 수 있으며, 최종적으로 교육 컨텐츠 추천 장치(1000)는 분류 결과에 기초하여 대상 웹페이지를 획득할 수 있다. 또한 교육 컨텐츠 추천 장치(1000)는 송수신부(1100)를 통하여 대상 웹페이지를 사용자 단말(100)을 포함한 임의의 외부 장치(혹은 임의의 외부 서버)로 송신하는 동작을 수행할 수 있다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 방법 및 교육 컨텐츠 추천 장치에 따르면, 사용자의 검색 정보에 대하여 관련성이 높은 컨텐츠를 포함하거나 사용자의 이해도와 가장 적합한 컨텐츠를 포함하는 대상 웹페이지를 선별할 수 있는 효과를 제공할 수 있다.
본 출원의 일 실시예에 따른 교육 컨텐츠 추천 방법 및 교육 컨텐츠 추천 장치에 따르면, 분류 질문을 생성하여 사용자에게 적합한 대상 웹페이지를 신속하게 획득할 수 있다.
상술한 교육 컨텐츠 추천 장치(1000)의 다양한 동작들은 교육 컨텐츠 추천 장치(1000)의 메모리(12000)에 저장될 수 있으며, 교육 컨텐츠 추천 장치(1000)의 컨트롤러(1300)는 메모리(1200)에 저장된 동작들을 수행하도록 제공될 수 있다.
이상에서 실시 형태들에 설명된 특징, 구조, 효과 등은 본 발명의 적어도 하나의 실시 형태에 포함되며, 반드시 하나의 실시 형태에만 한정되는 것은 아니다. 나아가, 각 실시 형태에서 예시된 특징, 구조, 효과 등은 실시 형태들이 속하는 분야의 통상의 지식을 가지는 자에 의해 다른 실시 형태들에 대해서도 조합 또는 변형되어 실시 가능하다. 따라서 이러한 조합과 변형에 관계된 내용들은 본 발명의 범위에 포함되는 것으로 해석되어야 할 것이다.
또한, 이상에서 실시 형태를 중심으로 설명하였으나 이는 단지 예시일 뿐 본 발명을 한정하는 것이 아니며, 본 발명이 속하는 분야의 통상의 지식을 가진 자라면 본 실시 형태의 본질적인 특성을 벗어나지 않는 범위에서 이상에 예시되지 않은 여러 가지의 변형과 응용이 가능함을 알 수 있을 것이다. 즉, 실시 형태에 구체적으로 나타난 각 구성 요소는 변형하여 실시할 수 있는 것이다. 그리고 이러한 변형과 응용에 관계된 차이점들은 첨부된 청구 범위에서 규정하는 본 발명의 범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (9)

  1. 사용자의 검색 정보를 분석하는 장치가 사용자의 검색 정보에 기초하여 교육 컨텐츠를 추천하는 방법에 있어서,
    사용자의 검색 정보를 획득하는 단계;
    상기 검색 정보에 기초하여 후보 웹페이지 세트를 획득하는 단계;
    상기 후보 웹페이지 세트에 포함된 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하는 단계;
    분류 결과에 기초하여 대상 웹페이지를 결정하는 단계; 및
    상기 결정된 대상 웹페이지를 송신하는 단계;를 포함하되,
    상기 제1 웹페이지 군 및 상기 제2 웹페이지 군으로 분류하는 단계는,
    언어 모델을 통하여 상기 후보 웹페이지들의 컨텐츠를 분석하는 단계;
    분석 결과에 따라 제1 분류 질문을 생성하는 단계; 및
    상기 생성된 제1 분류 질문에 기초하여 상기 후보 웹페이지들을 상기 제1 웹페이지 군 및 상기 제2 웹페이지 군으로 분류하는 단계:를 더 포함하되,
    상기 제1 분류 질문은,
    상기 제1 웹페이지 군으로 분류될 후보 웹페이지의 수와 상기 제2 웹페이지 군으로 분류될 후보 웹페이지 수의 차이가 최소가 되도록 생성된 질문이며,
    상기 생성된 제1 분류 질문에 기초하여 상기 후보 웹페이지들을 상기 제1 웹페이지 군 및 상기 제2 웹페이지 군으로 분류하는 단계는,
    넥스트 토큰 프리딕션(Next token prediction)을 통하여 상기 후보 웹페이지의 컨텐츠가 상기 생성된 제1 분류 질문에 해당하는지 여부를 연산하는 단계; 및
    상기 후보 웹페이지의 컨텐츠가 상기 생성된 제1 분류 질문에 해당하는 경우에는 상기 후보 웹페이지를 상기 제1 웹페이지 군으로 분류하고, 상기 후보 웹페이지의 컨텐츠가 상기 생성된 제1 분류 질문에 해당하지 않는 경우에는 상기 후보 웹페이지를 상기 제2 웹페이지 군으로 분류하는 단계;를 더 포함하는,
    교육 컨텐츠 추천 방법.
  2. 삭제
  3. 제1 항에 있어서,
    상기 제1 분류 질문을 생성하는 단계는,
    상기 분석 결과에 기초하여 제1 질문을 생성하고, 상기 후보 웹페이지의 컨텐츠에 기초하여 상기 후보 웹페이지 세트에 포함된 후보 웹페이지들과 상기 제1 질문 간의 제1 지니 지수를 획득하는 단계;
    상기 분석 결과에 기초하여 제2 질문을 생성하고, 상기 후보 웹페이지의 컨텐츠에 기초하여 상기 후보 웹페이지 세트에 포함된 후보 웹페이지들과 상기 제2 질문 간의 제2 지니 지수를 획득하는 단계; 및
    상기 제1 지니 지수와 상기 제2 지니 지수를 비교하고, 비교 결과에 기초하여 상기 제1 질문과 상기 제2 질문 중 어느 하나를 상기 제1 분류 질문으로 결정하는 단계;를 더 포함하는,
    교육 컨텐츠 추천 방법.
  4. 제3 항에 있어서,
    상기 제1 분류 질문으로 결정하는 단계는,
    상기 제1 지니 지수와 상기 제2 지니 지수 중에서 더 큰 값을 가지는 지니 지수에 대응되는 질문을 상기 제1 분류 질문으로 결정하는 단계;를 더 포함하는,
    교육 컨텐츠 추천 방법.
  5. 삭제
  6. 제1 항에 있어서,
    상기 분류 결과에 기초하여 대상 웹페이지를 결정하는 단계는,
    상기 제1 웹페이지 군에 포함된 후보 웹페이지의 컨텐츠의 분석 결과에 따라 제2 분류 질문을 생성하는 단계;
    상기 생성된 제2 분류 질문에 기초하여 상기 제1 웹페이지 군에 포함된 후보 웹페이지들을 제3 웹페이지 군 및 제4 웹페이지 군으로 분류하는 단계; 및
    상기 분류 결과에 기초하여 상기 제3 웹페이지 군 및 상기 제4 웹페이지 군 중 어느 하나의 군에 포함된 후보 웹페이지를 상기 대상 웹페이지로 결정하는 단계;를 더 포함하는,
    교육 컨텐츠 추천 방법.
  7. 제6 항에 있어서,
    상기 제2 분류 질문은,
    상기 제3 웹페이지 군으로 분류될 후보 웹페이지의 수와 상기 제4 웹페이지 군으로 분류될 후보 웹페이지 수의 차이가 최소가 되도록 생성된 질문인,
    교육 컨텐츠 추천 방법.
  8. 컴퓨터에 제1 항, 제3 항, 제4 항, 제6 항 내지 제7 항 중 어느 하나의 항에 따른 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
  9. 사용자의 검색 정보를 사용자 단말기로부터 수신하고, 상기 사용자의 검색 정보에 기초하여 대상 웹페이지를 결정하여 사용자에게 제공될 교육 컨텐츠를 추천하는 장치에 있어서,
    상기 사용자 단말기와 통신하는 송수신부; 및
    상기 송수신부를 통하여 사용자의 검색 정보를 획득하고, 상기 검색 정보에 기초하여 대상 웹 페이지를 결정하도록 구성된 컨트롤러;를 포함하되,
    상기 컨트롤러는,
    사용자의 검색 정보를 획득하고, 상기 검색 정보에 기초하여 후보 웹페이지 세트를 획득하고, 상기 후보 웹페이지 세트에 포함된 후보 웹페이지들을 제1 웹페이지 군 및 제2 웹페이지 군으로 분류하고, 분류 결과에 기초하여 대상 웹페이지를 결정하고, 상기 결정된 대상 웹페이지를 송신하도록 구성되되,
    상기 컨트롤러는,
    상기 제1 웹페이지 군 및 상기 제2 웹페이지 군으로 분류하는 단계는,
    언어 모델을 통하여 상기 후보 웹페이지들의 컨텐츠를 분석하고, 분석 결과에 따라 분류 질문을 생성하고, 상기 생성된 분류 질문에 기초하여 상기 후보 웹페이지들을 상기 제1 웹페이지 군 및 상기 제2 웹페이지 군으로 분류하도록 구성되되,
    넥스트 토큰 프리딕션(Next token prediction)을 통하여 상기 후보 웹페이지의 컨텐츠가 상기 생성된 분류 질문에 해당하는지 여부를 연산하고, 상기 후보 웹페이지의 컨텐츠가 상기 생성된 분류 질문에 해당하는 경우에는 상기 후보 웹페이지를 상기 제1 웹페이지 군으로 분류하고, 상기 후보 웹페이지의 컨텐츠가 상기 생성된 분류 질문에 해당하지 않는 경우에는 상기 후보 웹페이지를 상기 제2 웹페이지 군으로 분류하도록 구성되되,
    상기 생성된 분류 질문은,
    상기 제1 웹페이지 군으로 분류될 후보 웹페이지의 수와 상기 제2 웹페이지 군으로 분류될 후보 웹페이지 수의 차이가 최소가 되도록 생성된 질문이며,
    교육 컨텐츠 추천 장치.
KR1020220086667A 2022-07-14 2022-07-14 사용자의 검색 정보에 기초하여 웹 페이지를 추천하는 방법, 장치, 및 시스템 KR102571826B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020220086667A KR102571826B1 (ko) 2022-07-14 2022-07-14 사용자의 검색 정보에 기초하여 웹 페이지를 추천하는 방법, 장치, 및 시스템
US18/352,361 US20240020346A1 (en) 2022-07-14 2023-07-14 Device and method for recommending educational content based on user's search information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220086667A KR102571826B1 (ko) 2022-07-14 2022-07-14 사용자의 검색 정보에 기초하여 웹 페이지를 추천하는 방법, 장치, 및 시스템

Publications (1)

Publication Number Publication Date
KR102571826B1 true KR102571826B1 (ko) 2023-08-29

Family

ID=87802243

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220086667A KR102571826B1 (ko) 2022-07-14 2022-07-14 사용자의 검색 정보에 기초하여 웹 페이지를 추천하는 방법, 장치, 및 시스템

Country Status (2)

Country Link
US (1) US20240020346A1 (ko)
KR (1) KR102571826B1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190019892A (ko) * 2016-06-14 2019-02-27 핑안 테크놀로지 (션젼) 컴퍼니 리미티드 결정 모델 구성 방법 및 장치, 컴퓨터 장치 및 저장 매체
KR20200119358A (ko) 2019-03-15 2020-10-20 (주) 데이터뱅크 인공지능 기계학습 기반 자동채점을 이용한 토플 강의 추천 서비스 제공 시스템
KR20210029007A (ko) * 2019-09-05 2021-03-15 군산대학교산학협력단 딥러닝 기반의 정보 분류 방법 및 그 장치
KR20220067808A (ko) * 2020-11-18 2022-05-25 주식회사 케이티 지식 그래프를 생성하는 장치, 방법 및 컴퓨터 프로그램
KR102412378B1 (ko) * 2021-07-01 2022-06-23 (주)뤼이드 사용자에게 교육 효과가 최대화되는 웹페이지를 추천하는 방법, 장치, 및 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190019892A (ko) * 2016-06-14 2019-02-27 핑안 테크놀로지 (션젼) 컴퍼니 리미티드 결정 모델 구성 방법 및 장치, 컴퓨터 장치 및 저장 매체
KR20200119358A (ko) 2019-03-15 2020-10-20 (주) 데이터뱅크 인공지능 기계학습 기반 자동채점을 이용한 토플 강의 추천 서비스 제공 시스템
KR20210029007A (ko) * 2019-09-05 2021-03-15 군산대학교산학협력단 딥러닝 기반의 정보 분류 방법 및 그 장치
KR20220067808A (ko) * 2020-11-18 2022-05-25 주식회사 케이티 지식 그래프를 생성하는 장치, 방법 및 컴퓨터 프로그램
KR102412378B1 (ko) * 2021-07-01 2022-06-23 (주)뤼이드 사용자에게 교육 효과가 최대화되는 웹페이지를 추천하는 방법, 장치, 및 시스템

Also Published As

Publication number Publication date
US20240020346A1 (en) 2024-01-18

Similar Documents

Publication Publication Date Title
KR101936029B1 (ko) 딥러닝 기반의 가치 평가 방법 및 그 장치
US20230097667A1 (en) Methods and apparatuses for training prediction model
CN111666416B (zh) 用于生成语义匹配模型的方法和装置
Jiménez et al. Leaving the area under the receiving operating characteristic curve behind: An evaluation method for species distribution modelling applications based on presence‐only data
CN110515986B (zh) 一种社交网络图的处理方法、装置及存储介质
KR20230005753A (ko) 사용자의 검색 정보를 기반으로 사용자의 학습 능력을 평가하는 방법, 장치, 및 시스템
KR20230005751A (ko) 사용자에게 교육 효과가 최대화되는 풀이 컨텐츠를 추천하는 방법, 장치, 및 시스템
KR20230005752A (ko) 사용자에게 교육 효과가 최대화되는 웹페이지를 추천하는 방법, 장치, 및 시스템
Olney et al. Assessing Computer Literacy of Adults with Low Literacy Skills.
CN114600196A (zh) 特定领域的人类模型协同注释工具
WO2021258968A1 (zh) 小程序分类方法、装置、设备及计算机可读存储介质
KR102571826B1 (ko) 사용자의 검색 정보에 기초하여 웹 페이지를 추천하는 방법, 장치, 및 시스템
KR102192461B1 (ko) 불확정성을 모델링할 수 있는 뉴럴네트워크 학습 장치 및 방법
CN116662527A (zh) 用于生成学习资源的方法及相关产品
JP2023536769A (ja) 使用者に教育効果が最大化される解説コンテンツを推薦する方法、装置、およびシステム
KR20230084669A (ko) 비정형 문서 분석 방법, 비정형 문서 분석 장치, 비정형 문서 분석 시스템
KR102465672B1 (ko) 신경망 탐색 방법, 신경망 탐색 장치, 및 신경망 탐색 시스템
KR102445230B1 (ko) 태스크 모델 및 자연어 처리 모델의 학습 방법, 및 이를 수행하는 학습 장치
KR102582737B1 (ko) 시계열 이상 감지 모델의 경량화 방법, 및 경량화 장치
US20230186088A1 (en) Learning skill evaluation method, apparatus, and system
KR102637821B1 (ko) 인공지능 기반의 콘텐츠 추천을 위한 방법 및 장치
KR102610787B1 (ko) 사용자의 성향 분석을 위한 설문 조사 데이터 분석 방법 및 시스템
KR20230009817A (ko) 교육 컨텐츠 추천 방법, 교육 컨텐츠 추천 장치, 및 교육 컨텐츠 추천 시스템
US20230385657A1 (en) Analysis device, analysis method, and recording medium
KR20230066732A (ko) 교육 컨텐츠 추천 방법, 교육 컨텐츠 추천 장치 및 교육 컨텐츠 추천 시스템

Legal Events

Date Code Title Description
GRNT Written decision to grant