KR102280028B1 - 빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 방법 및 장치 - Google Patents

빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 방법 및 장치 Download PDF

Info

Publication number
KR102280028B1
KR102280028B1 KR1020210010629A KR20210010629A KR102280028B1 KR 102280028 B1 KR102280028 B1 KR 102280028B1 KR 1020210010629 A KR1020210010629 A KR 1020210010629A KR 20210010629 A KR20210010629 A KR 20210010629A KR 102280028 B1 KR102280028 B1 KR 102280028B1
Authority
KR
South Korea
Prior art keywords
user
content management
chatbot
web page
basic
Prior art date
Application number
KR1020210010629A
Other languages
English (en)
Inventor
이선기
Original Assignee
주식회사 미디어코어시스템즈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 미디어코어시스템즈 filed Critical 주식회사 미디어코어시스템즈
Priority to KR1020210010629A priority Critical patent/KR102280028B1/ko
Application granted granted Critical
Publication of KR102280028B1 publication Critical patent/KR102280028B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 방법 및 장치가 개시된다. 빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 장치(또는 서버)는, 적어도 하나의 프로세서(processor); 및 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함할 수 있다.

Description

빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 방법 및 장치 {METHOD FOR MANAGING CONTENTS BASED ON CHATBOT USING BIG-DATA AND ARTIFICIAL INTELLIGENCE AND APPARATUS FOR THE SAME}
본 발명은 빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 방법 및 장치에 관한 것으로, 더욱 상세하게는 웹 브라우저 상에서 웹 콘텐츠를 빅데이터와 인공지능을 이용한 챗봇 기반으로 관리하는 방법 및 장치에 관한 것이다.
콘텐츠 관리 시스템(content management system, CMS)은 웹 사이트를 구성하는 콘텐츠를 관리하는 시스템을 말하는데, 종래의 CMS는 웹 페이지 요소를 디자인하는 선 처리 공정을 수작업으로 진행하고, 프로그림 코딩이나 플러그인 장착/인스톨 과정을 전문가가 개입하여 진행한 후에 페이지가 생성되기 때문에, 페이지 수정 시마다 일일이 전문가에게 의뢰해야 하는 불편이 있다.
한편, 워드프레스는 대표적인 CMS 솔루션으로, 웹에서 콘텐츠를 쉽게 발행하고 관리하도록 도움을 주기 위하여 선처리 공정은 테마 및 플러그인 형태로 제공되지만, 플러그인 장착 및 인스톨을 위해서는 전문가 개입이 필수이다. 따라서, 일반 사용자는 워드프레스를 이용하더라도 직접 웹 콘텐츠를 관리하기가 어렵기 때문에, 콘텐츠 변경 시마다 외부 전문가에 의뢰해야 하며, 이는 시간과 비용의 상승으로 이어지는 문제가 있다.
(특허 001) 등록특허공보 제10-1894060호 (공고일자 2018년08월31일)
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 방법 및 장치를 제공하는 데 있다.
상기와 같은 문제점을 해결하기 위하여, 실시예들에 따른 빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 장치(또는 그 서버)는, 적어도 하나의 프로세서(processor); 및/또는 상기 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함할 수 있다.
실시예들에 따른 적어도 하나의 단계는: 챗봇(chatbot) 모듈을 통하여 사용자 단말 장치로부터 메시지를 수신하는 단계; 상기 메시지로부터 텍스트 데이터를 파싱(parsing)하는 단계; 상기 텍스트 데이터를 분석하여, 하나 또는 그 이상의 유효 키워드를 생성하는 단계; 상기 하나 또는 그 이상의 유효 키워드에 기초하여 하나 또는 그 이상의 기초 템플릿(basic template)을 생성하는 단계; 상기 하나 또는 그 이상의 기초 템플릿에 상기 하나 또는 그 이상의 유효 키워드를 매핑(mapping)하여 하나 또는 그 이상의 최종 템플릿(final template)를 생성하는 단계; 및 상기 하나 또는 그 이상의 최종 템플릿을 상기 사용자의 단말 장치로 전송하는 단계; 를 포함할 수 있다.
실시예들에 따른 하나 또는 그 이상의 기초 템플릿은 유효 키워드를 입력 레이어(input layer)로 입력 받아, 크로스 엔트로피(cross entropy) 손실 함수를 이용하여 학습하고, 기초 템플릿들에 대한 확률 값들을 출력 레이어(output layer)로 출력하도록 구성된 뉴럴 네트워크 모델에 기초하여 생성될 수 있다.
나아가, 실시예들에 따른 하나 또는 그 이상의 유효 키워드를 생성하는 단계는 상기 텍스트 데이터를 형태소 단위로 분할하고, 분할된 각 형태소에 품사를 부착하는 단계 및 각 분할된 형태소별로 용어 빈도수를 계산하는 단계를 포함할 수 있다.
실시예들에 따른 하나 또는 그 이상의 유효 키워드는, 상기 텍스트 데이터 내 포함된 단어 t별로 용어 빈도수 값 및 문서 빈도수 값을 도출하고, 단어 t별로 상기 빈도수 정보에 상기 문서 빈도수 값을 나누고, 상기 나눈 값을 임계치 값과 비교함으로써 생성될 수 있다.
실시예들에 따른 상기 용어 빈도수 값 tf(d, f)는
Figure 112021010094898-pat00001
수식에 의해 도출되고, 상기 문서 빈도수 값 df(t, D)은
Figure 112021010094898-pat00002
수식에 의해 도출될 수 있다. 여기서, 상기 d는 상기 텍스트 데이터 내 포함된 모든 단어의 집합이고, 상기 D는 전체 문서에 대한 단어의 집합이고, 상기
Figure 112021010094898-pat00003
는 상기 텍스트 데이터 내에서 상기 단어 t가 포함되는 개수를 나타낼 수 있다.
실시예들에 따르면, 상기 적어도 하나의 단계는: 복수의 웹 페이지 데이터를 수집하는 단계; 및/또는 각 웹 페이지 내 태그(tag) 정보 및 스타일(style) 정보에 기초하여, 각 웹 페이지의 레이아웃(layout)을 나타내는 정보, 각 웹 페이지의 어트리뷰트(attribute)를 나타내는 정보 및 각 웹 페이지에 관한 키워드(keyword) 정보를 데이터베이스에 저장하는 단계; 를 포함할 수 있다.
실시예들에 따르면, 상기 기초 템플릿은 상기 하나 또는 그 이상의 유효 키워드를 상기 데이터베이스로부터 검색하여 추출된 결과에 기초하여 결정될 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 챗봇 모듈을 이용하여 키워드를 추출하고 키워드를 기초 템플릿에 매핑함으로써, 사용자의 별다른 조작 없이 사용자에게 원하는 웹 페이지를 효과적으로 제공할 수 있는 효과를 제공한다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 빅데이터를 활용하여 기초 템플릿을 결정함으로써, 사용자에게 획일적인 기 제작된 템플릿을 제공하는 것이 아닌 사용자의 니즈에 맞는 어플리케이션 또는 웹 페이지를 효과적으로 제공할 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 사용자의 요청 메시지로부터 추출한 유효 키워드에 기반하여 기초 템플릿을 생성하고, 최종 템플릿을 생성함으로써, 사용자의 성향에 맞게 커스터마이징할 수 있어, 사용자의 니즈에 맞는 어플리케이션 또는 웹 페이지를 효과적으로 제공할 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 사용자의 요청 메시지로부터 형태소 분석을 통해 사용자의 서비스 론칭 국가 및/또는 사용자의 요구하는 분야를 효과적으로 파악할 수 있어, 빠른 시간으로 정확하게 국가 별로 견적을 자동으로 계산할 수 있다.
도 1은 실시예들에 따른 콘텐츠 관리 시스템을 나타낸 것이다.
도 2는 실시예들에 따른 챗봇 기반 콘텐츠 관리 방법을 나타낸 것이다.
도 3은 실시예들에 따른 챗봇 기반 콘텐츠 관리 시스템의 흐름도를 나타낸 것이다.
도 4는 실시예들에 따른 챗봇 기반 콘텐츠 관리 시스템이 기초 템플릿(basic template)에 유효 키워드를 매핑(mapping)하여 실시예들에 따른 최종 템플릿(final template)를 생성하는 과정을 나타낸다.
도 5는 실시예들에 따른 챗봇 기반 콘텐츠 관리 시스템이 빅데이터를 활용하여 웹페이지를 분석하는 과정을 나타낸다.
도 6는 실시예들에 따른 챗봇 기반 콘텐츠 관리 시스템이 빅데이터를 활용하여 웹페이지를 분석 및 저장하는 과정을 나타낸다.
도 7은 실시예들에 따른 콘텐츠 관리 방법을 제공하기 위한 서버의 하드웨어 구성도의 예시이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 실시예들에 따른 콘텐츠 관리 시스템을 나타낸 것이다.
실시예들에 따른 콘텐츠 관리 시스템은 실시예들에 따른 콘텐츠 관리 장치(100)에 의해 수행될 수 있다. 콘텐츠 관리 장치(100)는 예를 들어, 콘텐츠 관리 방법을 수행하는 서버(server)일 수 있다. 콘텐츠 관리 장치(100)는 실시예들에 따른 사용자 단말 장치(101)와 데이터를 송수신하며, 사용자 단말 장치(101) 또는 사용자에게 콘텐츠 관리 서비스를 제공할 수 있다. 콘텐츠 관리 서비스는 예를 들어, 사용자에게 사용자가 요청하는 바에 따른 웹페이지를 제공하는 서비스를 의미할 수 있다.
콘텐츠 관리 장치(100)는 빅데이터(102)를 이용하여, 인터넷을 통해 웹 사이트들을 조회 및 웹 페이지를 수신하고, 이들을 분석한 후, 분석한 데이터를 콘텐츠 관리 장치(100) 내 데이터베이스에 저장할 수 있다. 콘텐츠 관리 장치(100)는 빅데이터(102)를 이용하여 수집한 인터넷 웹 사이트들의 레이아웃(layout), 웹 사이트의 종류, 웹 사이트의 키워드, 웹 사이트의 어트리뷰트(예를 들어, 색깔, 글꼴, 글씨 색깔, 이미지 등)를 추출 및 생성하고, 이들을 데이터베이스 내에 저장할 수 있다.
콘텐츠 관리 장치(100)는 사용자 단말 장치(101)로부터 요청 메시지(10a)를 수신할 수 있다. 콘텐츠 관리 장치(100)는 요청 메시지(10a)를 수신하고, 수신한 요청 메시지(10a)를 파싱 및 분석하여, 사용자가 원하는 템플릿 데이터(10d)를 제공(10b)할 수 있다. 템플릿 데이터(10d)는 예를 들어, 사용자가 원하는 콘텐츠(들)이 포함된 서비스 페이지(예를 들어, 웹 페이지, 어플리케이션 등)를 의미할 수 있다.
콘텐츠 관리 장치(100)는 요청 메시지(10a)에서 텍스트 데이터, 이미지 데이터, 영상 데이터, 음성 데이터 등을 추출하고, 텍스트 데이터로부터 유효 키워드(keyword)를 추출할 수 있다. 콘텐츠 관리 장치(100)는 추출된 유효 키워드를 이용하여, 사용자에게 제공할 템플릿 데이터(10d)의 기초가 되는 기초 템플릿(basic template)를 제공할 수 있다. 기초 템플릿은, 예를 들어 사용자 단말 장치(101)에게 제공되는 템플릿 데이터를 구성하는 기초 레이아웃, 기초 어트리뷰트 등을 포함한 데이터일 수 있다. 예를 들어, 기초 레이아웃은 기본적인 웹 페이지를 구성하는 HTML 태그(tag)들과 해당 HTML 태그들에 대한 스타일(style)을 제공하는 CSS 파일, 자바스크립트 파일 등을 의미할 수 있다. 기초 템플릿(basic template)는 콘텐츠 관리 장치(100) 내의 저장부(또는 데이터베이스 등) 내에 기 포함된 데이터일 수 있다.
콘텐츠 관리 장치(100)는 실시예들에 따른 유효 키워드에 기초하여, 사용자에게 적절한 기초 템플릿을 결정한다. 콘텐츠 관리 장치(100)는 예를 들어, 사용자 단말 장치(101)로부터 수신하여 추출 또는 생성한 유효 키워드를 사용자 단말 장치(101) 내에 포함된 데이터베이스로 검색하고, 해당 유효 키워드와 연관이 있는 웹 사이트들을 조회하고, 조회한 웹 사이트들의 레이아웃(layout), 어트리뷰트(attribute) 등과 유사한 기초 템플릿을 결정할 수 있다.
콘텐츠 관리 장치(100)이 기초 템플릿을 결정하면, 사용자로부터 수신한 요청 메시지 (또는 기타 메시지)에서 키워드(keyword)들을 추출하고 이들을 기초 템플릿에 매핑하여 최종 템플릿(final template)를 생성할 수 있다. 기초 템플릿(basic template)는 예를 들어, 하나 또는 그 이상의 컴포넌트를 포함할 수 있다. 하나 또는 그 이상의 컴포넌트는 예를 들어, 레이아웃의 구획을 결정하는 영역일 수도 있고, 하나 또는 그 이상의 태그(tag)들로 구성되는 요소(예를 들어, 버튼, 하이퍼링크 태그(<a> 등), 글자(<span> 등), 제목글자(<h1>, <h2>, <article> 등)일 수도 있다. 콘텐츠 관리 장치(100)는 해당 컴포넌트들 내에, 추출한 키워드를 매핑할 수 있다.
콘텐츠 관리 장치(100)는 챗봇 모듈(10c)를 통하여, 사용자로부터 요청 메시지(10a)를 수신할 수 있고, 콘텐츠 관리 장치(100)는 챗봇 모듈(10c)를 통하여, 사용자에게 템플릿 데이터(10d)를 제공할 수 있다. 콘텐츠 관리 장치(100)는 사용자로부터 수신한 요청 메시지 내에 포함된 정보가 부족할 경우, 사용자 단말 장치(101)에게, 추가적인 정보를 유도할 수 있는 메시지를 전송할 수 있다. 콘텐츠 관리 장치(100)는 사용자로부터 수신한 정보가 충분할 때까지 사용자 단말 장치(101)에게, 추가적인 정보를 유도할 수 있는 메시지를 전송할 수 있다.
콘텐츠 관리 장치(100)는 사용자의 요청 메시지로부터 추출한 키워드를 입력 받아 기초 템플릿(basic template)을 출력하는 인공지능부를 더 포함할 수 있다. 인공지능부는 키워드와 해당 키워드에 적절한 기초 템플릿을 학습하는 뉴럴 네트워크 모델을 포함할 수 있다. 뉴럴 네트워크 모델은 예를 들어, 키워드(또는 전처리된 키워드 데이터)를 입력 받는 입력 레이어(input layer) 및 기초 템플릿(또는 기초 템플릿을 식별하는 식별자 정보) 또는 각 기초 템플릿들에 대한 확률 정보를 출력하는 출력 레이어(output layer), 및 은닉 레이어(hidden layer)를 포함할 수 있다. 즉, 하나 또는 그 이상의 기초 템플릿은 유효 키워드를 입력 레이어(input layer)로 입력 받아 학습하고, 기초 템플릿들에 대한 확률 값들을 출력 레이어(output layer)로 출력하도록 구성된 뉴럴 네트워크 모델에 기초하여 생성될 수 있다. 학습은 예를 들어, 크로스 엔트로피(cross entropy) 손실 함수를 이용한 분류 모델을 이용하여 수행될 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 챗봇 모듈을 이용하여 키워드를 추출하고 키워드를 기초 템플릿에 매핑함으로써, 사용자의 별다른 조작 없이 사용자에게 원하는 웹 페이지를 효과적으로 제공할 수 있는 효과를 제공한다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 빅데이터를 활용하여 기초 템플릿을 결정함으로써, 사용자에게 획일적인 기 제작된 템플릿을 제공하는 것이 아닌 사용자의 니즈에 맞는 어플리케이션 또는 웹 페이지를 효과적으로 제공할 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 사용자의 요청 메시지로부터 추출한 유효 키워드에 기반하여 기초 템플릿을 생성하고, 최종 템플릿을 생성함으로써, 사용자의 성향에 맞게 커스터마이징할 수 있어, 사용자의 니즈에 맞는 어플리케이션 또는 웹 페이지를 효과적으로 제공할 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 사용자의 요청 메시지로부터 형태소 분석을 통해 사용자의 서비스 론칭 국가 및/또는 사용자의 요구하는 분야를 효과적으로 파악할 수 있어, 빠른 시간으로 정확하게 국가 별로 견적을 자동으로 계산할 수 있다.
도 2는 실시예들에 따른 챗봇 기반 콘텐츠 관리 방법을 나타낸 것이다.
도 2에 나타난 챗봇 기반 콘텐츠 관리 방법은 예를 들어, 실시예들에 따른 챗봇 기반 콘텐츠 관리 장치(또는 그 서버)에 의해 수행될 수 있다. 실시예들에 따른 챗봇 기반 콘텐츠 관리 방법은 챗봇(chatbot) 모듈을 통하여 사용자 단말 장치로부터 메시지를 수신하는 단계(S200), 메시지로부터 텍스트 데이터를 파싱(parsing)하는 단계(S201), 텍스트 데이터를 분석하여, 하나 또는 그 이상의 유효 키워드를 생성하는 단계 (S202), 하나 또는 그 이상의 유효 키워드에 기초하여 하나 또는 그 이상의 기초 템플릿(basic template)을 생성하는 단계 (S203), 하나 또는 그 이상의 기초 템플릿에 하나 또는 그 이상의 유효 키워드를 매핑(mapping)하여 하나 또는 그 이상의 최종 템플릿(final template)를 생성하는 단계(S204), 하나 또는 그 이상의 최종 템플릿을 사용자의 단말 장치로 전송(S205)하는 단계를 포함할 수 있다.
S200 단계는, 챗봇(chatbot) 모듈을 통하여 실시예들에 따른 사용자 단말 장치로부터 메시지를 수신한다. 사용자 단말 장치로부터 메시지는 예를 들어, 도 1에서 설명한 요청 메시지(request message)일 수 있다. 요청 메시지는 챗봇을 통하여 수신되는 텍스트 데이터, 이미지 데이터, 영상 데이터, 및/또는 음성 데이터 등을 포함할 수 있다.
S201 단계는, 메시지로부터 텍스트 데이터를 파싱(parsing)한다. S201 단계는 메시지 내에 포함된 텍스트 데이터를 추출할 수 있다. S201 단계는, 수신된 텍스트 데이터가 요청성 내용을 포함하는지 여부를 판단할 수 있다.
S202 단계는, 텍스트 데이터를 분석하여, 하나 또는 그 이상의 유효 키워드를 생성한다. S202 단계는 추출된 텍스트 데이터를 분석한다. 예를 들어, S202 단계는 텍스트 데이터의 언어(language)를 분석하여, 사용자가 요청하는 웹 서비스의 운영 국가를 파악할 수 있다. S202 단계는 텍스트 데이터를 수신하여 이들에 대한 형태소를 분석할 수 있고, 각 형태소에 대하여 품사를 태깅(tagging)하여, 하나 또는 그 이상의 유효 키워드를 생성하기 위한 전처리 과정을 수행할 수 있다. S202 단계는, 전처리된 텍스트 데이터로부터 하나 또는 그 이상의 유효 키워드를 추출할 수 있다. 하나 또는 그 이상의 유효 키워드는 예를 들어 단어의 빈도수를 활용한 알고리즘을 이용하여 추출될 수 있다.
1) 사용자로부터 수신한 요청 메시지 내 단어 별로 용어 빈도수
Figure 112021010094898-pat00004
값을 도출한다.
S202 단계는, 용어 빈도수 tf(t, d)는 예를 들어, 아래와 같은 방법들 중 적어도 하나에 기초하여 도출할 수 있다.
제 1 방법:
Figure 112021034981732-pat00005
제 2 방법:
Figure 112021034981732-pat00006
제 3 방법:
Figure 112021034981732-pat00007
여기서, 사용자로부터 수신한 요청 메시지를 단어 별로 분리하여 집합으로 나타낸 집합을 d라고 하고, d에 포함된 특정 단어를 t라고 한다. f t,d 는 사용자로부터 수신한 요청 메시지 내에서 단어 t가 포함되는 개수를 나타낸다.
2) 단어 별로 문서 빈도수 값 df(t,D)를 도출한다.
여기서, D는 사용자로부터 수신한 요청 메시지만이 아닌 전체 문서에 대한 단어의 집합을 의미한다. D는 예를 들어, 실시예들에 따른 챗봇 기반 콘텐츠 관리 장치(또는 그 서버)가 임의로 보유하는 문서일 수도 있다. 문서 빈도수 값은 아래와 같은 수학식에 기초하여 도출할 수 있다.
Figure 112021034981732-pat00008
3) 단어 별로, 위 1)과정에서 도출한 용어 빈도수 tf(t,d)값에, 위 2)과정에서 도출한 문서 빈도수 값 df(t,D)을 나눈다.
4) 단어 별로 위 3)에서 도출한 td(t,d)/df(t,D)의 값이 임계치(threshold) 값과 비교하여, 임계치(threshold) 값보다 높은 단어를 키워드 정보에 포함한다. 임계치 값은 예를 들어, 사용자에 의해 설정되거나, 시스템에 의해 설정될 수도 있다.
S202 단계는, 생성된 하나 또는 그 이상의 유효 키워드를 이용하여, 추가적인 유효 키워드를 더 생성할 수 있다. S202 단계는, 추가적인 유효 키워드를 생성하기 위한 텍스트 데이터 그래프(text data graph)를 저장할 수 있다. 즉, 실시예들에 따른 챗봇 기반 콘텐츠 관리 장치의 저장부는 텍스트 데이터 그래프(text data graph)를 저장할 수 있다.
텍스트 데이터 그래프(text data graph)란, 문장 내에서 함께 발생하는 단어 또는 토픽 정보를 바탕으로 두 단어 간의 유사도를 그래프 형태로 나타낸 자료 구조를 의미한다. 예를 들어, 문장 내 동시에 발생하는 두 단어(단어는 vertex로 표현될 수 있음)가 있을 경우, 두 단어는 서로 간선(edge)로 이어져 있을 수 있다. 또한, 두 단어(vertex)를 잇는 하나의 간선(edge)은 가중치(weight) 정보를 더 포함할 수 있다. 가중치 정보는 두 단어가 하나의 문장 내에 포함되는 경우의 수에 대한 정보이다. 예를 들어, 두 단어가 빈번하게 하나의 문장에서 발생할 경우, 해당 간선은 높은 가중치를 가질 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 장치의 저장부는 빅 데이터를 이용하여 웹 페이지들을 수집하고, 수집된 웹 페이지들 내에 포함된 문장들을 분석하여, 상술한 텍스트 데이터 그래프를 생성 및 저장할 수 있다. 텍스트 데이터 그래프는 사용자로부터 수신한 요청 메시지에 포함된 문장에 의하여 업데이트될 수 있다.
S202 단계는, 사용자로부터 수신한 요청 메시지로부터 유효 키워드들을 추출하고, 텍스트 데이터 그래프를 이용하여, 유효 키워드로부터 일정 간선 이내에 포함된 단어들을 더 추가함으로써, 추가 유효 키워드를 생성할 수 있다.
S202 단계는, 각 유효 키워드 및/또는 추가 유효 키워드에 점수(score)를 부여하고, 추후에 사용자로부터 수신되는 요청 메시지를 반복하여 분석하여 각 각 유효 키워드 및/또는 추가 유효 키워드에 대한 점수(score)를 수정할 수 있다. S202 단계는, 요청 메시지를 일정 횟수 이상 반복하여 각 유효 키워드 및/또는 추가 유효 키워드에 대한 점수(score)를 업데이트할 수 있고, 업데이트된 점수들 중 일정 스레숄드(threshold) 이상의 점수를 가지는 유효 키워드 및/또는 추가 유효 키워드만을 추출할 수 있다.
S203 단계는, 하나 또는 그 이상의 유효 키워드에 기초하여 하나 또는 그 이상의 기초 템플릿(basic template)을 생성한다. 하나 또는 그 이상의 유효 키워드는 예를 들어, S202 단계에서 추출한 유효 키워드 및/또는 추가 유효 키워드 (또는 일정 점수(score) 이상을 가지는 유효 키워드 및/또는 추가 유효 키워드) 를 의미할 수 있다.
S203 단계는, S202 단계에서 추출한 유효 키워드 및/또는 추가 유효 키워드를 이용하여 기초 템플릿(basic template)를 생성 또는 선택한다. 기초 템플릿은 예를 들어, 실시예들에 따른 챗봇 기반 콘텐츠 관리 장치가 저장하는 웹 페이지 템플릿들을 의미할 수 있다. 기초 템플릿은, 기초적인 뼈대를 구성하는 웹 페이지를 의미하며, 기 설정된 레이아웃을 포함할 수 있다. 기초 템플릿은, 사용자가 원하는 키워드를 매핑할 수 있는 하나 또는 그 이상의 컴포넌트(component)들을 포함할 수 있다.
S203 단계는, 기초 템플릿을 생성 또는 선택하기 위하여, S202 단계에서 추출한 유효 키워드 및/또는 추가 유효 키워드를 데이터베이스에 검색할 수 있다. S203 단계는, 데이터로부터 검색하여 사용자가 원하는 페이지와 유사한 기 존재하는 웹 페이지들을 조회할 수 있다. S203 단계는, 데이터베이스에 의해 조회된 웹 페이지들에 대응하는 기초 템플릿들을 출력함으로써, 사용자가 사용하게 될 기초 템플릿들을 결정할 수 있다. S203 단계는 사용자 단말 장치로, 조회된 기초 템플릿들을 전송할 수 있고, 사용자는 기초 템플릿들 중 하나 또는 그 이상을 선택할 수 있다.
S204 단계는, 하나 또는 그 이상의 기초 템플릿에 하나 또는 그 이상의 유효 키워드를 매핑(mapping)하여 하나 또는 그 이상의 최종 템플릿(final template)를 생성한다. 하나 또는 그 이상의 유효 키워드는 예를 들어, S202 단계에서 추출한 유효 키워드 및/또는 추가 유효 키워드 (또는 일정 점수(score) 이상을 가지는 유효 키워드 및/또는 추가 유효 키워드)를 의미할 수 있다.
S205 단계는 하나 또는 그 이상의 최종 템플릿을 사용자의 단말 장치로 전송한다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 챗봇 모듈을 이용하여 키워드를 추출하고 키워드를 기초 템플릿에 매핑함으로써, 사용자의 별다른 조작 없이 사용자에게 원하는 웹 페이지를 효과적으로 제공할 수 있는 효과를 제공한다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 빅데이터를 활용하여 기초 템플릿을 결정함으로써, 사용자에게 획일적인 기 제작된 템플릿을 제공하는 것이 아닌 사용자의 니즈에 맞는 어플리케이션 또는 웹 페이지를 효과적으로 제공할 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 사용자의 요청 메시지로부터 추출한 유효 키워드에 기반하여 기초 템플릿을 생성하고, 최종 템플릿을 생성함으로써, 사용자의 성향에 맞게 커스터마이징할 수 있어, 사용자의 니즈에 맞는 어플리케이션 또는 웹 페이지를 효과적으로 제공할 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 사용자의 요청 메시지로부터 형태소 분석을 통해 사용자의 서비스 론칭 국가 및/또는 사용자의 요구하는 분야를 효과적으로 파악할 수 있어, 빠른 시간으로 정확하게 국가 별로 견적을 자동으로 계산할 수 있다.
도 3은 실시예들에 따른 챗봇 기반 콘텐츠 관리 시스템의 흐름도를 나타낸 것이다.
도 3에 나타난 챗봇 기반 콘텐츠 관리 시스템은 도 1 내지 도 2에서 설명한 챗봇 기반 콘텐츠 관리 시스템을 의미한다. 도 3에 나타난 챗봇 기반 콘텐츠 관리 시스템은 사용자의 단말 장치(30)와 서버(31) 간의 통신으로 이루어질 수 있다.
사용자의 단말 장치(30)는 예를 들어, 도 1 내지 도 2에서 설명한 사용자의 단말 장치를 의미하고, 서버(31)는 예를 들어 도 1 내지 도 2에서 설명한 실시예들에 따른 챗봇 기반 콘텐츠 관리 장치 (또는 그 챗봇 기반 콘텐츠 관리를 운용하는 서버)를 의미할 수 있다.
사용자의 단말 장치(30)는 실시예들에 따른 서버(31)로 요청 메시지를 전송(300)할 수 있다. 요청 메시지는 예를 들어 도 1 내지 도 2에서 설명한 요청 메시지를 의미할 수 있다.
서버(31)는 요청 메시지(300)를 수신하고, 이들을 파싱 및 분석할 수 있다. 파싱 및 분석은 예를 들어 도 2에서 설명한 바에 따라 수행될 수 있다. 서버(31)는 요청 메시지(300)를 파싱 및 분석하여, 유효 키워드를 추출할 수 있다. 하지만, 서버(31)가 추출한 유효 키워드가 충분하지 않은 경우, 서버(31)는 사용자에게 추가적인 정보를 요청하기 위해 정보 유도성 메시지(302)를 단말 장치(30)로 전송할 수 있다. 예를 들어, 서버(31)가 추출한 유효 키워드의 수가 일정 수보다 적은 경우(예를 들어, 유효 키워드의 수가 5개 이하인 경우), 또는 서버(31)가 추출한 유효 키워드들이 도 2에서 설명한 텍스트 데이터 그래프(text data graph) 내에서 일정 간선 거리(edge distance) 이하 내에 속해있는 경우(즉, 유효 키워드들이 모두 유의어이거나 동일한 의미만을 포함하는 경우)가 있을 수 있다. 이 경우 서버(31)는 사용자가 원하는 기초 템플릿을 결정하기 충분하지 않으므로, 사용자에게 추가적인 정보를 유도하기 위한 정보 유도성 메시지(302)를 전송할 수 있다.
정보 유도성 메시지(302)는 예를 들어, 시스템 내에서 기 설정된 질문 메시지(예를 들어, “어떤 목적으로 웹 페이지를 개설하고자 하십니까?” 등)를 의미할 수 있다. 또는 정보 유도성 메시지(302)는 예를 들어, 이전에 수신한 요청 메시지(300)들로부터 추출한 유효 키워드를 포함하는 질문(예를 들어, 유효 키워드가 '특허'인 경우, 정보 유도성 메시지(302)는 “'특허'와 관련된 어떤 서비스를 제공하고자 하십니까?” 등)일 수도 있다.
서버(31)는 정보 유도성 메시지(302)를 사용자 단말 장치(30)으로 전송하고, 사용자 단말 장치(30)로부터 정보 유도성 메시지(302)에 대한 응답으로 요청 메시지(303)를 수신할 수 있다.
서버(31)는 정보 유도성 메시지(302)에 대한 응답으로 요청 메시지(303)를 다시 파싱 및 분석하여, 유효 키워드를 추출하고, 여기서 서버(31)가 추출한 유효 키워드가 충분하지 않은 경우, 서버(31)는 사용자에게 추가적인 정보를 요청하기 위해 정보 유도성 메시지(302)를 다시 단말 장치(30)로 전송할 수 있다.
서버(31)는 단말 장치(30)로부터 수신한 요청 메시지(300) 또는 정보 유도성 메시지(302)에 대한 응답으로 요청 메시지(303)를 수신하고, 유효 키워드가 충분하다고 판단할 경우, 기초 템플릿(basic template, 304)들을 생성 및 추출할 수 있다. 기초 템플릿(basic template, 304)은 예를 들어, 도 1 내지 도 2에 나타난 기초 템플릿을 의미할 수 있다.
서버(31)는 생성 및/또는 추출한 기초 템플릿(304)들을 사용자 단말 장치(30)로 전송(305)할 수 있다. 서버(31)는, 사용자 단말 장치(30)에게 생성 및/또는 추출한 기초 템플릿(304)들을 제공하고, 사용자는 기초 템플릿(304)들 중 하나 또는 그 이상을 선택할 수 있다. 사용자 단말 장치(30)는 사용자에 의해 선택된 하나 또는 그 이상의 기초 템플릿들을 전송할 수 있고, 사용자가 요구하는 추가 정보에 대한 정보도 서버(31)에 전송할 수 있다.
추가 정보(306)는 예를 들어, 기초 템플릿의 커스터마이징(customizing)과 관련된 정보를 의미할 수 있다. 예를 들어, 사용자가 기초 템플릿의 레이아웃(layout) 중 제목 부분에 대한 레이아웃의 크기 또는 할당 비율을 늘리고 싶다면, 해당 제목 부분에 대한 레이아웃의 크기 또는 할당 비율에 대한 수정 정보를 의미할 수도 있다. 예를 들어, 추가 정보는, 사용자가 기초 템플릿의 어트리뷰트들 중 배경 색깔(background-color)을 노랑색에서 초록색으로 수정할 경우, 해당 수정 내용을 포함한 정보를 의미할 수 있다.
추가 정보(306)는 예를 들어, 사용자가 직접 추가하고 싶은 문구일 수도 있다. 예를 들어, 사용자가, 회사 연혁과 관련된 페이지 내에 들어갈 문구를 추가 정보(306)로 직접 제공할 수 있다. 예를 들어, 사용자가, 웹 페이지의 타이틀(title)을 원하는 문구로 설정하고 싶을 경우, 웹 페이지의 타이틀(title) 문구를 추가 정보(306)로 직접 제공할 수 있다.
서버(31)는 사용자로부터 선택된 하나 또는 그 이상의 기초 템플릿들 및 사용자로부터 수신한 추가 정보(306)에 기초하여, 최종 템플릿(final template)을 생성할 수 있다. 최종 템플릿(final template)은 사용자로부터 선택된 하나 또는 그 이상의 기초 템플릿들 내에 포함된 컴포넌트(component)들에, 유효 키워드들 및/또는 사용자로부터 수신한 추가 정보를 매핑(mapping)함으로써 생성될 수 있다.
예를 들어, 서버(31)가 추출한 유효 키워드들 내에 '공연물 관람 플랫폼' 키워드가 포함되어 있다면, 제목을 구성하는 컴포넌트(예를 들어, <h1> 태그, id를 제목과 관련된 이름으로 구성된 <div> 태그 등)에 '공연물 관람 플랫폼'을 매핑할 수 있다.
서버(31)는, 서버(31)가 추출한 유효 키워드를 컴포넌트(component)들에 매핑할 경우, 유효 키워드를 수식하는 형용사 단어 또는 수식 문구를 해당 유효 키워드와 결합하여 매핑할 수 있다. 예를 들어, 서버(31)가 추출한 유효 키워드들 내에 '공연물 관람 플랫폼' 키워드가 포함되어 있다면, 해당 키워드에 '키다리 아저씨의'를 결합하여, 제목을 구성하는 컴포넌트에 '키다리 아저씨의 공연물 관람 플랫폼'을 매핑할 수 있다.
유효 키워드를 수식하는 형용사 단어 또는 수식 문구는, 도 2에서 설명한 텍스트 데이터 그래프(text data graph)를 이용하여, 해당 유효 키워드로부터 일정 거리 이내에 포함된 단어(vertex) 중 형용사 또는 수식어에 해당하는 문구를 추출함으로써 생성될 수 있다. 유효 키워드를 수식하는 형용사 단어 또는 수식 문구는 다른 방법으로, 좋은 감정을 내포하는 단어 리스트 내에서 추출할 수도 있다.
서버(31)는 생성된 최종 템플릿(308)를 단말 장치(30)로 전송할 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 챗봇 모듈을 이용하여 키워드를 추출하고 키워드를 기초 템플릿에 매핑함으로써, 사용자의 별다른 조작 없이 사용자에게 원하는 웹 페이지를 효과적으로 제공할 수 있는 효과를 제공한다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 빅데이터를 활용하여 기초 템플릿을 결정함으로써, 사용자에게 획일적인 기 제작된 템플릿을 제공하는 것이 아닌 사용자의 니즈에 맞는 어플리케이션 또는 웹 페이지를 효과적으로 제공할 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 사용자의 요청 메시지로부터 추출한 유효 키워드에 기반하여 기초 템플릿을 생성하고, 최종 템플릿을 생성함으로써, 사용자의 성향에 맞게 커스터마이징할 수 있어, 사용자의 니즈에 맞는 어플리케이션 또는 웹 페이지를 효과적으로 제공할 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 방법 및 장치는, 사용자의 요청 메시지로부터 형태소 분석을 통해 사용자의 서비스 론칭 국가 및/또는 사용자의 요구하는 분야를 효과적으로 파악할 수 있어, 빠른 시간으로 정확하게 국가 별로 견적을 자동으로 계산할 수 있다.
도 4는 실시예들에 따른 챗봇 기반 콘텐츠 관리 시스템이 기초 템플릿(basic template)에 유효 키워드를 매핑(mapping)하여 실시예들에 따른 최종 템플릿(final template)를 생성하는 과정을 나타낸다.
도 4에 나타난 동작들은 예를 들어, 도 1의 챗봇 기반 콘텐츠 관리 장치(또는 그 서버)(100), 도 2의 S203 내지 S204 단계, 도 3의 실시예들에 따른 서버(31)에서 수행될 수 있다. 도 4에 나타난 동작은 도 3의 기초 템플릿 생성(304) 및 최종 템플릿 생성(307) 동작을 의미할 수 있다.
도 4의 좌측 도면은 기초 템플릿(basic template)의 예시를 나타낸다. 기초 템플릿은 예를 들어, HTML, CSS 및/또는 자바스크립트 등으로 구성된 파일 또는 파일들을 의미할 수 있다. 기초 템플릿(400)은 웹 페이지의 구조적인 레이아웃과 레이아웃을 구성하는 컴포넌트들의 어트리뷰트(예를 들어, 웹 페이지의 전체적인 색상, 웹 페이지를 구성하는 컴포넌트들의 배치 방법(예를 들어, flex 등), 컴포넌트들의 align 값들 등) 등 만을 포함하는 기본적인 템플릿을 의미할 수 있다. 레이아웃(layout)은 예를 들어, 그리드(grid)에 기반하여 구성될 수 있다. 컴포넌트들(400a)은 예를 들어, <div>, <img>, <h1>, <a>, <article> 등과 같이 웹 페이지를 구성하는 요소들을 의미할 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 장치는, 사용자로부터 수신되는 요청 메시지를 파싱 및 분석하여, 하나 또는 그 이상의 유효 키워드들을 생성 및 추출하고, 이들에 기초하여 기초 템플릿을 생성할 수 있다. 기초 템플릿은 예를 들어, 챗봇 기반 콘텐츠 관리 장치(또는 그 서버) 내에 포함된 웹 페이지를 구성하는 데이터일 수 있으며, 챗봇 기반 콘텐츠 관리 장치(또는 그 서버) 내의 저장부 또는 데이터베이스에서 저장될 수 있다.
도 4의 우측 도면은 최종 템플릿(final template, 401)를 나타낸다. 최종 템플릿(401)은, 실시예들에 따른 기초 템플릿 내에 포함된 컴포넌트들(401a)에, 유효 키워드들 및/또는 사용자로부터 수신한 추가 정보를 매핑(mapping)하여 생성된 웹 페이지 등을 의미한다. 실시예들에 따른 챗봇 기반 콘텐츠 관리 장치는, 사용자로부터 추가 정보를 더 수신하고, 수신한 추가 정보를 기초 템플릿(basic template) 내의 컴포넌트들(401a)에 매핑할 수 있다.
예를 들어, 유효 키워드들 중 제목과 관련된 문구들 또는 유효 키워드들은 홈(home)을 나타내는 페이지 내 <h1> 태그 또는 <h2> 태그 등에 매핑될 수 있다. 예를 들어, 사용자로부터 수신한 추가 정보 중, 회사의 이미지를 나타내는 이미지 데이터는 홈(home)을 나타내는 페이지 내 <img> 또는 <div> 내의 background-url 등의 어트리뷰트 내에 매핑할 수 있다. 예를 들어, 유효 키워드들 중 회사의 위치 또는 회사의 연락처와 관련된 문구들 또는 유효 키워드들은, 'Contact us'와 같은 내용을 포함하고 있는 <div> 태그 내에 포함될 수 있거나, <footer>과 같이 웹 페이지의 최하단에 매핑될 수도 있다.
도 5는 실시예들에 따른 챗봇 기반 콘텐츠 관리 시스템이 빅데이터를 활용하여 웹페이지를 분석하는 과정을 나타낸다.
실시예들에 따른 콘텐츠 관리 장치는 빅데이터(big data)를 활용하여, 인터넷을 통해 웹 사이트들을 조회 및 웹 페이지를 수신하고, 이들을 분석할 수 있다.
실시예들에 따른 콘텐츠 관리 장치는 예를 들어, 인터넷을 이용하여 웹 페이지들을 수집할 수 있다. 실시예들에 따른 콘텐츠 관리 장치는 예를 들어, 접속할 수 있는 도메인을 생성하고, 생성된 도메인을 통해 해당 도메인에 대응하는 웹 페이지에 대한 HTML 파일, CSS 파일, 자바스크립트 파일 등을 다운로드함으로써 접속할 수 있다. 실시예들에 따른 콘텐츠 관리 장치는, 수신한 웹 페이지에 대한 데이터(파일)들을 수집할 수 있다.
실시예들에 따른 콘텐츠 관리 장치는 수집된 각 웹 페이지에 대한 데이터를 파싱(parsing)할 수 있다. 예를 들어, 실시예들에 따른 콘텐츠 관리 장치가 웹 페이지에 대한 HTML 파일을 수신하면, 해당 웹 페이지의 레이아웃을 파악하기 위하여, <div> 태그, <article> 태그, <img> 태그, <footer> 태그, <header> 태그 등을 추출하여, 이들로부터 해당 웹 페이지의 구성을 파악한다. 실시예들에 따른 콘텐츠 관리 장치는, 레이아웃을 구성하는데 사용되는 태그들과 해당 태그들의 어트리뷰트(attribute)를 이용하여, 레이아웃을 분류(500a)할 수 있다. 예를 들어, 실시예들에 따른 콘텐츠 관리 장치가 웹 페이지에 대한 CSS 파일을 수신하여, <div> 태그에 적용되는 display의 값(예를 들어, block, flex)을 추출할 수 있다. 더 나아가 display 어트리뷰트의 값이 flex인 경우, flex와 관련된 어트리뷰트들의 값들을 추출할 수 있다.
예를 들어, 실시예들에 따른 콘텐츠 관리 장치가 아래의 표에 나타난 바와 같은 HTML 파일을 수신한 경우를 가정한다.
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>Flexbox Layout Example</title>
<style>
.flex-container {
display: flex;
justify-content: space-around;
align-items: center;
background: #60B99A;
}
.flex-item {
margin: 10px;
padding: 20px;
color: #fff;
text-align: center;
border-radius: 5px;
background: #4584b1;
}
.st_01{
height: 20%;

}
</style>
</head>
<body>
<div class="flex-container">
<div class="flex-item">
<h1 class=”st_01”>사람이 미래다 OO 건설</h1>
<div> …</div>
<div>
<div class="flex-item">2</div>
<div class="flex-item">3</div>
</div>
</body>
</html>
실시예들에 따른 콘텐츠 관리 장치는 <body> 내에 포함된 <div>의 계층적 구조를 분석하여, 실시예들에 따른 콘텐츠 관리 장치가 저장하고 있는 기초 템플릿들 중 유사한 기초 템플릿들을 추출한다. 실시예들에 따른 콘텐츠 관리 장치는 계층적 구조를 분석할 경우, <div> 태그들 내에 포함된 class 속성들을 참조할 수 있다. 예를 들어, <div> 태그들 내에 포함된 class의 스타일(style)을 확인한 결과, display:flex (위 볼드 표시 참고)의 속성이 검출될 경우, flex와 관련된 어트리뷰트들 (위 밑줄 표시 참고)의 속성을 함께 검출하여, 레이아웃(layout)을 분석할 수 있다. 예를 들어, 위와 같이 <div> 태그 및/또는 <a>태그에 display:flex; 와 같이 flex 형태의 레이아웃이 검출될 수 있다. 이 경우, flex와 관련된 어트리뷰트들 (예를 들어, flex-direction, flex-wrap, justify-content, align-items, align-content, flex-grow, fles-basis 등)
실시예들에 따른 콘텐츠 관리 장치는 수집된 각 웹 페이지로부터 키워드를 추출할 수 있다. 웹 페이지 내에서 추출되는 키워드는 예를 들어, 해당 웹 페이지에서 많이 등장하는 단어, 웹 페이지의 제목에 자주 나타나는 단어에서 추출할 수 있다. 예를 들어, 실시예들에 따른 콘텐츠 관리 장치는 HTML 파일에서 <h1> 등과 같은 제목을 나타내는 태그들, 또는 <title>과 같이 웹 페이지의 제목과 연관된 태그 내에 포함된 문구를 형태소 단위로 분할하고, 분할된 문구들 중 <HTML> 파일 내에 많이 등장하는 단어를 키워드로 추출(500b)할 수 있다.
위 예시에서, 실시예들에 따른 콘텐츠 관리 장치는, <h1> 태그를 추출하여, '사람이 미래다 OO 건설' 문구를 추출할 수 있고, '사람이 미래다 OO 건설'로부터 키워드로 '건설' 등을 추출할 수 있다.
실시예들에 따른 콘텐츠 관리 장치는 수집된 각 웹 페이지로부터, 해당 웹 페이지에 대한 주요 어트리뷰트 정보를 추출할 수 있다. 주요 어트리뷰트 정보는 예를 들어, 해당 웹 페이지에서 자주 사용되는 글꼴(font) 또는 자주 사용되는 색상 정보(color) 등을 의미할 수 있다. 실시예들에 따른 콘텐츠 관리 장치는 수집된 각 웹 페이지의 CSS 파일 또는 HTML 파일 내의 style 어트리뷰트로부터 색상을 나타내는 정보(예를 들어, font-color, background-color, background-url 등의 값들) 또는 글꼴 또는 글씨크기 등과 관련된 정보(예를 들어, font-size, text-align의 값들)를 추출(500c)할 수 있다.
위 예시에서, 실시예들에 따른 콘텐츠 관리 장치는, HTML 파일 내의 <style> 태그 또는 style 어트리뷰트 내의 데이터들, 또는 CSS 파일 내에서, 주요 어트리뷰트와 관련된 데이터를 추출할 수 있다. 예를 들어, 실시예들에 따른 콘텐츠 관리 장치는 background: #60B99A; color: #fff; background: #4584b1; 와 같이 배경색 또는 글꼴의 색 등을 추출할 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 장치의 저장부는 위와 같이 분석한 데이터를 콘텐츠 관리 장치(100) 내 데이터베이스에 저장할 수 있다. 콘텐츠 관리 장치(100)는 빅데이터(102)를 이용하여 수집한 인터넷 웹 사이트들의 레이아웃(layout), 웹 사이트의 종류, 웹 사이트의 키워드, 웹 사이트의 어트리뷰트(예를 들어, 색깔, 글꼴, 글씨 색깔, 이미지 등)를 추출 및 생성하고, 이들을 데이터베이스 내에 저장할 수 있다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 장치는, 각 웹페이지마다 위와 같은 방법으로 분석하여, 각 웹 페이지의 레이아웃, 키워드 및/또는 어트리뷰트 정보를 추출하고, 추출된 정보에 기초하여 해당 웹 페이지와 유사한 기초 템플릿(basic template)를 결정한다. 예를 들어, 실시예들에 따른 챗봇 기반 콘텐츠 관리 장치는, 각 웹페이지에 대하여, 레이아웃의 구조가 동일한 기초 템플릿을 결정하여, 해당 기초 템플릿(기초 템플릿을 식별하는데 사용되는 정보)과 해당 웹 페이지에 대한 분석된 데이터를 하나의 데이터 세트로 데이터베이스에 저장할 수 있다. 실시예들에 따른 챗봇 기반 콘텐츠 관리 장치의 저장부는 위와 같이 분석한 데이터를 기초 템플릿을 식별하는데 사용되는 정보와 결합하여 저장할 수 있다.
또한, 실시예들에 따른 챗봇 기반 콘텐츠 관리 장치의 저장부는 빅 데이터를 이용하여 웹 페이지들을 수집하고, 수집된 웹 페이지들 내에 포함된 문장들을 분석하여, 상술한 텍스트 데이터 그래프를 생성 및 저장할 수 있다. 텍스트 데이터 그래프는 사용자로부터 수신한 요청 메시지에 포함된 문장에 의하여 업데이트될 수 있다.
도 6은 실시예들에 따른 챗봇 기반 콘텐츠 관리 시스템이 빅데이터를 활용하여 웹페이지를 분석 및 저장하는 과정을 나타낸다.
도 6은 실시예들에 따른 챗봇 기반 콘텐츠 관리 시스템에서, 웹 페이지들을 수집, 파싱 및 분석하여 저장된 각 웹페이지들에 대한 레이아웃 정보, 어트리뷰트 정보 및/또는 키워드 정보, 해당 웹 페이지에 대응되는 기초 템플릿(basic template)를 저장하는 데이터베이스의 스키마(600)의 예시이다.
실시예들에 따른 챗봇 기반 콘텐츠 관리 시스템은 웹 페이지를 수집, 분석하여 도 6에 나타난 바와 같은 데이터베이스 스키마로 저장할 수 있다.
layout_type은 웹 페이지의 레이아웃의 종류를 나타낸다. 예를 들어, layout_type의 값이 1이면, 상단부터 하단까지 선형적인 구조의 레이아웃을 의미할 수 있고, layout_type의 값이 2이면, 최상단에 제 1 블록, 두 번째 행에는 2개의 열을 가지고 최하단에는 푸터(footer)가 존재하는 구조를 의미할 수 있다.
web_url은 수집 및 분석된 웹 페이지의 URL, 도메인 주소 또는 IP주소 등을 의미할 수 있다. web_url은 예를 들어, 해당 데이터베이스 스키마(600)의 프라이빗 키(private key)일 수도 있다.
classification_code는 해당 웹 페이지의 분석 결과, 해당 웹 페이지에 대응하는 기초 템플릿(basic template)을 식별하는 정보를 나타낸다. 예를 들어, 도 6에 www.naver.com의 url을 가지는 웹페이지는 A001의 식별자를 가지는 기초 템플릿에 대응된다. 예를 들어, 도 6에 www.ddd.com의 url을 가지는 웹페이지는 S001의 식별자를 가지는 기초 템플릿에 대응된다.
keyword는 해당 웹 페이지의 분석 결과, 해당 웹 페이지에 포함된 키워드를 의미한다. 예를 들어, www.naver.com의 url을 가지는 웹페이지는 HTML 파일 내에서 빈번하게 등장하는 단어인 '검색'을 키워드로 가질 수도 있고, 자바스크립트 파일 또는 기타 액티비티를 위한 파일(예를 들어, 파이썬 파일 등)에 검색 엔진 API가 검출되었으므로 '포탈, '검색' 등을 키워드로 가질 수도 있다. 예를 들어, 전자제품을 전문적으로 판매하는 사이트인 www.aaa.com의 url을 가지는 웹페이지는 <h1> 태그와 같이 제목과 관련된 태그에 '전자', '제품', 등이 빈번하게 사용될 수 있으므로, 키워드는 '전자', '제품', '컴퓨터' 등일 수 있다.
background_combination(601)은 해당 웹 페이지의 분석 결과, 해당 웹 페이지에 포함된 주요 어트리뷰트를 의미할 수 있다. 주요 어트리뷰트는 하나의 스키마 내에 포함될 수도 있지만, 관계형 데이터베이스 모델에 따라, 다른 스키마에 별도로 저장(602)될 수도 있다. 다른 스키마(602)에는 예를 들어, background_combination 정보를 속성으로 가질 수 있고, 주요 배경색상을 나타내기 위한 background-color 속성, 주요 배경에 대한 url 정보를 나타내기 위한 background-url 정보 등을 포함할 수 있다.
도 7은 실시예들에 따른 콘텐츠 관리 방법을 제공하기 위한 서버의 하드웨어 구성도의 예시이다.
도 7을 참조하면, 콘텐츠 관리 장치(또는 이를 제공하기 위한 서버) (100)는, 적어도 하나의 프로세서(processor, 110); 적어도 하나의 프로세서(110)가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory, 120)를 포함할 수 있다.
여기서 적어도 하나의 프로세서(110)는 중앙 처리 장치(central processing unit, CPU), 그래픽 처리 장치(graphics processing unit, GPU), 또는 본 발명의 실시예들에 따른 방법들이 수행되는 전용의 프로세서를 의미할 수 있다. 메모리(120) 및 저장 장치(160) 각각은 휘발성 저장 매체 및 비휘발성 저장 매체 중에서 적어도 하나로 구성될 수 있다. 예를 들어, 메모리(120)는 읽기 전용 메모리(read only memory, ROM) 및 랜덤 액세스 메모리(random access memory, RAM) 중에서 적어도 하나로 구성될 수 있다.
또한, 콘텐츠 관리 장치(또는 이를 제공하기 위한 서버) (100)는, 무선 네트워크를 통해 통신을 수행하는 송수신 장치(transceiver, 130)를 포함할 수 있다. 또한, 콘텐츠 관리 장치(또는 이를 제공하기 위한 서버) (100)는 입력 인터페이스 장치(140), 출력 인터페이스 장치(150), 저장 장치(160) 등을 더 포함할 수 있다. 콘텐츠 관리 장치(또는 이를 제공하기 위한 서버) (100)에 포함된 각각의 구성 요소들은 버스(bus, 170)에 의해 연결되어 서로 통신을 수행할 수 있다.
상기와 같은 문제점을 해결하기 위하여, 실시예들에 따른 빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 장치(또는 그 서버)는, 적어도 하나의 프로세서(processor); 및/또는 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함할 수 있다.
실시예들에 따른 적어도 하나의 단계는: 챗봇(chatbot) 모듈을 통하여 사용자 단말 장치로부터 메시지를 수신하는 단계; 메시지로부터 텍스트 데이터를 파싱(parsing)하는 단계; 텍스트 데이터를 분석하여, 하나 또는 그 이상의 유효 키워드를 생성하는 단계; 하나 또는 그 이상의 유효 키워드에 기초하여 하나 또는 그 이상의 기초 템플릿(basic template)을 생성하는 단계; 하나 또는 그 이상의 기초 템플릿에 하나 또는 그 이상의 유효 키워드를 매핑(mapping)하여 하나 또는 그 이상의 최종 템플릿(final template)를 생성하는 단계; 및 하나 또는 그 이상의 최종 템플릿을 사용자의 단말 장치로 전송하는 단계; 를 포함할 수 있다.
실시예들에 따른 하나 또는 그 이상의 기초 템플릿은 유효 키워드를 입력 레이어(input layer)로 입력 받아, 크로스 엔트로피(cross entropy) 손실 함수를 이용하여 학습하고, 기초 템플릿들에 대한 확률 값들을 출력 레이어(output layer)로 출력하도록 구성된 뉴럴 네트워크 모델에 기초하여 생성될 수 있다.
나아가, 실시예들에 따른 하나 또는 그 이상의 유효 키워드를 생성하는 단계는 텍스트 데이터를 형태소 단위로 분할하고, 분할된 각 형태소에 품사를 부착하는 단계 및 각 분할된 형태소별로 용어 빈도수를 계산하는 단계를 포함할 수 있다.
실시예들에 따른 하나 또는 그 이상의 유효 키워드는, 텍스트 데이터 내 포함된 단어 t별로 용어 빈도수 값 및 문서 빈도수 값을 도출하고, 단어 t별로 빈도수 정보에 문서 빈도수 값을 나누고, 나눈 값을 임계치 값과 비교함으로써 생성될 수 있다.
[수학식 1]
Figure 112021010094898-pat00009
[수학식 2]
Figure 112021034981732-pat00010
실시예들에 따른 용어 빈도수 값 tf(d, f)는 상기 수학식 1에 의해 도출되고, 문서 빈도수 값 df(t, D)은 상기 수학식 2에 의해 도출될 수 있다. 여기서, d는 텍스트 데이터 내 포함된 모든 단어의 집합이고, D는 전체 문서에 대한 단어의 집합이고,
Figure 112021010094898-pat00011
는 텍스트 데이터 내에서 단어 t가 포함되는 개수를 나타낼 수 있다.
실시예들에 따르면, 적어도 하나의 단계는: 복수의 웹 페이지 데이터를 수집하는 단계; 및/또는 각 웹 페이지 내 태그(tag) 정보 및 스타일(style) 정보에 기초하여, 각 웹 페이지의 레이아웃(layout)을 나타내는 정보, 각 웹 페이지의 어트리뷰트(attribute)를 나타내는 정보 및 각 웹 페이지에 관한 키워드(keyword) 정보를 데이터베이스에 저장하는 단계; 를 포함할 수 있다.
실시예들에 따르면, 기초 템플릿은 하나 또는 그 이상의 유효 키워드를 데이터베이스로부터 검색하여 추출된 결과에 기초하여 결정될 수 있다. 데이터베이스부는 예를 들어 저장 장치(160)를 의미할 수 있다.
본 발명에 따른 방법들은 다양한 컴퓨터 수단을 통해 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 본 발명을 위해 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독 가능 매체의 예에는 롬(ROM), 램(RAM), 플래시 메모리(flash memory) 등과 같이 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령의 예에는 컴파일러(compiler)에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터(interpreter) 등을 사용해서 컴퓨터에 의해 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 적어도 하나의 소프트웨어 모듈로 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
또한, 상술한 방법 또는 장치는 그 구성이나 기능의 전부 또는 일부가 결합되어 구현되거나, 분리되어 구현될 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (5)

  1. 적어도 하나의 프로세서(processor); 및
    상기 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함하고,
    상기 적어도 하나의 단계는:
    챗봇(chatbot) 모듈을 통하여 사용자 단말 장치로부터 메시지를 수신하는 단계;
    상기 메시지로부터 텍스트 데이터를 파싱(parsing)하는 단계;
    상기 텍스트 데이터를 형태소 단위로 분할하고, 분할된 각 형태소에 품사를 부착하고, 각 분할된 형태소별로 용어 빈도수를 계산하는 과정을 통하여, 하나 또는 그 이상의 유효 키워드를 생성하는 단계;
    상기 하나 또는 그 이상의 유효 키워드에 기초하여 하나 또는 그 이상의 기초 템플릿(basic template)을 생성하는 단계,
    상기 하나 또는 그 이상의 기초 템플릿은 유효 키워드를 입력 레이어(input layer)로 입력 받아, 크로스 엔트로피(cross entropy) 손실 함수를 이용하여 학습하고, 기초 템플릿들에 대한 확률 값들을 출력 레이어(output layer)로 출력하도록 구성된 뉴럴 네트워크 모델에 기초하여 생성됨;
    상기 하나 또는 그 이상의 기초 템플릿에 상기 하나 또는 그 이상의 유효 키워드를 매핑(mapping)하여 하나 또는 그 이상의 최종 템플릿(final template)를 생성하는 단계; 및
    상기 하나 또는 그 이상의 최종 템플릿을 상기 사용자의 단말 장치로 전송하는 단계; 를 포함하고,
    상기 하나 또는 그 이상의 유효 키워드는 상기 텍스트 데이터 내 포함된 단어 t 별로 용어 빈도수 값 및 문서 빈도수 값을 도출하고, 단어 t 별로 상기 용어 빈도수 값에 상기 문서 빈도수 값을 나누고, 나눈 값을 임계치 값과 비교함으로써 생성되며,
    상기 용어 빈도수 값 tf(d, f)
    Figure 112021034981732-pat00022
    수식에 의해 도출되고, 상기 문서 빈도수 값 df(t, D)
    Figure 112021034981732-pat00023
    수식에 의해 도출되고,
    상기 d는 상기 텍스트 데이터 내 포함된 모든 단어의 집합이고, 상기 D는 전체 문서에 대한 단어의 집합이고, 상기 ft,d 는 상기 텍스트 데이터 내에서 상기 단어 t 가 포함되는 개수를 나타내는,
    서버.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
KR1020210010629A 2021-01-26 2021-01-26 빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 방법 및 장치 KR102280028B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210010629A KR102280028B1 (ko) 2021-01-26 2021-01-26 빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210010629A KR102280028B1 (ko) 2021-01-26 2021-01-26 빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 방법 및 장치

Publications (1)

Publication Number Publication Date
KR102280028B1 true KR102280028B1 (ko) 2021-07-21

Family

ID=77143425

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210010629A KR102280028B1 (ko) 2021-01-26 2021-01-26 빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102280028B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102666928B1 (ko) * 2023-09-20 2024-05-20 (주)뮤자인 챗봇을 이용한 컨텐츠 관리 시스템

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101894060B1 (ko) 2017-12-15 2018-08-31 유승재 사용자 분석기반 챗봇을 이용한 지능형 광고 제공 서버
KR20190065197A (ko) * 2017-06-28 2019-06-11 주식회사 오리지널메이커스 웹 문서 생성 방법 및 그 장치
KR20190118108A (ko) * 2018-03-12 2019-10-17 삼성전자주식회사 전자 장치 및 그의 제어방법
KR102083786B1 (ko) * 2018-09-13 2020-04-23 포항공과대학교 산학협력단 문자열 식별 방법 및 장치, 그리고 이를 이용한 디스플레이 영상 식별 시스템
KR102155739B1 (ko) * 2019-10-24 2020-09-14 한경훈 질의응답 데이터 셋을 적응적으로 재사용하는 챗봇 서비스 제공 방법, 서버, 및 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190065197A (ko) * 2017-06-28 2019-06-11 주식회사 오리지널메이커스 웹 문서 생성 방법 및 그 장치
KR101894060B1 (ko) 2017-12-15 2018-08-31 유승재 사용자 분석기반 챗봇을 이용한 지능형 광고 제공 서버
KR20190118108A (ko) * 2018-03-12 2019-10-17 삼성전자주식회사 전자 장치 및 그의 제어방법
KR102083786B1 (ko) * 2018-09-13 2020-04-23 포항공과대학교 산학협력단 문자열 식별 방법 및 장치, 그리고 이를 이용한 디스플레이 영상 식별 시스템
KR102155739B1 (ko) * 2019-10-24 2020-09-14 한경훈 질의응답 데이터 셋을 적응적으로 재사용하는 챗봇 서비스 제공 방법, 서버, 및 시스템

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102666928B1 (ko) * 2023-09-20 2024-05-20 (주)뮤자인 챗봇을 이용한 컨텐츠 관리 시스템

Similar Documents

Publication Publication Date Title
KR102158352B1 (ko) 정책정보 문서의 요지 정보 제공 방법, 정책정보 제공 시스템, 이를 위한 컴퓨터 프로그램
KR102237702B1 (ko) 엔티티 관계 데이터 생성 방법, 장치, 기기 및 저장 매체
US7428487B2 (en) Semi-automatic construction method for knowledge base of encyclopedia question answering system
US7890500B2 (en) Systems and methods for using and constructing user-interest sensitive indicators of search results
US8078573B2 (en) Identifying the unifying subject of a set of facts
US10585924B2 (en) Processing natural-language documents and queries
US7272595B2 (en) Information search support system, application server, information search method, and program product
US6647364B1 (en) Hypertext markup language document translating machine
US7346487B2 (en) Method and apparatus for identifying translations
US20170235841A1 (en) Enterprise search method and system
US8874590B2 (en) Apparatus and method for supporting keyword input
US7099870B2 (en) Personalized web page
US8577887B2 (en) Content grouping systems and methods
JP2011100403A (ja) 情報処理装置、情報抽出方法、プログラム及び情報処理システム
TW201826145A (zh) 從中文語料庫提取知識的方法和系統
US8296319B2 (en) Information retrieving apparatus, information retrieving method, information retrieving program, and recording medium on which information retrieving program is recorded
KR102280028B1 (ko) 빅데이터와 인공지능을 이용한 챗봇 기반 콘텐츠 관리 방법 및 장치
WO2020079752A1 (ja) 文献検索方法および文献検索システム
JP5688754B2 (ja) 情報検索装置及びコンピュータプログラム
JP2008026964A (ja) 検索処理装置及びプログラム
WO2014049310A2 (en) Method and apparatuses for interactive searching of electronic documents
Nys et al. A semantic retrieval system in remote sensing web platforms
JP4635585B2 (ja) 質問応答システム、質問応答方法及び質問応答プログラム
JP2012243130A (ja) 情報検索装置、方法、及びプログラム
JP7323484B2 (ja) 情報処理装置、情報処理方法、及びプログラム

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant