KR102491337B1 - 인공지능 기반 도서 큐레이션 플랫폼 운용 서버 및 그 동작 방법 - Google Patents

인공지능 기반 도서 큐레이션 플랫폼 운용 서버 및 그 동작 방법 Download PDF

Info

Publication number
KR102491337B1
KR102491337B1 KR1020220140925A KR20220140925A KR102491337B1 KR 102491337 B1 KR102491337 B1 KR 102491337B1 KR 1020220140925 A KR1020220140925 A KR 1020220140925A KR 20220140925 A KR20220140925 A KR 20220140925A KR 102491337 B1 KR102491337 B1 KR 102491337B1
Authority
KR
South Korea
Prior art keywords
book
information
user
artificial intelligence
group
Prior art date
Application number
KR1020220140925A
Other languages
English (en)
Inventor
조두현
Original Assignee
조두현
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 조두현 filed Critical 조두현
Priority to KR1020220140925A priority Critical patent/KR102491337B1/ko
Application granted granted Critical
Publication of KR102491337B1 publication Critical patent/KR102491337B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 인공지능 기반 도서 큐레이션 플랫폼 운용 서버 및 그 동작 방법을 개시한다. 인공지능 기반 도서 큐레이션 플랫폼 운용 서버는 적어도 하나의 프로세서 및 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들을 저장하는 메모리를 포함할 수 있다. 여기서 적어도 하나의 단계는, 사용자 단말로부터 사용자의 독서 태양, 선호 학습 형태, 생활 정보 및 사용자 선택 정보 중 적어도 하나를 포함하는 사용자 정보를 수신하는 단계, 수신한 사용자 정보를 기초로 사용자에게 적어도 하나 이상의 도서를 제공하고, 제공된 도서에 대한 시선 추적 정보, 문장 터치 정보, 페이지 체류시간, 메모 및 하이라이트 정보 중 적어도 하나를 포함하는 반응 정보를 수신하는 단계, 획득한 반응 정보를 사용하여 사용자 정보에 따라 도서의 페이지, 단락, 문장 또는 단어를 적어도 하나 이상의 선호 언어 그룹으로 분류하는 단계, 선호 언어 그룹에 포함된 페이지, 단락, 문장 또는 단어의 유사도를 기초로 적어도 하나 이상의 제1 도서 요약 그룹으로 분류하고, 제1 도서 요약 그룹의 잠재 의미 분석(LSA, Latent Semantic Analysis)를 통해 토픽 모델링(Topic Modeling)하여 제1 도서 요약 정보를 생성하는 단계, 제1 도서 요약 정보를 조합하여 개인화된 요약 도서를 생성하는 단계 및 생성된 요약 도서를 사용자에게 제공하는 단계를 포함할 수 있다.

Description

인공지능 기반 도서 큐레이션 플랫폼 운용 서버 및 그 동작 방법 {BOOK CURATION PLATFORM OPERATION SERVER BASED ON ARTIFICIAL INTELLIGENCE AND OPERATION METHOD THEREOF}
본 발명은 인공지능을 사용한 도서 큐레이션 서비스를 제공하는 플랫폼 운용 서버 및 그 동작 방법에 관한 것으로, 더욱 상세하게는 인공지능을 사용하여 도서 내용을 재구성 및 요약하여, 단말을 통해 사용자에게 제공하는 서버 및 그 동작 방법에 관한 것이다.
최근 지식 서비스 시장에서는 ‘지식’의 핵심을 요약해 전달하는 서비스가 확산되고 있으며, 비대면 시대에 지식을 요약한 서비스는 뉴노멀(New Normal)이 되어 가고 있다.
또한, 지식을 습득할 수 있는 다양한 매체가 증가하고, 특히 인터넷을 통해서는 거의 무제한에 가까운 지식과 정보를 알 수 있는 환경에 놓이게 되었지만, 오히려 이제는 어떤 정보와 지식을 선택 및 획득할 것인지에 대한 고민이 증대되었다.
이러한 소비자의 고민은 지식을 요약해주는 서비스의 성장으로 반영되었다. 시사 지식 요약 서비스와 일과 관련된 지식 요약서비스를 제공하는 다양한 서비스들은 서비스 공개 즉시 수백명 이상의 사용자를 확보하고 론칭 1년 만에 수만명 이상의 고객을 유치하는 성과들을 보여주었다.
뿐만 아니라 시중의 넘쳐나는 책 중 유익한 도서를 선별해 5분~10분 영상으로 요약하여 제공하는 매체들은 수십만의 회원을 보유하고 있으며 일부 포털사이트 들은 프리미엄 서비스를 제공하며 지식 요약서비스를 제공한다.
그러나, 이러한 서비스의 사용자들 대다수는 사회인으로서 무겁고 양이 방대한 도서들은 완독에 이르기까지 오랜 시간이 걸려 접근에 어려움을 갖게 하였다.
현재에는 많은 전자책들이 시중에서 유통되고, 이들은 핵심만을 요약하여 제공하기도 해 주된 수요층을 확보하고 있다.
그러나 여전히 자신이 선호하는 분야 중 어떤 책을 선택하여 읽을지 또는 해당 책의 내용을 자투리 시간을 활용하여 용이하게 완독할 수 있는 방법에 관하여는 그 수요에도 불구하고 적합한 서비스가 존재하지 않는다.
기존 단순히 도서를 요약하여 제공하는 서비스들이 존재하기는 하였으나, 이들은 단순한 문장의 짜깁기에 불과하여 그 도서 내용의 본질을 반영하지 못하거나, 사용자의 선호도를 반영하지 못해 꼭 필요한 내용임에도 불구하고 사용자의 선택을 받지 못하는 경우가 다수 존재하였다.
즉, 기존의 도서 요약서비스는 소비자의 이해, 흥미, 취향을 반영하지 않고, 단순 요약만을 제공하고, 이는 소비자가 오히려 더 독서에 진입장벽을 느끼게 만든다.
이에 따라 사용자의 독서 필요성을 충족시킬 수 있는 인공지능 기반 도서 큐레이션 플랫폼에 대한 연구가 필요한 실정이다.
국내공개특허 10-2014-0065609 A (2014.05.30) 국내공개특허 10-2014-0101055 A (2014.08.19) 국내공개특허 10-2014-0026795 A (2014.03.06)
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 인공지능 기반 도서 큐레이션 플랫폼 운용 서버 및 그 동작 방법을 제공하는 데 있다.
상기 목적을 달성하기 위한 본 발명의 일 측면은, 인공지능 기반 도서 큐레이션 플랫폼 운용 서버를 제공한다.
인공지능 기반 도서 큐레이션 플랫폼 운용 서버는, 적어도 하나의 프로세서(processor) 및 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함할 수 있다.
적어도 하나의 단계는, 사용자 단말로부터 사용자의 독서 태양, 선호 학습 형태, 생활 정보 및 사용자 선택 정보 중 적어도 하나를 포함하는 사용자 정보를 수신하는 단계, 수신한 사용자 정보를 기초로 사용자에게 적어도 하나 이상의 도서를 제공하고, 제공된 도서에 대한 시선 추적 정보, 문장 터치 정보, 페이지 체류시간, 메모 및 하이라이트 정보 중 적어도 하나를 포함하는 반응 정보를 수신하는 단계, 획득한 반응 정보를 사용하여 사용자 정보에 따라 도서의 페이지, 단락, 문장 또는 단어를 적어도 하나 이상의 선호 언어 그룹으로 분류하는 단계, 선호 언어 그룹에 포함된 페이지, 단락, 문장 또는 단어의 유사도를 기초로 적어도 하나 이상의 제1 도서 요약 그룹으로 분류하고, 제1 도서 요약 그룹의 잠재 의미 분석(LSA, Latent Semantic Analysis)를 통해 토픽 모델링(Topic Modeling)하여 제1 도서 요약 정보를 생성하는 단계, 제1 도서 요약 정보를 조합하여 개인화된 요약 도서를 생성하는 단계 및 생성된 요약 도서를 사용자에게 제공하는 단계를 포함할 수 있다.
여기서, 요약 도서를 생성하는 단계는 제1 도서 요약 정보를 도서의 페이지 순서 또는 반응 정보의 수신 순서에 따라 배치하고, 딥러닝 기반 자연어 처리 학습 모델을 사용하여 제1 도서 요약 정보내에 포함된 선호 언어들의 형태소, 어간, 어절, 품사 및 접속사 중 적어도 하나를 변경하여 자연언어 문장으로 요약 도서를 생성할 수 있다.
또한, 제1 도서 요약 정보를 생성하는 단계는 TF-IDF 벡터 값을 생성하여 코사인 유사도(Cosine similarity)를 사용하여, 선호 언어 그룹에 포함된 페이지, 단락, 문장 또는 단어의 유사도를 측정할 수 있다.
또한, 선호 언어 그룹내에 포함된 제1 도서 요약 정보와 제2 도서 요약 정보를 비교하여, 비교 결과가 임계값 미만인 경우 제2 도서 요약 정보를 기초로 요약 도서를 생성할 수 있다.
한편, 요약 도서를 생성하는 단계는, 반응 정보를 기초로 사용자의 독서 속도를 산출하는 단계 및 사용자의 독서 속도에 기초하여 미리 정해진 시간 내에 따라 텍스트 음성 변환(TTS, Text to Speech)된 음성의 재생이 완료 가능한 시간 분량으로 요약하는 단계를 더 포함할 수 있다.
그리고 서버는 다수의 사용자로부터 수신한 반응정보를 반응 정보DB에 저장하고, 사용자 정보의 유사도를 기준으로 사용자 유형별 표준 선호 언어 그룹 및 표준 제1 도서 요약 정보를 생성하여 요약 정보 DB에 저장하는 단계, 요약 정보 DB에 저장된 표준 제1 도서 요약 정보를 사용하여 요약 도서를 생성하는 단계 및 생성된 요약 도서를 요약 도서 DB에 저장하는 단계를 더 포함할 수 있다.
상기와 같은 본 발명에 따른 인공지능 기반 도서 큐레이션 플랫폼 운용 서버 및 그 동작 방법을 이용할 경우에는 그 사용자의 독서 태양이나 선호도에 맞도록 도서 내용을 재구성하여 제공함으로써 짧은 시간에 자신의 선호도와 필요에 맞는 독서를 완료할 수 있다.
또한, 딥러닝 기반 자연어 처리 모델을 사용함으로써 요약 도서는 사용자의 선호에 맞으면서도 자연스러운 내용으로 구성되어 독서에 편안함을 제공한다.
본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명의 특정한 바람직한 실시예들의 상기에서 설명한 바와 같은 또한 다른 측면들과, 특징들 및 이득들은 첨부 도면들과 함께 처리되는 하기의 설명으로부터 보다 명백하게 될 것이다.
도 1은 본 발명의 일 실시예에 따른 인공지능 기반 도서 큐레이션 플랫폼 운용 서버의 구동 환경을 나타낸 예시도이다.
도 2는 요약 도서의 내용을 표시하는 예시도이다.
도 3a 내지 3c는 반응 정보의 일 예를 설명하기 위한 예시도이다.
도 4는 본 발명의 다른 실시예에 따른 인공지능 기반 도서 큐레이션 플랫폼 운용 서버의 구동 환경을 나타낸 예시도이다.
도 5는 선호 언어 그룹 및 도서 요약 정보를 설명하기 위한 예시도이다.
도 6는 사용자의 도서 흥미도 산출을 설명하기 위한 도면이다.
도 7은 도 1에 따른 인공지능 기반 도서 큐레이션 플랫폼 운용 서버에 대한 하드웨어 구성도이다.
상기 도면들을 통해, 유사 참조 번호들은 동일한 혹은 유사한 엘리먼트들과, 특징들 및 구조들을 도시하기 위해 사용된다는 것에 유의해야만 한다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
실시예를 설명함에 있어서 본 발명이 속하는 기술 분야에 익히 알려져 있고 본 발명과 직접적으로 관련이 없는 기술 내용에 대해서는 설명을 생략한다. 이는 불필요한 설명을 생략함으로써 본 발명의 요지를 흐리지 않고 더욱 명확히 전달하기 위함이다.
마찬가지 이유로 첨부 도면에 있어서 일부 구성요소는 과장되거나 생략되거나 개략적으로 도시되었다. 또한, 각 구성요소의 크기는 실제 크기를 전적으로 반영하는 것이 아니다. 각 도면에서 동일한 또는 대응하는 구성요소에는 동일한 참조 번호를 부여하였다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
이때, 처리 흐름도 도면들의 각 블록과 흐름도 도면들의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수 있음을 이해할 수 있을 것이다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 흐름도 블록(들)에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 흐름도 블록(들)에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 흐름도 블록(들)에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.
또한, 각 블록은 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실행 예들에서는 블록들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.
이 때, 본 실시 예에서 사용되는 '~부'라는 용어는 소프트웨어 또는 FPGA(field-Programmable Gate Array) 또는 ASIC(Application Specific Integrated Circuit)과 같은 하드웨어 구성요소를 의미하며, '~부'는 어떤 역할들을 수행한다. 그렇지만 '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '~부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들, 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.
본 발명의 실시예들을 구체적으로 설명함에 있어서, 특정 시스템의 예를 주된 대상으로 할 것이지만, 본 명세서에서 청구하고자 하는 주요한 요지는 유사한 기술적 배경을 가지는 여타의 통신 시스템 및 서비스에도 본 명세서에 개시된 범위를 크게 벗어나지 아니하는 범위에서 적용 가능하며, 이는 당해 기술분야에서 숙련된 기술적 지식을 가진 자의 판단으로 가능할 것이다.
도 1은 본 발명의 일 실시예에 따른 인공지능 기반 도서 큐레이션 플랫폼 운용 서버의 구동 환경을 나타낸 예시도이다.
도 1을 참조하면, 인공지능 기반 도서 큐레이션 플랫폼 운용 서버(이하, '서버'라고 함)(100)는 사용자 단말(200)들로부터 사용자 정보와 반응 정보를 수신할 수 있다. 이때 서버(100)는 수신된 사용자 정보와 반응 정보를 각 데이터베이스에 저장하고, 저장된 사용자 정보와 반응 정보를 사용하여 개인화된 요약 도서를 생성하여 사용자 단말(200)에 개인화된 요약 도서를 제공할 수 있다. 개인화된 요약 도서는 사용자의 독서 태양 및 취향에 따라 동일한 도서임에도 불구하고 각 사용자마다 상이한 내용으로 요약생성 될 수 있으며 이는 사용자에게 독서에 대한 흥미를 유발함과 동시에 해당 도서의 구독 또는 구매에 대한 동기를 제공할 수 있다.
또한, 도서의 내용을 단순히 절단 및 붙여 넣는 압축 방식의 요약이 아닌 해당 도서의 내용을 파악하고, 사용자의 독서 태양 및 독서 환경을 반영하여 도서의 내용을 재구성해 전달함으로써 요약 내용 구성의 완성도 높은 요약 도서를 제공한다.
한편, 서버(100)는 생성된 요약도서를 하나 이상의 그룹으로 분류하여 보관하고, 새로운 요약 도서의 생성 없이 기존 사용자의 개인정보 및 반응 정보와 유사한 독서 태양을 갖는 다른 사용자에게 요약 도서를 제공할 수 있다.
여기서, 사용자 단말(200)은 통신 가능한 데스크탑 컴퓨터(desktop computer), 랩탑 컴퓨터(laptop computer), 노트북(notebook), 스마트폰(smart phone), 태블릿 PC(tablet PC), 모바일폰(mobile phone), 스마트 워치(smart watch), 스마트 글래스(smart glass), e-book 리더기, PMP(portable multimedia player), 휴대용 게임기, 네비게이션(navigation) 장치, 디지털 카메라(digital camera), DMB(digital multimedia broadcasting) 재생기, 디지털 음성 녹음기(digital audio recorder), 디지털 음성 재생기(digital audio player), 디지털 동영상 녹화기(digital video recorder), 디지털 동영상 재생기(digital video player), PDA(Personal Digital Assistant) 등일 수 있다.
도 2는 요약 도서의 내용을 표시하는 예시도이다. 이하에서는 도 1 및 2를 참조하여 본 발명의 예시적인 인공지능 기반 도서 큐레이션 플랫폼 운용을 설명한다.
사용자는 사용자 단말(200)을 통해 요약 도서를 제공받아 독서할 수 있다. 예컨대, 서버(100)는 유무선 네트워크를 통해 사용자 단말(200)에 서비스 제공을 위한 애플리케이션 또는 전용 소프트웨어를 제공할 수 있으며, 사용자는 이를 통해 인공지능 기반 도서 큐레이션 플랫폼에 접근할 수 있다.
사용자가 본 발명의 인공지능 기반 도서 큐레이션 플랫폼을 처음 사용하는 경우, 서버(100)는 관리자에 의해 미리 생성된 요약 도서를 제공하여 사용자의 반응 정보를 수신할 수 있으나, 이에 제한되지 않고 보다 정확한 반응 정보를 수신하여 사용자의 선호도에 맞는 요약 도서를 제공하기 위해 원문을 포함하는 도서를 사용자에게 제공할 수 있다.
요약 도서 또는 원문이 포함된 도서를 사용자 단말(200)을 통해 제공받은 사용자는 자신의 사용자 정보에 따라 독서를 할 수 있고, 이때 독서를 하며 발생하는 정보들은 수집되어 개인화된 요약 도서를 생성하는데 사용될 수 있다.
일 실시예에 따르면, 서버(100)는 사용자 단말(200)로부터 사용자의 독서 태양, 선호 학습 형태, 생활 정보 및 사용자 선택 정보 중 적어도 하나를 포함하는 사용자 정보를 수신할 수 있다.
여기서, 사용자의 독서 태양은 주된 독서 시간, 연속 독서 가능 시간 및 사용자 단말의 종류를 포함할 수 있다. 선호 학습 형태는 사용자가 독서를 하는 방식을 의미할 수 있으며, 예컨대, 지식 습득형, 학습형, 암기형, 흥미형 및 반복형 등 사용자가 독서를 통해 달성하고자 하는 목표를 위한 학습 형태를 포함할 수 있다. 또한 생활 정보는 사용자가 독서를 할 수 있는 환경과 관련된 정보로서 예컨대, 주야교대근무, 재택근무 및 일반근무와 같이 업무시간, 휴식시간, 취침시간 및 잉여시간과 같이 사용자의 생활 패턴에 따라 독서가 불가능한 시간과 가능한 시간으로 구분된 정보일 수 있다.
한편, 사용자 선택정보는 사용자가 선호하는 장르 및 도서 그룹으, 독서 추천 기준(예: 신간, 인기, 베스트셀러, 컬렉션, 에디터 추천 및 전문가 추천 등)을 포함할 수 있으며, 이에 제한되지 않고, 본 서비스를 유입하게 된 경위 및 도서 구매 이력 등 사용자가 선택적으로 입력하는 정보를 포함할 수 있다.
서버(100)는 이와 같이 수신한 사용자 정보를 기초로 사용자의 선호도에 따라 사용자에게 추천할 도서를 결정하고, 사용자의 독서 가능 시간대 및 연속독서 가능한 시간에 따라 요약 도서(210)를 생성하여 제공할 수 있다.
예를 들어, 서버(100)는 사용자 정보로서 스릴러 장르 도서 선호, 재택근무, 연속 독서 시간이 15분인 경우 이를 수신하여, 스릴러 장르 도서를 15분 독서 가능한 분량으로 요약하여, 재택근무 사용자의 업무 일정에 따라 요약 도서(210)를 제공할 수 있다.
이때, 도서의 요약은 정해진 페이지 분량으로 요약하거나, 미리 정해진 단어수를 미리 정해진 시간내에 텍스트 음성 변환(TTS, Text to Speech) 가능한 시스템을 기준으로 미리 정해진 시간에 부합하도록 요약할 수 있다. 예컨대, 서버(100)는 사용자 정보로서 사용자의 독서 속도를 입력 받거나, 반응 정보를 활용하여 사용자의 독서 속도를 산출할 수 있고, 서버(100)는 사용자의 독서 속도에 기초하여 미리 정해진 시간 내에 따라 텍스트 음성 변환(TTS, Text to Speech)된 음성의 재생이 완료 가능한 시간 분량으로 도서를 요약할 수 있다.
예를 들어, 서버(100)는 사용자의 반응 정보(예: 시선추적)를 기초로 1,000단어(조사 및 접속사 제외)의 독서를 마치는데 10분의 시간이 걸리는 사용자의 경우 사용자의 독서 속도를'100단어/분'으로 산출할 수 있으며, 사용자의 독서 속도를 고려하여 15분 이내에 요약 도서를 완독할 수 있도록, 1500단어 이내의 분량으로 요약 도서를 생성할 수 있다. 다시 말하면, A4용지 크기, 글자크기 10p, 줄간격 100%, 위아래 및 양옆 공백 3 센티미터 기준으로 15페이지 이내 또는 1,000 단어 미만의 분량으로 요약하거나 TTS를 사용하는 사용자의 경우 1분에 30단어(조사 및 접속사 제외) 변환 가능한 시스템 기준 500 단어와 같이 정해진 분량으로 도서를 요약할 수 있다.
한편, 서버(100)는 사용자의 관심 도서를 분석하기 위해 적어도 하나 이상의 도서를 사용자 단말(200)에 제공할 수 있다. 예를 들어, 사용자는 사용자 단말(200)을 통해 선호 장르를 입력하거나 입력하지 않을 수 있으며, 선호 장르가 입력된 경우에는 해당 장르에 포함되는 도서를 사용자 단말(200)에 전송하고, 선호 장르를 선택하지 않은 경우 임의 장르의 도서 또는 추천 및 베스트 셀러 도서들 중 임의의 도서를 사용자 단말(200)에 제공할 수 있다.
이때 사용자 단말(200)은 사용자가 제공된 도서를 읽을 때, 적어도 하나 이상의 반응 정보를 수집하여 서버(100)에 전송할 수 있다. 이때, 반응 정보는 제공된 도서에 대한 시선 추적 정보, 문장 터치정보, 페이지 체류시간, 메모 및 하이라이트 정보 중 적어도 하나를 포함할 수 있다.
도 3a 내지 3c는 반응 정보의 일 예를 설명하기 위한 예시도이다. 이하 도 1 및 도3a를 참조하면, 사용자 단말(200)은 적어도 하나 이상의 카메라(310)를 포함할 수 있다.
이때, 사용자 단말(200)은 사용자가 사용자 단말(200)의 디스플레이(320)에 나타난 도서 내용을 읽는 경우 사용자의 시선을 추적하여 도서의 단락, 문장 및 단어 중 어디에 집중하고 있는지 구분하고, 해당 단락, 문장 및 단어에 체류하는 시간 및 횟수를 파악하여 사용자의 반응 정보를 획득할 수 있다.
예를 들어, 시선 추적은 사용자에게 보여지는 이미지에서 사용자의 시선이 응시하는 지점을 탐지하는 방식으로 구현될 수 있으며, 사용자의 고개 각도, 카메라를 통한 안구의 움직임 특정 및 피사체의 응시지점 추적을 통해 구현할 수 있다. 이 경우 서버(100)는 사용자 단말(200)을 통해 사용자의 시선이 도서 페이지의 최상단에서 최하단에 이르기까지 순차적인 독서가 일어났는지 확인함으로써 사용자의 독서 태도를 추정할 수 있다. 예컨대, 사용자의 시선이 도서 페이지의 최상단에서 우측 방향으로 줄을 바꾸어 가며 최하단까지 이동하는 경우 해당 사용자는 모든 문장을 읽으며 내려가는 독서 기법을 통해 독서를 하는 것으로 판단하고, 해당 페이지의 최상단에서 최하단까지 특정 단어에 집중하며 시선이 이동하는 경우 주된 단어에 집중하는 독서 기법을 통해 독서하는 것으로 판단할 수 있다.
또한, 도 1, 3b 및 3c를 참조하면, 사용자 단말(200)은 터치 패널을 구비한 디스플레이를 포함할 수 있다. 이때, 사용자 단말(200)은 사용자가 화면을 통해 직접 터치를 한 영역을 파악하여 직접 터치한 문단 또는 단어를 반응 정보로 획득할 수 있다. 예컨대, 사용자는 특정 단어를 직접적으로 터치하여 반응 정보를 생성할 수도 있고, 특정 단락 전체를 터치 입력을 통해 반응정보를 획득할 수 있다.
한편, 서버(100)는 사용자가 도서의 특정 페이지에 체류하는 시간을 반응 정보로 획득할 수 있다. 예를 들어, 사용자가 다른 페이지에 비해 긴 시간 체류하는 페이지가 있는 경우 해당 페이지의 내용에 관심이 큰 것으로 판단할 수 있다. 또한, 사용자가 직접 특정 페이지, 단락, 문장 또는 단어에 메모하거나 밑줄 등을 사용하여 하이라이트한 경우 해당 메모 또는 하이라이트가 부여된 단어 등을 반응 정보로 획득할 수 있다.
이와 같은 반응 정보를 사용하여 서버(100)는 사용자의 독서 태도를 추정할 수 있으며, 서버(100)는 사용자의 추정된 독서 태도를 기초로 수신된 반응 정보를 보다 정밀하게 필터링 할 수 있다. 예컨대, 시선 추적을 통해 사용자의 독서 태도가 모든 문장을 스크리닝 하며 읽는 독서법을 사용하는 경우, 서버(100)는 사용자가 문장에 집중하는 경우보다 단어에 시선이 체류하는 경우에 해당 단어에 대해 높은 가중치를 부여할 수 있다. 또한 사용자의 독서 태도가 단어 집중형 독서 기법을 사용하는 것으로 판단되면, 사용자가 특정 문장에 집중하는 경우 해당 문장에 더 높은 가중치를 부여할 수 있다.
이와 같이 가중치가 부여된 문장 또는 단말은 사용자의 주요 반응 정보로서 이하에서 설명하는 선호 언어 그룹 또는 제1 도서 요약 정보를 결정하는 기준이 될 수 있다.
서버(100)는 반응 정보가 획득되면, 사용자 정보와 반응 정보를 기초로 해당 도서의 페이지, 단락, 문장 또는 단어에 대해 하나 이상의 그룹으로 분류할 수 있다.
일 실시예에 따르면, 서버(100)가 사용자 단말(200)에서 표시되는 임의의 문장 "영수는 독이든 사과를 먹고 사망했다"에서 사용자의 시선이 다른 단어에 비해 "사망"에 오래 지체하였거나 반복 도달한 반응 정보를 획득할 수 있다.
이때, 서버(100)는 사용자 정보를 기초로 해당 반응 정보를 하나 이상의 선호 언어 그룹으로 분류할 수 있다. 예를 들어, 사용자 정보에서 선호 장르가 '스릴러'인 사용자에게 '사망'은 긍정 단어 그룹으로 분류하고, 선호 장르가 '드라마'인 경우 동일한 단어 '사망'은 부정 단어 그룹으로 분류할 수 있다. 여기서 도서의 페이지, 단락, 문장 또는 단어를 하나 이상의 그룹으로 분류하는 것은 사용자 정보를 기준으로 긍정 또는 부정과 같이 양분하는 것에 제한되지 않고, 그 단어 또는 문장이 갖는 의미의 상위 그룹으로 분류할 수 있고, 그 분류된 그룹을 다시 사용자 정보를 기초로 해당 사용자의 선호 또는 비선호 단어 모음으로 분류할 수 있다.
예를 들어, 사용자 정보에서 선호 장르가 '스릴러'인 사용자에게 '죽음'의 의미를 갖는 단어 의미 그룹은 해당 사용자에게 '선호 언어 그룹'일 수 있으며, 해당 단어 의미 그룹에는 '사망'및'살인'의 단어가 포함될 수 있다. 이때, 서버(100)는 선호 언어 그룹에 포함된 단어들의 의미를 기초로 제1 도서 요약 정보를 생성할 수 있다. 다시 말하면, 제1 도서 요약 정보는 사용자가 실제 독서를 하며 그 도서에 대해 생성한 반응 정보를 사용자 정보에 기초하여 서버(100)에서 분류하여 그룹화 한 것이며, 페이지, 단락, 문장 또는 단어의 '선호' 또는 '비선호'의 형태 또는 유사 단어 또는 문장의 선호 언어 그룹내에서 생성될 수 있다.
문장의 유사도 판단은 딥러닝 기반의 텍스트 유사도(Text Similarity)분석을 통해 달성할 수 있다. 예를 들어, 텍스트 벡터화를 통해 문장내 단어들을 벡터화 시켜 각 단어들의 벡터값을 비교함으로써 유사도를 판단할 수 있다. 예컨대, 원-핫 인코딩 기법(One-hot encoding)을 통해 단어와 대응되는 벡터값을 생성할 수 있으며, 유사도는 TF-IDF 벡터 값을 사용할 수 있다. 여기서 TF(Term Frequency)는 그 단어가 주어진 데이터 내에서 나타나는 횟수를 의미하고, DF(Document Frequency)는 그 단어가 다른 문장에서 등장하는 빈도를 나타내는 빈도값이며, IDF(Inverse Document Frequency)는 DF 값의 역수이다. 이때, TF-IDF 벡터값은 아래의 수학식에 따라 결정된다.
[수학식 1]
TF-IDF=TF × IDF
즉, TF-IDF는 특정 단어가 주어진 데이터 내에서 등장하는 빈도가 높으나 다른 데이터 내에서 나타나는 빈도가 작을수록 높은 값을 갖는다. 결과적으로 문장 또는 단어들 사이의 유사도는 TF-IDF 벡터값 사이의 코사인 유사도(Cosine Similarity)를 통해 결정될 수 있고, 이때 유사도 값은 -1~1 사이의 값의 범위에서 1에 가까울수록 유사한 문장 또는 단어이다.
이를 통해, 반응 정보를 통해 획득한 선호 언어 그룹내에서 유사한 의미를 갖는 문장 또는 단어들을 제1 도서 요약 그룹으로 분류할 수 있다. 예컨대, 유사도가 0.6 이상의 값을 갖는 문장 또는 단어들은 동일한 도서 요약 그룹으로 분류할 수 있다.
서버(100)는 분류된 제1 도서 요약 그룹의 문장 또는 단어들이 갖는 의미상의 상위 개념으로 제1 도서 요약 정보를 생성할 수 있다. 예를 들어, 제1 도서 요약 정보는 제1 도서 요약 그룹에 포함된 문장 및 단어들 사이의 잠재 의미 분석(LSA, Latent Semantic Analysis)를 통해 토픽 모델링(Topic Modeling)하여 생성할 수 있다. 즉, 제1 도서 요약 정보는 일반적인 도서의 문장 또는 단어들은 문서(Documents) 집합의 추상적인 주제를 발견하여 정해질 수 있는 것이고, 다시 말하면 제1 도서 요약 그룹이 갖는 의미의 상위 또는 포괄 개념을 제1 도서 요약 정보로 생성할 수 있다.
그 다음 서버(100)는 제1 도서 요약 정보의 성격을 분석하여 제2 도서 요약 정보를 생성할 수 있다. 앞서 설명한 바와 같이 제1 도서 요약 정보는 페이지, 단락, 문장 또는 단어가 1차적으로 갖는 의미와 관련되고 제2 도서 요약 정보는 페이지, 단락, 문장 또는 단어가 유사한 성격으로 그룹을 구성할 때 그 그룹의 성격을 의미하는 것으로 반응 정보에 따라 그룹화된 페이지, 단락, 문장 또는 단어의 포괄적 성격을 의미한다.
예를 들어, 사용자가 선호 장르를'스릴러'로 선택하고, 재택 근무를 하는 사용자가'사망'및'살인'의 단어에 대해 직접 터치하였고, 시선 추적을 통해 '라면'과 '치킨'의 단어에 대해 반응 정보를 생성한 경우, 서버(100)는 사용자 단말(200)을 통해 이를 수신하여 해당 사용자에 대해 '사망', '살인', '라면', '치킨'의 단어는 선호 언어 그룹으로 그룹화 하면서, '사망', '살인'은 그 상위 의미인 '죽음'으로, '라면'과 '치킨'은 그 상위 의미인 '음식'으로 제1 도서 요약 정보를 각 생성할 수 있다.
그 다음 서버(100)는 선호 언어 그룹내의 제1 도서 요약 정보를 조합하여 개인화된 요약 도서를 생성할 수 있다. 요약 도서의 생성은 해당 도서 내용의 기술 순서에 따라 생성될 수 있다. 예를 들어, 페이지 1부터 200까지 존재하는 도서의 경우 페이지의 순서에 따라 제1 도서 요약 정보를 조합함으로써 요약 도서를 생성할 수 있다.
한편, 서버(100)는 반응 정보의 수신 순서에 따라 요약 도서를 생성할 수 있다. 예를 들어, 독서 패턴에 따라 특정 내용의 흐름을 파악하고자 하는 사용자는 페이지 번호와 상관없이 여러 페이지를 넘나들며 독서할 수 있고, 이 경우 생성되는 반응 정보는 실제 페이지의 순서와 일치하지 않을 수 있다. 이때, 서버(100)는 생성된 반응 정보의 순서를 따라 요약 도서를 생성함으로써 내용의 일관성을 갖는 요약 도서를 생성할 수 있다.
서버(100)는 다양한 자연어 처리(NLP, Natural language processing) 학습모델을 기반으로 요약 도서를 생성할 수 있고, 제1 도서 요약 정보와 제1 도서 요약 정보내에 포함된 선호 언어들의 형태소, 어간, 어절, 품사 및 접속사를 기초로 자연언어 문장을 생성함으로써 보다 자연스러운 문장을 갖는 요약 도서를 생성할 수 있다.
예를 들어, "영수는 매일 아침 달콤한 사과를 먹는 것을 즐기는데, 어느날 독이든 사과를 먹고 사망했다"라는 원문장에 대해 서버(100)는 "영수는 독이든 음식을 먹고 죽음에 이르렀다"와 같이 요약될 수 있다. 이때 '주어'인 '영수'와 '먹다'라는 동사는 형태소와 어간 및 구문 분석을 통해 그 의미를 구별해낼 수 있으며, '사과'의 제1 도서 요약 정보인 '음식'과 '사망'의 제1 도서 요약 정보인 '죽음'은 각각 원문장의 배치 구조를 참조하여, 어간을 변경하고 그 품사를 결정함으로써 완성된 문장을 생성할 수 있다. 이러한 자연어 처리 학습 모델은 딥러닝을 통해 미리 학습된 모델을 사용할 수 있다.
한편, 도 4는 본 발명의 다른 실시예에 따른 인공지능 기반 도서 큐레이션 플랫폼 운용 서버의 구동 환경을 나타낸 예시도이다.
도 4를 참조하면, 다른 실시예에 따른 인공지능 기반 도서 큐레이션 플랫폼(400)은 서버(410), 반응정보 DB(411), 요약정보 DB(412), 요약 도서 DB(413) 사용자 단말(420), 관리자 단말(430)을 포함할 수 있다. 사용자들은 각 사용자 단말(420)을 통해 입력한 사용자 정보 및 반응정보에 따라 동일한 도서임에도 불구하고 서로 다른 내용으로 요약된 요약 도서를 생성할 수 있으며, 관리자는 관리자 단말(430)을 통해 해당 도서의 선호 언어 그룹을 지정할 있다.
반응 정보 DB(411)는 사용자 단말(420)로부터 수신한 반응 정보를 보관하는 데이터베이스(DB)이고, 요약 정보 DB(412)는 반응 정보로부터 생성된 선호 언어 그룹, 선호 언어그룹을 통해 생성된 제1 도서 요약 그룹과 제1 도서 요약 정보 및 제2 도서 요약 정보를 보관하는 데이터베이스(DB)이며, 요약도서 DB(413)은 각 사용자의 사용자 정보 및 반응 정보를 기초로 생성된 요약 도서를 보관하는 데이터베이스(DB)를 의미한다.
이하에서는 중복되지 않는 구성을 중심으로 다른 실시예에 따른 인공지능 기반 도서 큐레이션 플랫폼의 운용 방법에 관하여 설명한다.
서버(410)는 관리자 단말(430)로부터 지정 선호 언어 그룹 및 제2 도서 요약 정보를 수신할 수 있다. 예를 들어, 특정 도서에 대해 요약 도서가 생성되지 않거나 충분한 반응 정보가 수집되지 않은 경우, 서버(410)는 사용자 단말(420)을 통해 수신한 사용자 정보 및 관리자 단말(430)로부터 수신된 지정 선호 언어그룹 및 제2 도서 요약 정보를 기초로 요약 도서를 생성하고 사용자에게 제공할 수 있다.
이때, 관리자 단말(430)을 통해 수신되는 지정 선호언어 그룹은 해당 도서 내용의 전문가 또는 인공지능 기반 도서 큐레이션 플랫폼의 운영자가 해당 도서에 대해 선택한 페이지, 단락, 문장 또는 단어가 될 수 있으며, 제2 도서 요약 정보는 미리 정해진 기준에 따라 사전에 정해진 정보일 수 있다.
한편, 서버(410)는 반응 정보가 수신되어 제1 도서 요약 정보를 생성하고 나면, 제2 도서 요약 정보와 비교할 수 있다. 예컨대, 서버(410)는 선호 언어 그룹내에 포함된 제1 도서 요약 정보의 개수, 종류, 성격 및 분야 등 제1 도서 요약 정보의 성격을 분석하고 그 결과를 제2 도서 요약 정보와 비교하여, 비교 결과가 임계값 미만인 경우 반응 정보에 기초한 선호 언어그룹 및/또는 제1 도서 요약 정보에 노이즈가 큰 것으로 판단하고 제2 도서 요약 정보에 기초하여 생성한 요약 도서를 사용자 단말(420)에 전송할 수 있다.
도 5는 선호 언어 그룹 및 도서 요약 정보를 설명하기 위한 예시도이다. 이하 도 4 및 도 5를 참조하면, 서버(410)는 선호 언어그룹의 일치율이 50% 미만인 경우, 반응 정보로부터 생성된 선호 언어그룹과 제1 도서 요약 정보를 폐기할 수 있다. 일예로, 관리자 단말(430)을 통해 입력된 선호 언어 그룹(510)은 '살인', '사망', '라면', '치킨'이며, 제2 도서 요약 정보(520)는 '죽음', '음식'인데 반해, 사용자의 반응 정보로 생성된 선호 언어 그룹(530)은 '기차', '라면', '살인', '사망'이며, 제1 도서 요약 정보(540)는 '죽음', '운송수단'인 경우 사용자 단말(420)을 통해 생성된 선호 언어 그룹(530)대비 관리자 단말(430)을 통해 입력된 선호 언어 그룹(510) 일치율은 75%이고, 제2 도서 요약 정보(520) 대비 제1 도서 요약 정보(540)의 일치율은 50%이다. 이때, 서버(410)는 수신된 반응 정보를 신뢰하는 것으로 판단하고, 반응 정보에 기초한 선호 언어 그룹(530) 및 제1 도서 요약 정보(540)를 사용하여 요약 도서를 생성할 수 있다.
한편, 서버(410)는 다른 사용자 단말들 사이에서 수신된 반응 정보 및 그에 기초한 선호 언어그룹과 제1 도서 요약 정보 및 사용자 정보를 기초로 표준 선호 언어그룹 및 표준 제1 도서 요약 정보를 생성할 수 있다.
예를 들어, 도서에서 특정 문장이나 단어에 대해 다수의 사용자들로부터 반응 정보를 수신하면 서버(410)는 이를 반응 정보 DB(411)에 저장하고, 사용자 정보의 유사도를 기준으로 사용자 유형별 표준 선호 언어그룹 및 표준 제1 도서 요약 정보를 생성하여 요약정보DB(412)에 저장할 수 있다. 예컨대, 사용자 정보 중 선호 장르가 '드라마'인 여러 사용자들 가운데 동일 또는 서로 다른 도서에서 '이별', '슬픔'의 선호 언어 그룹이 생성되고, 제1 도서 요약 정보로 '감정'을 갖는다면, 서버(410)는 사용자 유형을 선호 장르가 '드라마'인 사용자로 분류한 다음, 해당 사용자 유형에 속하는 사용자들에 대해 '이별', '슬픔'을 표준 선호 언어 그룹으로 생성하고, 표준 제1 도서 요약 정보로 '감정'을 생성하여 요약 정보 DB(412)에 저장할 수 있다. 이때 서버(410)는 요약 정보 DB(412)에 저장된 표준 제1 도서 요약 정보를 사용하여 요약 도서를 생성하고 요약 도서 DB(413)에 저장하고 사용자 단말(420)에 전송할 수 있다.
이를 통해, 사용자는 자신이 선호하는 장르의 도서를 자신과 유사한 사용자 정보를 갖는 사용자들의 반응 정보 및 표준 제1 도서 요약 정보를 기초로 생성된 요약 도서를 보다 쉽게 접함으로써 독서 및 도서 구매에 대한 흥미가 유발될 수 있다.
도 6는 사용자의 도서 흥미도 산출을 설명하기 위한 도면이다. 이하, 도 4와 도6을 참조한 일 실시예에 따르면, 서버(410)는 독서 속도, 독서 속도의 변화량 변수 및 반응 정보로부터 특정 도서에 대한 사용자의 도서 흥미도를 산출할 수 있다.
도 6를 참조하면, 관심영역(RoI, Region of interest) t1~tm은 독서 속도(Rv)의 특징점(Fm)에 의해 구별되는 영역이며 특히, 구간 t1, t3 및 t5와 같이 독서 속도(Rv)의 1차 미분 계수가 양(positive)인 구간을 양의 관심영역(P-ROI), 구간 t2 및 t4와 같이 독서 속도(Rv))의 1차 미분 계수가 음(negative)인 구간은 음의 관심영역(N-ROI)으로 구분할 수 있다.
양의 관심영역(P-ROI)은 사용자의 독서 속도가 점차 증가하는 영역이고, 음의 관심영역(N-ROI)은 사용자의 독서 속도가 점차 감소하는 영역이다. 여기서, 독서 속도(Rv)는 특정 시간동안 사용자가 독서한 문자의 개수로 산출될 수 있다.
또한, 특징점(Fm)은 독서 속도 변화량의 음양이 변경되는 구간으로 독서 속도의 1차 도함수(Rv`)가 0이 되는 지점을 의미하며, 사용자의 해당 도서에 대한 반응 정보와 무관하게 사용자가 해당 도서를 읽으며 해당 도서의 가독성 및 흥미에 따라 변화하는 독서 속도의 변화에 관한 정보로서 해당 도서에 대한 흥미를 나타내는 지표가 될 수 있다.
한편, 반응 정보(x1~xn)는 앞서 설명한바와 동일하게 사용자가 독서를 하며 발생하는 정보이고, 반응 정보는 독서 구간 내에 불규칙하게 분포할 수 있다. 여기서 반응 정보는 그 반응 정보가 발생한 관심영역에 따라, 미리 정해진 반응 정보에 대한 정량적 수치에 가중치를 반영되어 수치화 될 수 있다. 예컨대, 반응 정보 x1, x2가 음의 관심영역(N-ROI) t2에서 발생하였고, x1은 시선 추적에 의해 생성된 반응정보, x2는 문장 터치 정보에 의해 생성된 반응 정보인 경우 서버(410)는 아래의 수식과 같이 반응 정보에 대응되는 정량적 값 [xn]을 산출할 수 있다.
[수학식 2]
Figure 112022114214102-pat00001
[수학식 3]
Figure 112022114214102-pat00002
또한, 반응 정보 x3, x4가 양의 관심영역(P-ROI) t3에서 발생하였고, x3은 시선 추적에 의해 생성된 반응정보, x4는 문장 터치 정보에 의해 생성된 반응 정보인 경우 서버(410)는 아래의 수식과 같이 반응 정보에 대응되는 정량적 값 [xn]을 산출할 수 있다.
[수학식 4]
Figure 112022114214102-pat00003
[수학식 5]
Figure 112022114214102-pat00004
이를 일반화하면 다음과 같다.
[수학식 6]
Figure 112022114214102-pat00005
이때,
Figure 112022114214102-pat00006
Figure 112022114214102-pat00007
(0을 제외한다)의 값을 가져 양(Positive) 또는 음(negative)을 구분하고, xn은 반응 정보의 종류에 따라 미리 정해진 값이다. 예컨대, 반응 정보의 종류에 상관없이 동일한 값(예: 1)으로 정해질 수 있으나, 이에 제한되지 않고 시선 추적의 경우 10, 문자 터치의 경우 20, 메모의 경우 30, 하이라이트의 경우 30과 같이 차등을 두어 관리자에 의해 미리 정해진 값일 수 있다. 또한, mk는 해당 반응 정보의 중요도 및 신뢰도에 따라 관리자에 의해 미리 정해진 가중치를 의미한다.
이때, 사용자의 도서 흥미도(BIoU, Book Interest of User)는 아래와 같은 수식을 통해 결정될 수 있다.
[수학식 7]
Figure 112022114214102-pat00008
다시 말하면, 사용자의 도서 흥미도(BIoU)는 독서를 하며 발생한 반응 정보(xn)와 그 반응 정보(xn)가 생성된 시점에서 독서 속도(Rv)의 변화량(Rv`) 곱의 합산 값을 생성된 반응 정보의 총 개수 Num(x n )으로 나누어 정규화 하고, 정규화 된 값에 산출된 특징점의 개수 Num(F m )을 가중치로 곱하여 산출될 수 있다.
서버(410)는 각 사용자별로 사용자의 선호도에 따라 사용자를 분류하여 사용자 그룹을 생성하고, 동일 사용자 그룹에 포함된 사용자들의 도서에 대해 흥미도가 높은 도서를 선별하여 요약 도서 생성 후 다른 사용자에게 추천 도서로서 제공할 수 있다.
사용자들은 자신의 선호도에 따른 도서 외에, 자신과 동일한 선호도를 가지면서 다른 사용자들로부터 높은 흥미도를 보인 도서를 추천받아 독서함으로써 선호 범위를 넓히면서 새로운 분야에 대한 흥미 유발의 동기를 제공받을 수 있다.
도 7은 도 1에 따른 인공지능 기반 도서 큐레이션 플랫폼 운용 서버에 대한 하드웨어 구성도이다.
도 7을 참조하면, 인공지능 기반 도서 큐레이션 플랫폼 운용 서버(700)는, 적어도 하나의 프로세서(processor, 710); 및 상기 적어도 하나의 프로세서(710)가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory, 720)를 포함할 수 있다.
여기서 적어도 하나의 프로세서(710)는 중앙 처리 장치(central processing unit, CPU), 그래픽 처리 장치(graphics processing unit, GPU), 또는 본 발명의 실시예들에 따른 방법들이 수행되는 전용의 프로세서를 의미할 수 있다. 메모리(720) 및 저장 장치(760) 각각은 휘발성 저장 매체 및 비휘발성 저장 매체 중에서 적어도 하나로 구성될 수 있다. 예를 들어, 메모리(720)는 읽기 전용 메모리(read only memory, ROM) 및 랜덤 액세스 메모리(random access memory, RAM) 중에서 적어도 하나로 구성될 수 있다.
또한, 인공지능 기반 도서 큐레이션 플랫폼 운용 서버(700)는, 무선 네트워크를 통해 통신을 수행하는 송수신 장치(transceiver, 730)를 포함할 수 있다. 또한, 인공지능 기반 도서 큐레이션 플랫폼 운용 서버 (700)는 입력 인터페이스 장치(740), 출력 인터페이스 장치(750), 저장 장치(760) 등을 더 포함할 수 있다. 인공지능 기반 도서 큐레이션 플랫폼 운용 서버(700)에 포함된 각각의 구성 요소들은 버스(bus, 770)에 의해 연결되어 서로 통신을 수행할 수 있다.
본 발명에 따른 방법들은 다양한 컴퓨터 수단을 통해 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 본 발명을 위해 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독 가능 매체의 예에는 롬(ROM), 램(RAM), 플래시 메모리(flash memory) 등과 같이 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령의 예에는 컴파일러(compiler)에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터(interpreter) 등을 사용해서 컴퓨터에 의해 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 적어도 하나의 소프트웨어 모듈로 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
또한, 상술한 방법 또는 장치는 그 구성이나 기능의 전부 또는 일부가 결합되어 구현되거나, 분리되어 구현될 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (5)

  1. 인공지능 기반 도서 큐레이션 플랫폼 운용 서버로서,
    적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들을 저장하는 메모리를 포함하고,
    상기 적어도 하나의 프로세서는:
    사용자 단말로부터 사용자의 독서 태양, 선호 학습 형태, 생활 정보 및 사용자 선택 정보 중 적어도 하나를 포함하는 사용자 정보를 수신하고,
    수신한 상기 사용자 정보를 기초로 상기 사용자에게 적어도 하나 이상의 도서를 제공하고, 제공된 도서에 대한 시선 추적 정보, 문장 터치 정보, 페이지 체류시간, 메모 및 하이라이트 정보 중 적어도 하나를 포함하는 반응 정보를 수신하고,
    상기 수신한 반응 정보를 사용하여 상기 사용자 정보에 따라 상기 도서의 페이지, 단락, 문장 또는 단어를 적어도 하나 이상의 선호 언어 그룹으로 분류하고,
    상기 선호 언어 그룹에 포함된 페이지, 단락, 문장 또는 단어의 유사도를 기초로 적어도 하나 이상의 제1 도서 요약 그룹으로 분류하고, 상기 제1 도서 요약 그룹의 잠재 의미 분석(LSA, Latent Semantic Analysis)를 통해 토픽 모델링(Topic Modeling)하여 제1 도서 요약 정보를 생성하고,
    상기 제1 도서 요약 정보를 조합하여 개인화된 요약 도서를 생성하고,
    상기 생성된 요약 도서를 상기 사용자에게 제공하는, 인공지능 기반 도서 큐레이션 플랫폼 운용 서버.
  2. 청구항 1에서,
    상기 적어도 하나의 프로세서는:
    상기 제1 도서 요약 정보를 상기 도서의 페이지 순서 또는 반응 정보의 수신 순서에 따라 배치하고, 딥러닝 기반 자연어 처리 학습 모델을 사용하여 상기 제1 도서 요약 정보 내에 포함된 선호 언어들의 형태소, 어간, 어절, 품사 및 접속사 중 적어도 하나를 변경하여 자연언어 문장으로 상기 요약 도서를 생성하는, 인공지능 기반 도서 큐레이션 플랫폼 운용 서버.
  3. 청구항 2에서,
    상기 적어도 하나의 프로세서는:
    TF-IDF 벡터 값을 생성하고, 코사인 유사도(Cosine similiraty)를 사용하여, 상기 선호 언어 그룹에 포함된 페이지, 단락, 문장 또는 단어의 유사도를 측정을 통해 제1 도서 요약 그룹으로 분류하는, 인공지능 기반 도서 큐레이션 플랫폼 운용 서버.
  4. 청구항 3에서,
    상기 적어도 하나의 프로세서는:
    상기 반응 정보를 기초로 사용자의 독서 속도를 산출하고,
    사용자의 독서 속도에 기초하여 미리 정해진 시간 내에 따라 텍스트 음성 변환(TTS, Text to Speech)된 음성의 재생이 완료 가능한 시간 분량으로 요약하는, 인공지능 기반 도서 큐레이션 플랫폼 운용 서버.
  5. 청구항 4에서,
    상기 적어도 하나의 프로세서는:
    다수의 사용자로부터 수신한 반응정보를 반응 정보DB에 저장하고, 사용자 정보의 유사도를 기준으로 사용자 유형별 표준 선호 언어 그룹 및 표준 제1 도서 요약 정보를 생성하여 요약 정보 DB에 저장하고,
    상기 요약 정보 DB에 저장된 상기 표준 제1 도서 요약 정보를 사용하여 요약 도서를 생성하고,
    상기 생성된 요약 도서를 요약 도서 DB에 저장하는, 인공지능 기반 도서 큐레이션 플랫폼 운용 서버.
KR1020220140925A 2022-10-28 2022-10-28 인공지능 기반 도서 큐레이션 플랫폼 운용 서버 및 그 동작 방법 KR102491337B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220140925A KR102491337B1 (ko) 2022-10-28 2022-10-28 인공지능 기반 도서 큐레이션 플랫폼 운용 서버 및 그 동작 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220140925A KR102491337B1 (ko) 2022-10-28 2022-10-28 인공지능 기반 도서 큐레이션 플랫폼 운용 서버 및 그 동작 방법

Publications (1)

Publication Number Publication Date
KR102491337B1 true KR102491337B1 (ko) 2023-01-27

Family

ID=85101511

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220140925A KR102491337B1 (ko) 2022-10-28 2022-10-28 인공지능 기반 도서 큐레이션 플랫폼 운용 서버 및 그 동작 방법

Country Status (1)

Country Link
KR (1) KR102491337B1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120025960A (ko) * 2011-03-22 2012-03-16 주식회사 오티앤씨 커뮤니티 북 콘텐츠 서비스 제공 시스템
KR20140026795A (ko) 2012-08-23 2014-03-06 장대근 도서 기반의 소셜 네트워크 서비스 제공 방법
KR20140065609A (ko) 2012-11-19 2014-05-30 한국전자통신연구원 온라인 스토어의 지식상품 거래 방법
KR20140101055A (ko) 2013-02-07 2014-08-19 최대헌 지식 서비스 중개 장치 및 그 방법
KR20160047910A (ko) * 2014-10-23 2016-05-03 (주)웅진씽크빅 독서 감상문 작성 장치 및 방법
KR20220027623A (ko) * 2020-08-27 2022-03-08 오승근 계층적으로 구조화된 요약 도서 및 그 도서의 제작방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120025960A (ko) * 2011-03-22 2012-03-16 주식회사 오티앤씨 커뮤니티 북 콘텐츠 서비스 제공 시스템
KR20140026795A (ko) 2012-08-23 2014-03-06 장대근 도서 기반의 소셜 네트워크 서비스 제공 방법
KR20140065609A (ko) 2012-11-19 2014-05-30 한국전자통신연구원 온라인 스토어의 지식상품 거래 방법
KR20140101055A (ko) 2013-02-07 2014-08-19 최대헌 지식 서비스 중개 장치 및 그 방법
KR20160047910A (ko) * 2014-10-23 2016-05-03 (주)웅진씽크빅 독서 감상문 작성 장치 및 방법
KR20220027623A (ko) * 2020-08-27 2022-03-08 오승근 계층적으로 구조화된 요약 도서 및 그 도서의 제작방법

Similar Documents

Publication Publication Date Title
US11551567B2 (en) System and method for providing an interactive visual learning environment for creation, presentation, sharing, organizing and analysis of knowledge on subject matter
Zhao et al. Automatic detection of cyberbullying on social networks based on bullying features
Cao et al. Introduction to text visualization
US20180366013A1 (en) System and method for providing an interactive visual learning environment for creation, presentation, sharing, organizing and analysis of knowledge on subject matter
Mencía et al. Efficient voting prediction for pairwise multilabel classification
CN105229631A (zh) 阅读内容的收集、跟踪和呈现
US11023503B2 (en) Suggesting text in an electronic document
CN101004737A (zh) 基于关键词的个性化文档处理系统
Van Hooland et al. Between commodification and engagement: On the double-edged impact of user-generated metadata within the cultural heritage sector
CN109426658A (zh) 使用基于文本分析的智能特征建议进行文档美化
CN106776860A (zh) 一种搜索摘要生成方法及装置
Blanchard et al. Extracting summary piles from sorting task data
Geng et al. ShakerVis: Visual analysis of segment variation of German translations of Shakespeare’s Othello
US20200342164A1 (en) Passively suggesting text in an electronic document
Feldman The answer machine
Nwagwu et al. Knowledge mapping and visualization of personal information management literature, 1988–2020
Halvey et al. Supporting exploratory video retrieval tasks with grouping and recommendation
Yi et al. A dataset for exploring gaze behaviors in text summarization
KR102491337B1 (ko) 인공지능 기반 도서 큐레이션 플랫폼 운용 서버 및 그 동작 방법
Xu et al. Interactive visualization for curatorial analysis of large digital collection
Taieb-Maimon et al. Mining eye-tracking data for text summarization
AT&T
Scolari et al. Searching for Signs: Developing a handshape taxonomy based on visual similarity
Siahaan et al. Text Processing and Sentiment Analysis using Machine Learning and Deep Learning with Python GUI
US20200226159A1 (en) System and method of generating reading lists

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant