KR20160100316A - 전자 책들에 대한 엔티티 기반의 요약 - Google Patents

전자 책들에 대한 엔티티 기반의 요약 Download PDF

Info

Publication number
KR20160100316A
KR20160100316A KR1020167017626A KR20167017626A KR20160100316A KR 20160100316 A KR20160100316 A KR 20160100316A KR 1020167017626 A KR1020167017626 A KR 1020167017626A KR 20167017626 A KR20167017626 A KR 20167017626A KR 20160100316 A KR20160100316 A KR 20160100316A
Authority
KR
South Korea
Prior art keywords
book
entities
entity
identified
electronic book
Prior art date
Application number
KR1020167017626A
Other languages
English (en)
Inventor
크리스 나브리데스
투나 토크소즈
Original Assignee
구글 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구글 인코포레이티드 filed Critical 구글 인코포레이티드
Publication of KR20160100316A publication Critical patent/KR20160100316A/ko

Links

Images

Classifications

    • G06F17/30719
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • G06F17/278
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

전자 책(e-book)의 엔티티 기반 요약이 클라이언트 디바이스의 사용자에게 제시된다. 요약될 전자 책이 식별되고 그리고 식별된 전자 책에서 참조되는 복수의 엔티티들, 예컨대 캐릭터들, 이벤트들 및 날짜들이 또한 식별된다. 컴퓨터 서버가 요약될 전자 책의 타입을 결정하고, 상기 전자 책의 결정된 타입에 기초하여 하나 이상의 외부 데이터 소스들을 식별하며, 외부 데이터 소스는 식별된 전자 책 내의 엔티티들에 관한 정보를 제공한다. 전자 책의 엔티티 기반의 요약을 위한 요청을 수신할 시, 컴퓨터 서버는 전자 책의 엔티티 기반의 요약을 생성하도록 구성되고, 이 요약은 요청에 특정된 전자 책의 범위에서 참조되는 식별된 엔티티들을 기술한다. 생성된 엔티티 기반의 요약은 요청에 응답하여 클라이언트 디바이스에 제시된다.

Description

전자 책들에 대한 엔티티 기반의 요약{ENTITY-BASED SUMMARIZATION FOR ELECTRONIC BOOKS}
본 발명은 일반적으로, 전자 매체의 분야에 관한 것이며, 특히 전자 책들에 대한 엔티티 기반의 요약에 관한 것이다.
전자 책(e-book)들의 개발은 많은 특징들이 사용자 독서 경험을 강화시키게끔 해왔다. 그러나, 책을 읽는 것은 시간을 소요하는 바, 예컨대 특별한 책을 완전히 읽는데 독자는 몇 주, 몇 달 또는 심지어는 몇 년이 걸릴 수 있다. 따라서, 독자는 책 속의 캐릭터들, 장소들, 날짜들 및 이벤트들에 관한 중요한 정보를 잊어버릴 수 있다. 또한, 많은 독자들은 동시에 복수의 책들을 읽을 수 있는 바, 이는 무었을 이미 읽었는지를 기억하기 더 힘들게 할 수 있다.
책의 일부들을 다시 읽기 위해 책을 다시 탐색하는 것은 독자가 책을 읽는 데 소요해야만 하는 시간량을 상당히 추가할 수 있다. 책의 일부들을 다시 읽는 대신, 독자들은 인터넷을 검색함으로써 정보를 발견하는 것을 시도할 수 있다. 그러나, 이러한 접근법은 사용자가 읽지 않은 책의 부분들에 관한 정보를 발견하게 하는 위험에 사용자를 노출시킨다.
컴퓨터로 구현되는, 전자 책(e-book)의 엔티티 기반 요약을 제시하기 위한 방법이 개시된다. 상기 방법의 실시예들은 요약될 전자 책을 식별하는 단계와 그리고 식별된 전자 책에서 참조되는 복수의 엔티티들, 예컨대 캐릭터들, 이벤트들 및 날짜들을 식별하는 단계를 포함한다. 상기 방법의 실시예들은 또한, 요약될 전자 책의 타입을 결정하는 단계와 상기 전자 책의 결정된 타입에 기초하여 하나 이상의 외부 데이터 소스들을 식별하는 단계를 포함하며, 외부 데이터 소스는 식별된 전자 책 내의 엔티티들에 관한 정보를 제공한다. 전자 책의 엔티티 기반의 요약을 위한 요청을 수신할 시, 전자 책의 엔티티 기반의 요약이 생성되고, 이 요약은 요청에 특정된 전자 책의 범위에서 참조되는 식별된 엔티티들을 기술한다. 생성된 엔티티 기반의 요약은 요청에 응답하여 제시된다.
다른 양상은 전자 책의 엔티티 기반의 요약을 제시하기 위한 클라이언트 디바이스를 제공한다. 클라이언트 디바이스의 일 실시예는 컴퓨터 프로그램 모듈들을 실행하기 위한 컴퓨터 프로세서 및 컴퓨터 프로그램 모듈들을 저장한 비일시적 컴퓨터 판독가능 저장 디바이스를 구비한다. 컴퓨터 프로그램 모듈들은 요약될 전자 책을 식별하는 단계와 그리고 서버에 상기 전자 책의 엔티티 기반의 요약을 위한 요청을 제공하는 단계를 포함하는 단계들을 수행하도록 실행가능하다. 상기 요청은 시작 지점과 휴식 지점(break point) 사이의 전자 책의 특정된 범위를 식별한다. 서버는 식별된 전자 책의 텍스트에서 참조되는 복수의 엔티티들을 식별하고, 상기 전자 책의 엔티티 기반의 요약을 생성하며 그리고 클라이언트 디바이스에 제시를 위해 생성된 엔티티 기반의 요약을 제공하도록 구성된다.
다른 양상은 전자 책의 엔티티 기반의 요약을 제시하기 위한 실행가능 컴퓨터 프로그램 명령어들을 저장한 비일시적 컴퓨터 판독가능 저장 매체를 제공한다. 상기 컴퓨터 판독가능 저장 매체는 요약될 전자 책을 식별하고 식별된 전자 책에서 참조되는 복수의 엔티티들을 식별하기 위한 명령어들을 포함하는 컴퓨터 프로그램 명령어들을 저장한다. 상기 컴퓨터 판독가능 저장 매체는 또한, 전자 책의 엔티티 기반의 요약을 위한 요청을 수신하고, 상기 전자 책의 엔티티 기반의 요약을 생성하고 그리고 상기 요청에 응답하여 생성된 엔티티 기반의 요약을 제시하기 위한 컴퓨터 프로그램 명령어들을 저장한다.
본 명세서에 기술된 특징들 및 장점들은 모든 것을 포함하는 것이 아니며, 특히 많은 추가적인 특징들 및 장점들이 도면들, 명세서 및 특허청구범위에 비추어볼 때 이 기술 분야의 통상의 숙련자에게 분명해질 것이다. 더욱이, 주목할 점으로서, 본 명세서에서 이용되는 언어는 가독성 및 교육적 목적을 위해 원리적으로 선택되었으며, 개시된 본 발명을 기술하거나 제한하기 위해 선택된 것이 아닐 수 있다.
도 1은 일 실시예에 따른 엔티티 기반의 요약을 지원하기 위한 컴퓨팅 환경의 상위 레벨 블록도(high-level block diagram)이다.
도 2는 일 실시예에 따른 클라이언트 디바이스 및/또는 스토어 서버로서 역할하기 위한 컴퓨터의 예를 도시하는 상위 레벨 블록도이다.
도 3은 일 실시예에 따른 요약 서브시스템을 도시하는 상위 레벨 블록도이다.
도 4는 일 실시예에 따른 클라이언트 디바이스를 도시하는 상위 레벨 블록도이다.
도 5는 일 실시예에 따른 전자 책의 엔티티 기반의 요약을 제공하기 위한 프로세스를 도시하는 순서도이다.
도면들 및 다음의 상세한 설명은 단지 예시의 방식으로 특정 실시예들을 기술한다. 이 기술 분야의 숙련자는 다음의 상세한 설명으로부터, 본 명세서에 예시된 구조들 및 방법들의 대안적인 실시예들이 본 명세서에 기술된 원리들로부터 벗어남이 없이 전개될 수 있음을 쉽게 인지할 것이다. 이제, 여러 실시예들에 대한 참조가 상세하게 이루어질 것이며, 이들의 예시들은 첨부 도면들에 도시되어 있다. 주목할 점으로서, 실용가능한 곳 어디든 유사하거나 비슷한 도면 부호들이 유사하거나 비슷한 기능을 나타내기 위해 도면들에 이용될 수 있다.
시스템 개요
본 발명에서, "디지털 컨텐츠"는 일반적으로, 전자 책들, 비디오들, 및 음악 파일들과 같은 어떤 머신 판독가능 및 머신 저장가능 작업 물을 지칭한다. 다음의 논의는 전자 책들에 집중되어 있다. 그러나, 하기에 기술되는 기법들은 또한, 다른 타입의 디지털 컨텐츠와 함께 이용될 수 있다.
도 1은 일 실시예에 따른 전자 책들에 대한 엔티티 기반의 요약을 지원하기 위한 컴퓨팅 환경(100)을 보여준다. 컴퓨팅 환경(100)은 스토어 서버(110), 복수의 클라이언트 디바이스들(170) 및 네트워크(150)에 의해 연결된 외부 데이터 소스(160)를 포함한다. 설명을 간략화하고 명료화하기 위해 단 하나의 스토어 서버(110), 세 개의 클라이언트 디바이스들(170) 및 하나의 외부 데이터 소스(160)가 도 1에 도시된다. 컴퓨팅 환경(100)의 실시예들은 많은 스토어 서버들(110), 클라이언트 디바이스들(170) 및 네트워크(150)에 연결된 외부 데이터 소스들(160)을 가질 수 있다. 마찬가지로, 도 1의 다양한 엔티티들에 의해 수행되는 기능들은 서로 다른 실시예들에서 서로 다를 수 있다.
스토어 서버(110)는 구매, 라이센싱, 렌탈, 구독 및/또는 무료 다운로드에 이용가능한 전자 책들을 저장한다. 전자 책들은 클라이언트 디바이스들(170) 상에서 보여질 수 있다. 일 실시예에서, 스토어 서버(110)는 전자 책들 및 다른 디지털 컨텐츠를 식별하고 획득하기 위해 클라이언트 디바이스(170)를 이용하여 사용자가 브라우징할 수 있는 온라인 스토어프론트(online storefront)를 제공할 수 있다. 추가적으로, 스토어 서버(110)는 사용자 요청 시 전자 책들의 일부들의 엔티티 기반의 요약들을 제공한다. 일 실시예에서, 스토어 서버(110)는 요약 서브시스템(120), 문학 코퍼스(literature corpus)(130) 및 요약 코퍼스(140)를 포함한다. 스토어 서버(110)의 다른 실시예들은 다른 그리고/또는 추가적인 컴포넌트들을 포함한다. 추가적으로, 기능들은 본 명세서에 기술된 것과 다른 방식으로 컴포넌트들 간에 분산될 수 있다.
문학 코퍼스(130)는 클라이언트 디바이스들(170)로부터 사용자 액세스에 이용가능한 디지털 컨텐츠(예컨대, 전자 책들)을 저장한 하나 이상의 데이터 저장 디바이스들을 포함한다. 일 실시예에서, 디지털 컨텐츠는 파일들의 세트 및 관련 메타데이터로서 저장된다. 각각의 파일은 소정의 전자 책과 같은 특별한 디지털 컨텐츠와 관련되며, 컨텐츠의 단일 유닛은 하나 이상의 관련 파일들로 형성될 수 있다. 파일들에 대한 메타데이터는 파일들과 관련된 디지털 컨텐츠의 속성들을 기술한다. 일 실시예에서, 메타데이터는 전자 책을 고유하게 식별하는 스트링인 볼륨 식별자(ID)를 포함한다. 추가적으로, 메타데이터는 전자 책의 타입들(예컨대, 소설(fiction), 비소설(non-fiction), 역사, 법률 또는 과학)을 기술한다. 메타데이터는 또한, 예컨대 컨텐츠의 제목, 저자, 퍼블리셔, 분류 및 전자 책과 관련된 다른 타입의 디지털 컨텐츠(예컨대, 전자 책으로부터 도출되는 영화, TV 시리즈 또는 비디오 게임들)를 기술할 수 있다.
요약 서브시스템(120)은 문학 코퍼스(130)에 저장된 전자 책들에 대한 요약들을 생성하고 요약 코퍼스(140)에 이 요약들을 저장한다. 클라이언트 디바이스(170)로부터 특별한 전자 책의 일부의 요약에 대한 사용자 요청에 응답하여, 요약 서브시스템(120)은 전자 책의 일부에 대한 요약 코퍼스(130)로부터 요약을 생성하고 이미 생성된 요약을 선택한다. 선택된 요약은 제시를 위해 네트워크(150)를 통해 클라이언트 디바이스(170)에 전송된다. 요약 서브시스템(120)은 도 3을 참조하여 하기에 더욱 상세히 기술된다.
요약 코퍼스(140)는 문학 코퍼스(130)에 전자 책들의 요약들을 저장하는 하나 이상의 데이터 저장 디바이스들을 포함한다. 일 실시예에서, 전자 책의 요약은 엔티티 기반일 수 있다. 용어 "엔티티"는 캐릭터, 장소, 날짜 또는 이벤트와 같은 전자 책속에 기술되는 주제(subject)를 나타낸다. 예를 들어, 소설(novel)은 이 소설 속의 이야기의 전개와 관련된 복수의 캐릭터들, 장소들 및 이벤트들을 가질 수 있다. 이러한 캐릭터들, 장소들 및 이벤트들 각각은 소설의 엔티티일 수 있다. 엔티티는 소설의 하나 이상의 다른 엔티티들과 상호관련될 수 있다. 요약은 엔티티와 특성된 시작 지점(예컨대, 전자 책의 시작부 또는 요약을 위해 시작 지점으로서 사용자에 의해 선택된 전자 책 내의 위치)로부터 특정된 휴식 지점까지의 전자 책과의 사이의 관계를 기술한다. 예를 들어, 소설 속 캐릭터에 대해, 요약은 시작 지점으로부터 휴식 지점까지의 소설의 플랏(plot)에 관하여 캐릭터의 활동들을 기술할 수 있다.
일 실시예에서, 요약 코퍼스(140)는 전자 책들에 참조되는 엔티티들을 기술하는 데이터를 저장한다. 즉, 소정의 전자 책에 대해, 요약 코퍼스(140)는 전자 책에 참조되는 엔티티들을 기술하는 데이터를 저장한다. 추가적으로, 요약 코퍼스(140)는 엔티티가 전자 책에서 참조되는 위치들을 기술하는 데이터를 저장한다. 전자 책의 일부를 식별하는 사용자로부터의 요약 요청의 수신 시, 요약 서브시스템(120)은 요청에서 식별되는 전자 책의 일부의 엔티티 기반의 요약을 생성하기 위해 요약 코퍼스(140) 내의 요약 데이터와 인터랙션한다. 이 부분은 책에서 시작 지점과 휴식 지점 사이의 범위로서 특정될 수 있다.
네트워크(150)는 스토어 서버(110), 클라이언트 디바이스들(170) 및 외부 데이터 소스(160) 간에 통신을 할 수 있게 하고, 인터넷을 포함할 수 있다. 일 실시예에서, 네트워크(150)는 표준 통신 기술들 및/또는 프로토콜들을 이용한다. 다른 실시예에서, 엔티티들은 상기에 기술된 것들 대신 또는 이들에 추가적으로 커스텀 및/또는 전용 데이터 통신들을 이용할 수 있다.
외부 데이터 소스(160)는 문학 코퍼스(130)에 전자 책들 외부의 정보를 저장하는 하나 이상의 데이터 저장 디바이스들을 포함한다. 일 실시예에서, 외부 데이터 소스(160)는 문학 코퍼스(130)에 전자 책들의 엔티티들에 관한 정보를 제공한다. 예를 들어, 외부 데이터 소스들은 역사적 인물들(historical figures)과 같은 실세계 엔티티들을 기술하는 온라인 백과사전 및 영화들 및/또는 소설들 속의 캐릭터들과 같은 허구적 엔티티들을 기술하는 온라인 데이터베이스들을 포함할 수 있다. 따라서, 외부 데이터 소스들은 문학 코퍼스에 전자 책들에서 참조되는 엔티티들에 관한 정보를 포함할 수 있다. 추가적으로, 외부 데이터 소스들은 소정 전자 책의 저자에 의해 쓰여진 다른 책들의 텍스트 및/또는 설명들과 같은 전자 책들과 관련된 정보를 포함할 수 있다.
클라이언트 디바이스(170)는 엔티티 기반의 전자 책 요약들을 포함하는 디지털 컨텐츠를 소비(consume)하는 것, 소프트웨어 어플리케이션들을 실행하는 것, 네트워크(150) 상의 웹 서버들에 의해 호스트되는 웹사이트들을 브라우징하는 것, 파일들을 다운로드하는 것 및 스토어 서버(110)와 인터랙션하는 것과 같은 기능들을 수행하기 위해 사용자에 의해 이용되는 전자 디바이스이다. 예를 들어, 클라이언트 디바이스(170)는 전용 이-리더(e-reader), 스마트 폰 또는 태블릿, 노트북 또는 데스크탑 컴퓨터일 수 있다. 클라이언트 디바이스(170)는 디스플레이 디바이스를 포함하고 그리고/또는 이와 인터페이싱하는 바, 상기 디스플레이 디바이스 상에서 사용자는 전자 책들의 텍스트 및 다른 디지털 컨텐츠를 볼 수 있다. 추가적으로, 클라이언트 디바이스(170)는 물리적 그리고/또는 온스크린 버튼들과 같은 사용자 인터페이스(UI)를 제공하며, 이 UI를 이용하여 사용자는 디지털 컨텐츠를 소비하는 것, 디지털 컨텐츠를 선택하는 것, 디지털 컨텐츠의 샘플들을 획득하는 것, 그리고 디지털 컨텐츠를 구매하는 것과 같은 기능들을 수행하기 위해 클라이언트 디바이스(170)와 인터랙션할 수 있다. 예시적인 클라이언트 디바이스(170)는 도 4를 참조하여 하기에 더욱 상세히 기술된다.
주목할 점으로서, 본 명세서에 논의되는 시스템들이 사용자들에 관한 개인 정보를 수집하거나 또는 개인 정보를 이용할 수 있는 상황들에서, 사용자들은 프로그램 또는 특징들이 사용자 정보(예컨대, 사용자가 읽은 전자 책들, 사용자의 소셜 네트워크, 소셜 액션들 또는 활동들, 직업, 사용자의 선호도들 또는 사용자의 현재 위치에 관한 정보)를 수집하는지의 여부를 제어거나 그리고/또는 사용자와 더 관련있을 수 있는 컨텐츠를 스토어 서버(110)로부터 수신할지의 여부 그리고/또는 수신하는 법을 제어할 기회를 제공받을 수 있다. 추가적으로, 특정 데이터는 이 데이터가 저장되거나 사용되기 전에 개인적으로 식별가능한 정보가 제거되도록 하나 이상의 방식들로 처리될 수 있다. 예를 들어, 사용자에 대한 어떤 개인적으로 식별가능한 정보도 결정될 수 없도록 사용자의 신원이 처리될 수 있거나 또는 (시, 우편번호, 또는 주(state) 레벨과 같은) 위치 정보가 획득되는 사용자의 지리적 위치가 일반화될 수 있어서 사용자의 특별한 위치가 결정될 수 없게 된다. 따라서, 사용자는 사용자에 관한 정보가 어떻게 수집되고 스토어 서버(110)에 의해 사용되는지에 관한 제어권을 가질 수 있다.
컴퓨팅 시스템 아키텍쳐
도 1에 도시된 엔티티들은 하나 이상의 컴퓨터들을 이용하여 구현된다. 도 2는 스토어 서버(110), 외부 데이터 소스(160) 및/또는 클라이언트 디바이스(170)로서 역할을 하기 위한 컴퓨터(200)의 상위 레벨 블록도이다. 칩셋(204)에 결합된 적어도 하나의 프로세서(202)가 도시된다. 또한, 칩셋(204)에는 메모리(206), 저장 디바이스(208), 키보드(210), 그래픽 어댑터(212), 포인팅 디바이스(214) 및 네트워크 어댑터(216)가 결합된다. 디스플레이(218)가 그래픽 어댑터(212)에 결합된다. 일 실시예에서, 칩셋(204)의 기능은 메모리 제어기 허브(220) 및 I/O 제어기 허브(222)에 의해 제공된다. 다른 실시예에서, 메모리(206)는 칩셋(204) 대신 프로세서(202)에 직접적으로 결합된다.
저장 디바이스(208)는 하드 드라이브, 컴팩트 디스크 판독 전용 메모리(CD-ROM), DVD 또는 고체 상태 메모리 디바이스와 같은 어떤 비일시적 컴퓨터 판독가능 저장 매체이다. 메모리(206)는 프로세서(202)에 의해 이용되는 명령어들 및 데이터를 유지한다. 포인팅 디바이스(214)는 마우스, 트랙볼 또는 다른 타입의 포인팅 디바이스일 수 있고, 컴퓨터 시스템(200) 내로 데이터를 입력하기 위해 키보드(210)와 결합하여 이용된다. 그래픽 어댑터(212)는 디스플레이(218) 상에 이미지들 및 다른 정보를 디스플레이한다. 네트워크 어댑터(216)는 네트워크(150)에 컴퓨터 시스템(200)을 결합시킨다.
이 기술 분야에 알려진 바와 같이, 컴퓨터(200)는 도 2에 도시된 것들과 다른 그리고/또는 기타 컴포넌트들을 가질 수 있다. 추가적으로, 컴퓨터(200)에는 특정 예시된 컴포넌트들이 결여될 수 있다. 예를 들어, 스토어 서버(110)로서 역할을 하는 컴퓨터들은 하나 이상의 분산된 시스템들에 함께 링크된 복수의 블레이드 서버들로 형성될 수 있고, 키보드들 및 디스플레이들과 같은 컴포넌트들이 결여되어 있을 수 있다. 더욱이, 저장 디바이스(208)는 로컬하고 그리고/또는 컴퓨터(200)로부터 원격일 수 있다(예컨대, 저장 영역 네트워크(SAN) 내에 구현될 수 있다).
이 기술 분야에 알려진 바와 같이, 컴퓨터(200)는 본 명세서에 기술된 기능을 제공하기 위해 컴퓨터 프로그램 모듈들을 실행하도록 구성된다. 본 명세서에서 사용되는 용어 " 모듈"은 특정된 기능을 제공하기 위해 활용되는 컴퓨터 프로그램 로직을 나타낸다. 따라서, 모듈은 하드웨어, 펌웨어 및/또는 소프트웨어로 구현될 수 있다. 일 실시예에서, 프로그램 모듈들은 저장 디바이스(208)에 저장되고, 메모리(206) 내로 로드되며, 그리고 프로세서(202)에 의해 실행될 수 있다.
전자 책들의 엔티티 기반의 요약
도 3은 일 실시예에 따른 엔티티 기반의 요약들을 지원하기 위한 스토어 서버(110)의 요약 서브시스템(120)을 예시하는 상위 레벨 블록도이다. 도시된 실시예에서, 요약 서브시스템(120)은 분석 모듈(310), 엔티티 추출 모듈(320), 요약 생성 모듈(330) 및 제시 모듈(340)을 구비한다. 이 기술 분야의 숙련자들은 요약 서브시스템(120)의 다른 실시예들이 본 명세서에 기술된 것들 외의 다른 그리고/또는 추가적인 모듈들을 가질 수 있음과 아울러 기능들이 다른 방식으로 모듈들 사이에 분산될 수 있음을 인지할 것이다.
분석 모듈(310)은 요약될 전자 책을 식별한다. 일 실시예에서, 분석 모듈(310)은 스토어 서버(110)에 전송되는 요약에 대한 사용자 요청 시 요약될 전자 책을 식별한다. 사용자 요청은 책의 볼륨 ID, 제목 또는 국제 표준 책 번호(ISBN) 번호와 같은 전자 책의 식별을 포함한다. 사용자 요청은 또한, 식별된 전자 책에 대한 시작 지점 및/또는 휴식 지점을 포함할 수 있다. 분석 모듈(310)은 요청된 전자 책의 식별에 기초하여 서버 스토어(110)의 문학 코퍼스(130)를 검색한다. 다른 실시예에서, 분석 모듈(310)은 전자 책이 문학 코퍼스(130)에 저장될 시 요약 될 전자 책을 자동으로 식별한다.
분석 모듈(310)은 또한, 요약될 전자 책의 타입을 결정한다. 일 실시예에서, 분석 모듈(310)은 전자 책을 하나 이상의 타입 카테고리들로 카테고리화하기 위해 전자 책과 관련된 메타데이터를 분석한다. 카테고리들은 일반적이거나 특정적일 수 있다. 예를 들어, 분석 모듈(310)의 실시예는 전자 책을 소설 또는 비소설의 일반적인 카테고리에 속하는 것으로서 카테고리화할 수 있다. 그 다음, 분석 모듈(310)은 또한, 전자 책을 일반적인 카테고리 내의 특정한 카테고리들(예컨대, 미스테리, 역사 소설, 전기(biography))로 카테고리화할 수 있다. 분석 모듈(310)은 또한, 전자 책의 텍스트를 분석함으로써 전자 책의 타입을 결정할 수 있다. 예를 들어, 이 책에 대한 어떤 메타데이터도 이용가능하지 않은 경우 이 책이 소설인지 비소설인지를 결정하기 위해 책의 텍스트적 분석이 수행될 수 있다.
분석 모듈(310)은 전자 책의 타입에 기초하여 전자 책에 대한 하나 이상의 외부 데이터 소스들을 식별한다. 식별된 외부 데이터 소스들은 전자 책에 대한 엔티티 식별 프로세스를 알려줄 정보를 가질 가능성이 높은 소스들이다. 예를 들어, 전자 책이 비소설 전기인 것으로 결정되는 경우, 분석 모듈(310)은 전기의 주체(subject)에 관한 정보를 포함할 가능성이 높은 온라인 지식백과와 같은 하나 이상의 외부 데이터 소스들을 식별할 수 있다. 유사하게, 전자 책이 과학 소설인 것으로 결정되는 경우, 분석 모듈(310)은 팬 사이트들, (책에 기초한 영화가 존재하는 경우) 영화 정보 사이트들, 등등과 같은 책에 참조되는 엔티티들에 관한 정보를 포함할 가능성이 높은 하나 이상의 외부 데이터 소스들을 식별할 수 있다.
분석 모듈(310)은 추가 프로세싱을 위해 엔티티 추출 모듈(320) 및 요약 생성 모듈(330)과 인터랙션한다. 예를 들어, 분석 모듈은 전자 책의 신원, 전자 책의 타입, 식별된 외부 데이터 소스들 및 시작/휴식 지점들을 엔티티 추출 모듈(320) 및 요약 생성 모듈(330)에 제공할 수 있다.
엔티티 추출 모듈(320)은 전자 책의 텍스트로부터 하나 이상의 엔티티들을 추출한다. 다시 말해, 엔티티 추출 모듈(320)은 전자 책의 텍스트에서 참조되는 엔티티들을 식별한다. 엔티티 추출 모듈(320)은 전자 책 텍스트로부터 엔티티들을 추출하기 위해, 핵심 구문 추출(key phrase extraction), 텍스트 마이닝(text mining), 자연어 프로세싱(natural language processing), 시멘틱 분석(semantic analysis), 등등을 포함하는 다양한 기법들 중 하나 이상을 이용한다.
엔티티 추출 모듈(320)의 실시예는 엔티티 추출 프로세스를 통지하기 위해 식별된 외부 데이터 소스들로부터의 정보를 이용한다. 외부 데이터 소스로부터의 정보는 전자 책에서 참조되는 암시적인 또는 명시적인 엔티티들의 리스트를 포함할 수 있다. 따라서, 엔티티 추출 모듈(320)은 전자 책 상에서 수행되는 엔티티 추출 프로세스를 안내(guide)하고 개선하기 위해 외부 데이터 소스를 이용할 수 있다.
예를 들어, 전자 책이 한 사람의 비 소설 전기인 경우, 외부 데이터 소스들은 그 사람의 삶을 기술하는 온라인 지식백과 엔트리를 포함할 수 있다. 온라인 지식백과 엔트리는 위치들, 날짜들 및 그 사람과 인터랙션한 다른 사람들과 같이, 그 사람과 관련된 명시적인 엔티티들의 리스트들을 포함할 수 있다. 추가적으로, 온라인 지식백과 엔트리는 그 사람과 관련된 엔티티들을 암시적으로 식별하는 해딩들, 태그들, 링크들, 및 기타 등등을 포함할 수 있다.
다른 예에서, 전자 책이 영화로도 만들어진 소설 작품인 경우, 외부 데이터 소스들은 영화 정보 데이터베이스에서의 영화에 대한 엔트리로의 링크를 포함할 수 있다. 영화 데이터베이스 엔트리는 영화에서의 (그리고 따라서, 가능성 높게는 전자 책에서의) 명시적인 캐릭터들의 리스트, 전자 책과 관련된 다른 영화들 또는 책들로의 링크, 등등을 포함할 수 있다.
엔티티 추출 모듈(320)은 전자 책 내의 후보 엔티티들을 식별하기 위해 외부 데이터 소스들을 파싱하거나 또는 그렇지 않으면 해석(interpret)할 수 있다. 그 다음, 엔티티 추출 모듈(320)은 전자 책에서 (만일 존재한다면) 이들 후보 엔티티들로의 참조들을 식별하기 위해 전자 책 텍스트를 검사(examine)할 수 있다. 추가적으로, 엔티티 추출 모듈(320)은 또한, 외부 데이터 소스들에서의 정보로부터 엔티티들의 상대적인 중요도와 같은 엔티티들에 관한 다른 정보를 파악(discern)할 수 있다.
엔티티 추출 모듈(320)은 전자 책으로부터 추출되는 엔티티들을 기술하는 데이터를 저장한다. 소정의 엔티티에 대해, 데이터는 엔티티가 참조되는 책 내의 위치들, 엔티티의 타입의 표시(예컨대, 사람 또는 위치), 제1 엔티티와 관련된 다른 엔티티들로의 상호 참조들 및 엔티티에 특별하게 관련된 전자 책 내의 텍스트 또는 다른 정보의 위치들을 포함할 수 있다.
요약 생성 모듈(330)은 추출된 엔티티들을 이용하여 문학 코퍼스(130)에 저장된 전자 책들에 관한 요약들을 생성한다. 일 실시예에서, 요약 생성 모듈(330)은 자동으로 그리고 동적으로, 요청 사용자에 의해 제공되는 시작 및/또는 휴식 지점들에 기초하여 엔티티 기반의 요약들을 생성한다. 엔티티 기반의 요약들은 시작 및 휴식 지점들에 의해 지정(delineate)되는 테스트 내에서, 전자 책에 참조되는 개별적인 엔티티들에 관하여 전자 책의 컨텐츠를 기술한다. 예를 들어, 수신된 요약 요청이 시작 지점을 책의 시작부로 식별하고 휴식 지점을 책의 텍스트 내의 일정 위치로 식별하는 경우, 요약 생성 모듈(330)은 시작으로부터 휴식 지점에 의해 식별되는 위치까지의 전자 책 텍스트의 요약을 생성한다. 생성된 요약은 엔티티에 의해 조직화되고, 오직 이 두 지점들 사이의 텍스트로부터의 엔티티들에 관한 정보를 이용하여 시작 지점과 휴식 지점 사이에서, 전자책에 참조되는 엔티티들을 기술한다. 사용자는 예컨대, 시작 지점 및 휴식 지점 사이의 전자 책에 의해 기술되는 캐리턱들 및 다른 엔티티들에 관하여 읽음으로써 이 시작 지점과 휴식 지점 사이의 전자 책의 컨텐츠에 관한 자신의 기억(recollection)을 리프레시할 수 있다.
엔티티에 대한 요약을 생성하기 위해, 요약 생성 모듈(330)의 실시예는 엔티티와 관련된 시작 지점과 휴식 지점 사이의 전자 책 텍스트를 식별한다. 그 다음, 요약 생성 모듈(330)은 요약에 포함시키기 위해 식별된 텍스트의 서브세트를 선택한다. 요약 생성 모듈(330)은 텍스트 조각(fragment)들에 의해 엔티티의 설명에 기여되는 정보의 양들을 기술하는 개별적인 텍스트 조각들(예컨대, 문장들, 문단들)에 그리고 전자 책 내의 다른 엔티티들과의 엔티티의 관계들에 가중 또는 스코어를 할당하기 위해 식별된 텍스트의 분석을 수행한다. 예를 들어, 매우 서술적인(highly-descriptive)이고 다른 엔티티들과의 인터랙션들을 기술하며 그리고 기타 유사한 텍스트 조각들은 이러한 특징들이 결여된 텍스트 조각들보다 더 많이(heavily) 가중될 수 있다. 요약 생성 모듈(330)은 엔티티의 요약에 포함시키기 위한 엔티티에 대한 가장 많이 가중된 텍스트 조각들을 선택한다.
제시 모듈(presentation module)(340)은 클라이언트 디바이스들(170)로부터 수신된 요청들에 응답하여 전자 책들의 엔티티 기반의 요약들을 제시한다. 일 실시예에서, 사용자 요청은 특정한 전자 책의 식별 및 식별된 전자 책의 시작 지점 및 휴식 지점을 포함한다. 제시 모듈(340)은 이 정보를 요약 생성 모듈(330)에 제공하고, 이에 응답하여 요청된 요약을 수신한다. 그 다음, 제시 모듈(340)은 요약을 요청 클라이언트 디바이스(170)에 제시한다.
요약의 특정한 제시는 서로 다른 실시예들에서 달라질 수 있다. 일 실시예에서, 제시 모듈(340)은 요약을 시작 지점과 휴식 지점 사이에서 전자 책에 참조되는 엔티티들의 리스트로서 제시한다. 사용자는 엔티티들의 리스트를 통해 브라우징하고, 이들 중 하나 이상을 선택한다. 제시 모듈(340)은 시작 지점과 휴식 지점 사이에서 발견되는 전자책 내의 정보에 기초하여 선택된 엔티티의 요약을 제시한다. 선택된 엔티티의 요약은 예컨대, 엔티티의 및 엔티티가 전자 책 내의 다른 엔티티들과 어떻게 인터랙션하는지에 관한 설명, 엔티티가 참조되는 전자 책 내의 위치들, 엔티티의 타입(예컨대, 사람 또는 위치)의 표시, 시작 지점과 휴식 지점 사이의 텍스트 내의 선택된 엔티티와 관련된 다른 엔티티들에 대한 상호 참조 및 텍스트의 위치들을 포함할 수 있다.
제시 모듈(340)은 전자 책에 대한 및/또는 시작 지점과 휴식 지점 사이의 페이지들의 범위에 대한 엔티티의 중요도 기초하여 엔티티들을 리스트에 랭킹할 수 있다. 랭킹은 예컨대, 개별 엔티티들이 시작 지점과 휴식 지점 사이에서 전자 책의 일부분에 언급되는 빈도, 외부 데이터 소스들(160)로부터 유도되는 엔티티들에 관한 중요도 정보 및/또는 상대적인 중요도의 다른 신호들에 기초할 수 있다.
도 4는 일 실시예에 따른 사용자에게 전자 책 및 전자 책의 엔티티 기반 요약을 제시하기 위한 클라이언트 디바이스(170)를 예시하는 상위레벨 블록도이다. 도시된 클라이언트 디바이스(170)는 클라이언트 인터랙션 모듈(410), 디스플레이 모듈(420) 및 로컬 데이터 스토리지(430)를 포함한다. 클라이언트 디바이스들(170)의 다른 실시예들은 다른 그리고/또는 추가적인 모듈들을 포함한다. 추가적으로, 기능들은 본 명세서에 기술된 것과 다른 방식으로 모듈들 간에 분산될 수 있다.
클라이언트 인터랙션 모듈(410)은 클라이언트 디바이스(170)에 입력된 사용자 입력을 통해 이루어지는 사용자 요청들을 프로세스한다. 사용자 요청들의 한가지 타입은 특별한 전자 책에 대한 요청이다. 전자 책에 대한 사용자 요청을 수신할 시, 클라이언트 인터랙션 모듈(410)은 로컬 데이터 스토리지(430)에서 요청된 전자 책을 검색한다. 로컬 데이터 스토리지(430)에 (예컨대, GOOGLE PLAY STORE™로부터 구매된) 전자 책의 카피본이 존재하는 경우, 클라이언트 인터랙션 모듈(410)은 요청된 전자 책의 적어도 일부를 검색하여 이를 사용자에게 제시하도록 디스플레이 모듈(420)에 명령한다. 요청된 전자 책의 카피가 로컬 데이터 스토리지(430)에 저장되어 있지 않음에 응답하여, 클라이언트 인터랙션 모듈(410)은 네트워크(150)를 통해 문학 코퍼스(130)에 저장된 전자 책의 원격 카피에 액세스하도록 디스플레이 모듈(420)에 명령할 수 있다.
클라이언트 인터랙션 모듈(410)은 또한, 사용자들의 클라이언트 디바이스들(170) 상에 디스플레이되는 전자 책들의 엔티티 기반의 요약들에 대한 사용자 요청들을 수신한다. 예를 들어, 클라이언트 인터랙션 모듈(410)은 사용자가 전자 책의 요약을 요청하기 위해 사용자 인터페이스와 인터랙션할 때를 검출할 수 있다. 클라이언트 인터랙션 모듈(410)은 특정된 시작 및 휴식 지점들과 함께 사용자 요청을 스토어 서버(110)에 전송한다. 클라이언트 인터랙션 모듈(410)은 책과의 사용자의 이전의 인터랙션으로부터 시작 지점 및 휴식 지점을 추론할 수 있다. 예를 들어, 모듈(410)은 시작 지점이 전자 책의 시작부이고 휴식 지점이 전자 책에서 사용자에 의해 읽혀진 가장 먼 위치임을 추론할 수 있다. 휴식 지점은 전자 책의 끝 이전의 위치일 수 있고, 따라서 시작 지점 및 휴식 지점에 의해 정의되는 책의 범위는 전자 책의 텍스트의 서브세트이다. 추가적으로, 시작 지점 및 휴식 지점은 사용자에 의해 명시적으로 특정될 수 있다.
디스플레이 모듈(420)은 스토어 서버(110)로부터 엔티티 기반의 전자 책 요약을 수신하고, 클라이언트 디바이스(170)의 사용자에게 전자 책 요약을 디스플레이하거나 또는 그렇지 않으면 제시한다. 디스플레이 모듈(420)은 또한, 전자 책의 텍스트 및/또는 전자 책과 관련된 다른 정보를 제시할 수 있다. 예를 들어, 디스플레이 모듈(420)은 전자 책의 식별된 부분에 참조되는 엔티티의 요약을 디스플레이하면서 엔티티가 참조되는 전자 책 텍스트의 페이지들을 동시에 디스플레이할 수 있다.
예시적인 방법
도 5는 일 실시예에 따른 전자 책의 엔티티 기반의 요약을 제공하기 위한 프로세스를 예시하는 순서도이다. 도 5에서 프로세스의 단계들은 요약 서브시스템(120)에 의해 수행된다. 그러나, 이 단계들 중 일부 또는 전부는 다른 엔티티들에 의해 수행될 수 있다. 추가적으로, 일부 실시예들은 병렬로 단계들을 수행하거나 다른 순서로 단계들을 수행하거나 또는 다른 단계들을 수행할 수 있다.
초기에, 요약 서브시스템(120)은 요약될 전자 책을 식별한다(단계 510). 도 3에 관하여 이전에 기술된 바와 같이, 요약 서브시스템(120)은 요약을 위한 사용자 요청을 수신할 시 요약될 전자 책을 식별할 수 있다. 요약 서브시스템(120)은 또한, 전자 책이 문학 코퍼스(130)에 추가되거나 또는 요약 프로세스가 코퍼스 내의 복수의 전자 책들에서 개시되는 것과 같은 다른 이벤트의 발생 시 요약될 전자 책을 식별할 수 있다.
요약 서브시스템(120)은 요약될 전자 책의 타입을 결정한다(단계 520). 전자 책과 관련된 메타데이터에 기초하여, 요약 서브시스템(120)은 하나 이상의 일반적인 타입 카테고리들, 예컨대 소설 또는 비소설로 전자 책을 카테고리화한다. 요약 서브시스템(120)은 또한, 일반적인 카테고리 내의 특정한 카테고리들(예컨대, 미스테리, 역사 소설)로 전자 책을 카테고리화할 수 있다. 대안적으로는, 요약 서브시스템(120)은 전자 책의 텍스트를 분석함으로써 전자 책의 타입을 결정한다.
요약 서브시스템(120)은 또한, 전자 책의 타입에 기초하여 하나 이상의 외부 데이터 소스들을 식별한다(단계 530). 식별된 외부 데이터 소스들은 전자 책에 참도되는 엔티티들을 식별하도록 요약 서브시스템(120)을 도와주는 정보를 가질 가능성이 높은 소스들이다. 요약 서브시스템(120)은 전자 책의 텍스트에 참조되는 엔티티들을 식별하고 엔티티들에 관한 정보를 추출한다(단계 540). 요약 서브시스템(120)은 전자 책과 관련된 식별된 외부 데이터 소스들(160)로부터의 정보를 이용하는 것을 포함하여 전자 책 텍스트 내의 엔티티들을 식별하기 위해 다양한 기법들 중 하나 이상을 이용할 수 있다.
단계(550)에서, 요약 서브시스템(120)은 전자 책의 일부의 요약을 위한 사용자 요청을 수신한다. 사용자 요청은 요약이 요청된 전자 책의 범위를 식별한다. 이 범위는 전자 책의 시작부 및 사용자가 읽은 가장 먼 지점과 같은 시작 및 휴식 지점들에 의해 정의된다. 일 실시예에서, 요약 서브시스템(120)은 사용자 요청에 특정된 범위에 대한 전자 책의 엔티티 기반의 요약을 동적으로 생성한다(단계 560). 요약은 전자 책의 특정된 범위에 참조되는 식별된 엔티티들을 기술한다.
요약 서브시스템(120)은 요청 사용자에게 엔티티 기반의 요약을 제시한다(단계 570). 사용자는 사용자가 읽지 않은 책의 부분들에 관한 정보를 발견할 위험이 없이 전자 책의 컨텐츠에 관한 자신의 기억을 리프레시하기 위해 엔티티 기반의 요약을 이용할 수 있다.
상기 설명은 바람직한 실시예들의 동작을 예시하기 위해 포함된 것이며, 본 발명의 범위를 제한하는 것을 의미하지 않는다. 본 발명의 범위는 다음의 특허청구범위에 의해서만 제한되어야 한다. 상기 논의로부터, 본 발명의 사상 및 범위에 의해 포괄될 수 있는 많은 변형들이 관련 기술 분야의 숙련자에게 분명해질 것이다.

Claims (20)

  1. 컴퓨터로 구현되는, 전자 책(e-book)의 엔티티 기반의 요약(entity -based summary)을 제시하는 방법으로서,
    요약될 전자 책을 식별하는 단계와;
    상기 식별된 전자 책의 텍스트에서 참조되는 복수의 엔티티(entity)들을 식별하는 단계와;
    상기 전자 책의 엔티티 기반의 요약을 위한 요청을 수신하는 단계 - 상기 요청은 시작 지점(start point)과 휴식 지점(break point) 사이의 상기 전자 책의 특정된 범위를 식별함 - 와;
    상기 전자 책의 엔티티 기반의 요약을 생성하는 단계 - 상기 엔티티 기반의 요약은 상기 전자 책의 특정된 범위에서 참조되는 식별된 엔티티들을 기술함(describing) - 와;
    상기 요청에 응답하여 상기 생성된 엔티티 기반의 요약을 제시하는 단계를 포함하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서,
    요약될 상기 전자 책의 타입을 결정하는 단계와; 그리고
    상기 전자 책의 결정된 타입에 기초하여 하나 이상의 외부 데이터 소스들을 식별하는 단계 - 외부 데이터 소스는 상기 식별된 전자 책 내의 엔티티들에 관한 정보를 제공함 - 와;
    상기 복수의 엔티티들을 식별하는 단계는 상기 외부 데이터 소스에 의해 제공되는 정보에 응답하여 상기 복수의 엔티티들을 식별하는 것을 포함하는 것을 특징으로 하는 방법.
  3. 제2항에 있어서,
    상기 전자 책의 타입을 결정하는 단계는:
    상기 전자 책과 관련된 메타데이터를 분석하는 것과; 그리고
    상기 메타데이터의 분석에 응답하여 상기 전자 책을 하나 이상의 카테고리들로 카테고리화하는 것을 포함하는 것을 특징으로 하는 방법.
  4. 제1항에 있어서,
    상기 시작 지점은 클라이언트 디바이스의 사용자에 의해 선택되는 상기 전자 책 내의 시작부 위치를 식별하고, 상기 휴식 지점은 상기 전자 책에서 상기 사용자에 의해 읽혀진 가장 먼 위치(farthest location)를 식별하며, 상기 휴식 지점은 상기 전자 책의 끝(end) 이전의 위치를 식별하는 것을 특징으로 하는 방법.
  5. 제1항에 있어서,
    상기 전자 책의 엔티티 기반의 요약을 생성하는 것은 오직 상기 특정된 범위 내의 상기 전자 책의 텍스트로부터의 엔티티들에 관한 정보를 이용하여 상기 식별된 엔티티들의 설명들을 생성하는 것을 포함하는 것을 특징으로 하는 방법.
  6. 제5항에 있어서,
    상기 식별된 엔티티들의 설명들을 생성하는 것은:
    상기 식별된 엔티티들과 관련된 상기 시작 지점과 휴식 지점 사이의 특정된 범위 내의 상기 전자 책으로부터의 텍스트 조각(fragment)들을 식별하는 것과,
    상기 텍스트 조각들에 의해 상기 식별된 엔티티들의 설명들에 기여되는 정보의 양을 기술하는 식별된 텍스트 조각들에 가중(weight)들을 할당하는 것과, 그리고
    상기 할당된 가중들에 응답하여 상기 엔티티 기반의 요약에 포함시키기 위한 상기 식별된 텍스트 조각들의 서브세트를 선택하는 것을 포함하는 것을 특징으로 하는 방법.
  7. 제1항에 있어서,
    상기 엔티티 기반의 요약을 제시하는 단계는:
    상기 전자 책에 대한 엔티티들의 중요도에 기초하여 상기 식별된 엔티티들을 리스트에 랭킹하는 것과, 그리고
    상기 랭킹된 엔티티들의 리스트를 클라이언트 디바이스에 제시하는 것을 포함하는 것을 특징으로 하는 방법.
  8. 전자 책(e-book)의 엔티티 기반의 요약을 제시하기 위한 클라이언트 디바이스로서,
    컴퓨터 프로그램 모듈들을 실행하기 위한 컴퓨터 프로세서와; 그리고
    컴퓨터 프로그램 모듈들을 저장한 비일시적 컴퓨터 판독가능 저장 디바이스를 포함하며, 상기 컴퓨터 프로그램 모듈들은 단계들을 수행하도록 실행가능하며, 상기 단계들은:
    요약될 전자 책을 식별하는 단계와;
    서버에 상기 전자 책의 엔티티 기반의 요약을 위한 요청을 제공하는 단계 - 상기 요청은 시작 지점과 휴식 지점 사이의 상기 전자 책의 특정된 범위를 식별하고, 상기 서버는 상기 식별된 전자 책의 텍스트에서 참조되는 복수의 엔티티들을 식별하고, 상기 전자 책의 엔티티 기반의 요약을 생성하도록 구성되며, 상기 엔티티 기반의 요약은 상기 전자 책의 특정된 범위에서 참조되는 식별된 엔티티들을 기술하며, 상기 서버는 상기 요청에 응답하여 상기 클라이언트 디바이스에 상기 생성된 엔티티 기반의 요약을 제공하도록 구성됨 - 와; 그리고
    상기 클라이언트 디바이스 상에 상기 생성된 엔티티 기반의 요약을 제시하는 단계를 포함하는 것을 특징으로 하는 클라이언트 디바이스.
  9. 제8항에 있어서,
    상기 서버는 또한:
    요약될 상기 전자 책의 타입을 결정하고; 그리고
    상기 전자 책의 결정된 타입에 기초하여 하나 이상의 외부 데이터 소스들을 식별 - 외부 데이터 소스는 상기 식별된 전자 책 내의 엔티티들에 관한 정보를 제공함 - 하도록 구성되며,
    상기 복수의 엔티티들을 식별하는 단계는 상기 외부 데이터 소스에 의해 제공되는 정보에 응답하여 상기 복수의 엔티티들을 식별하는 것을 포함하는 것을 특징으로 하는 클라이언트 디바이스.
  10. 제9항에 있어서,
    상기 전자 책의 타입을 결정하는 단계는:
    상기 전자 책과 관련된 메타데이터를 분석하는 것과; 그리고
    상기 메타데이터의 분석에 응답하여 상기 전자 책을 하나 이상의 카테고리들로 카테고리화하는 것을 포함하는 것을 특징으로 하는 클라이언트 디바이스.
  11. 제8항에 있어서,
    상기 전자 책의 엔티티 기반의 요약을 생성하는 것은 오직 상기 특정된 범위 내의 상기 전자 책의 텍스트로부터의 엔티티들에 관한 정보를 이용하여 상기 식별된 엔티티들의 설명들을 생성하는 것을 포함하는 것을 특징으로 하는 클라이언트 디바이스.
  12. 제11항에 있어서,
    상기 식별된 엔티티들의 설명들을 생성하는 것은:
    상기 식별된 엔티티들과 관련된 상기 시작 지점과 휴식 지점 사이의 특정된 범위 내의 상기 전자 책으로부터의 텍스트 조각들을 식별하는 것과,
    상기 텍스트 조각들에 의해 상기 식별된 엔티티들의 설명들에 기여되는 정보의 양을 기술하는 식별된 텍스트 조각들에 가중들을 할당하는 것과, 그리고
    상기 할당된 가중들에 응답하여 상기 엔티티 기반의 요약에 포함시키기 위한 상기 식별된 텍스트 조각들의 서브세트를 선택하는 것을 포함하는 것을 특징으로 하는 클라이언트 디바이스.
  13. 제8항에 있어서,
    상기 엔티티 기반의 요약을 제시하는 단계는:
    상기 전자 책에 대한 엔티티들의 중요도에 기초하여 상기 식별된 엔티티들을 리스트에 랭킹하는 것과, 그리고
    상기 랭킹된 엔티티들의 리스트를 상기 클라이언트 디바이스에 제시하는 것을 포함하는 것을 특징으로 하는 클라이언트 디바이스.
  14. 전자 책(e-book)의 엔티티 기반의 요약을 제시하기 위한 실행가능한 컴퓨터 프로그램 명령어들을 저장한 비일시적 컴퓨터 판독가능 매체로서, 상기 컴퓨터 판독가능 명령어들은:
    요약될 전자 책을 식별하고;
    상기 식별된 전자 책의 텍스트에서 참조되는 복수의 엔티티들을 식별하고;
    상기 전자 책의 엔티티 기반의 요약을 위한 요청을 수신 - 상기 요청은 시작 지점과 휴식 지점 사이의 상기 전자 책의 특정된 범위를 식별함 - 하고;
    상기 전자 책의 엔티티 기반의 요약을 생성 - 상기 엔티티 기반의 요약은 상기 전자 책의 특정된 범위에서 참조되는 식별된 엔티티들을 기술함 - 하고; 그리고
    상기 요청에 응답하여 상기 생성된 엔티티 기반의 요약을 제시하기 위한 명령어들을 포함하는 것을 특징으로 하는 비일시적 컴퓨터 판독가능 매체.
  15. 제14항에 있어서,
    요약될 상기 전자 책의 타입을 결정하고; 그리고
    상기 전자 책의 결정된 타입에 기초하여 하나 이상의 외부 데이터 소스들을 식별 - 외부 데이터 소스는 상기 식별된 전자 책 내의 엔티티들에 관한 정보를 제공함 - 하기 위한 컴퓨터 프로그램 명령어들을 더 포함하며,
    상기 복수의 엔티티들을 식별하는 것은 상기 외부 데이터 소스에 의해 제공되는 정보에 응답하여 상기 복수의 엔티티들을 식별하는 것을 포함하는 것을 특징으로 하는 비일시적 컴퓨터 판독가능 매체.
  16. 제15항에 있어서,
    상기 전자 책의 타입을 결정하기 위한 컴퓨터 프로그램 명령어들은:
    상기 전자 책과 관련된 메타데이터를 분석하고; 그리고
    상기 메타데이터의 분석에 응답하여 상기 전자 책을 하나 이상의 카테고리들로 카테고리화하기 위한 컴퓨터 프로그램 명령어들을 포함하는 것을 특징으로 하는 비일시적 컴퓨터 판독가능 매체.
  17. 제14항에 있어서,
    상기 시작 지점은 클라이언트 디바이스의 사용자에 의해 선택되는 상기 전자 책 내의 시작부 위치를 식별하고, 상기 휴식 지점은 상기 전자 책에서 상기 사용자에 의해 읽혀진 가장 먼 위치를 식별하며, 상기 휴식 지점은 상기 전자 책의 끝 이전의 위치를 식별하는 것을 특징으로 하는 비일시적 컴퓨터 판독가능 매체.
  18. 제14항에 있어서,
    상기 전자 책의 엔티티 기반의 요약을 생성하기 위한 컴퓨터 프로그램 명령어들은 오직 상기 특정된 범위 내의 상기 전자 책의 텍스트로부터의 엔티티들에 관한 정보를 이용하여 상기 식별된 엔티티들의 설명들을 생성하기 위한 컴퓨터 프로그램 명령어들을 포함하는 것을 포함하는 것을 특징으로 하는 비일시적 컴퓨터 판독가능 매체.
  19. 제18항에 있어서,
    상기 식별된 엔티티들의 설명들을 생성하기 위한 컴퓨터 프로그램 명령어들은:
    상기 식별된 엔티티들과 관련된 상기 시작 지점과 휴식 지점 사이의 특정된 범위 내의 상기 전자 책으로부터의 텍스트 조각들을 식별하고,
    상기 텍스트 조각들에 의해 상기 식별된 엔티티들의 설명들에 기여되는 정보의 양을 기술하는 식별된 텍스트 조각들에 가중들을 할당하고, 그리고
    상기 할당된 가중들에 응답하여 상기 엔티티 기반의 요약에 포함시키기 위한 상기 식별된 텍스트 조각들의 서브세트를 선택하기 위한 컴퓨터 프로그램 명령어들을 포함하는 것을 특징으로 하는 비일시적 컴퓨터 판독가능 매체.
  20. 제14항에 있어서,
    상기 엔티티 기반의 요약을 제시하기 위한 컴퓨터 프로그램 명령어들은:
    상기 전자 책에 대한 엔티티들의 중요도에 기초하여 상기 식별된 엔티티들을 리스트에 랭킹하고, 그리고
    상기 랭킹된 엔티티들의 리스트를 클라이언트 디바이스에 제시하기 위한 컴퓨터 프로그램 명령어들을 포함하는 것을 특징으로 하는 비일시적 컴퓨터 판독가능 매체.
KR1020167017626A 2013-12-20 2014-11-19 전자 책들에 대한 엔티티 기반의 요약 KR20160100316A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/137,597 2013-12-20
US14/137,597 US20150178266A1 (en) 2013-12-20 2013-12-20 Entity-based summarization for electronic books
PCT/US2014/066299 WO2015094547A1 (en) 2013-12-20 2014-11-19 Entity-based summarization for electronic books

Publications (1)

Publication Number Publication Date
KR20160100316A true KR20160100316A (ko) 2016-08-23

Family

ID=53400217

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167017626A KR20160100316A (ko) 2013-12-20 2014-11-19 전자 책들에 대한 엔티티 기반의 요약

Country Status (5)

Country Link
US (1) US20150178266A1 (ko)
EP (1) EP3084713A4 (ko)
KR (1) KR20160100316A (ko)
CN (1) CN105745684A (ko)
WO (1) WO2015094547A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10380120B2 (en) * 2014-03-18 2019-08-13 International Business Machines Corporation Automatic discovery and presentation of topic summaries related to a selection of text
KR20150138742A (ko) * 2014-06-02 2015-12-10 삼성전자주식회사 컨텐츠 처리 방법 및 그 전자 장치
US10042880B1 (en) * 2016-01-06 2018-08-07 Amazon Technologies, Inc. Automated identification of start-of-reading location for ebooks
CN106777080B (zh) * 2016-12-13 2020-04-24 竹间智能科技(上海)有限公司 短摘要生成方法、数据库建立方法及人机对话方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3698907B2 (ja) * 1999-01-22 2005-09-21 シャープ株式会社 電子書籍システム
KR20020006948A (ko) * 2000-07-14 2002-01-26 박정호 통신망을 이용한 전자서적 운영 방법과 시스템 및 그방법이 저장된 기록매체
JP2002312380A (ja) * 2001-04-18 2002-10-25 Matsushita Electric Ind Co Ltd 電子書籍システム
US7962465B2 (en) 2006-10-19 2011-06-14 Yahoo! Inc. Contextual syndication platform
US7783644B1 (en) * 2006-12-13 2010-08-24 Google Inc. Query-independent entity importance in books
CN101354840B (zh) * 2008-09-08 2011-09-28 众智瑞德科技(北京)有限公司 一种对电子书进行语音阅读控制的方法及装置
SG171493A1 (en) * 2009-12-01 2011-06-29 Creative Tech Ltd A method for managing a plurality of electronic books on a computing device
US9679047B1 (en) * 2010-03-29 2017-06-13 Amazon Technologies, Inc. Context-sensitive reference works
US20150026176A1 (en) * 2010-05-15 2015-01-22 Roddy McKee Bullock Enhanced E-Book and Enhanced E-book Reader
US8600979B2 (en) 2010-06-28 2013-12-03 Yahoo! Inc. Infinite browse
KR20120045190A (ko) * 2010-10-29 2012-05-09 삼성전자주식회사 전자책을 표시하는 모바일 단말기 및 그 방법
WO2013006944A1 (en) * 2011-07-12 2013-01-17 Research In Motion Limited Methods and apparatus to provide electronic book summaries and related information
US9542494B2 (en) * 2011-10-11 2017-01-10 Microsoft Technology Licensing, Llc Proactive delivery of related tasks for identified entities
US9069744B2 (en) * 2012-05-15 2015-06-30 Google Inc. Extensible framework for ereader tools, including named entity information
US9128591B1 (en) * 2012-10-29 2015-09-08 Audible, Inc. Providing an identifier for presenting content at a selected position

Also Published As

Publication number Publication date
EP3084713A4 (en) 2017-08-16
CN105745684A (zh) 2016-07-06
EP3084713A1 (en) 2016-10-26
US20150178266A1 (en) 2015-06-25
WO2015094547A1 (en) 2015-06-25

Similar Documents

Publication Publication Date Title
US9852215B1 (en) Identifying text predicted to be of interest
US9514121B2 (en) Custom dictionaries for E-books
Kelly et al. How many results per page? A study of SERP size, search behavior and user experience
US11455465B2 (en) Book analysis and recommendation
US9262766B2 (en) Systems and methods for contextualizing services for inline mobile banner advertising
US9613003B1 (en) Identifying topics in a digital work
US8131734B2 (en) Image based annotation and metadata generation system with experience based learning
US9336211B1 (en) Associating an entity with a search query
US8887044B1 (en) Visually distinguishing portions of content
US9015175B2 (en) Method and system for filtering an information resource displayed with an electronic device
US9372592B1 (en) Presenting information related to content items
US20130218914A1 (en) System and method for providing recommendations based on information extracted from reviewers' comments
US20080033938A1 (en) Keyword outputting apparatus, keyword outputting method, and keyword outputting computer program product
US20130054672A1 (en) Systems and methods for contextualizing a toolbar
US9081765B2 (en) Displaying examples from texts in dictionaries
US10061767B1 (en) Analyzing user reviews to determine entity attributes
US10810357B1 (en) System and method for selection of meaningful page elements with imprecise coordinate selection for relevant information identification and browsing
US20140229810A1 (en) Topic extraction and video association
KR20160100316A (ko) 전자 책들에 대한 엔티티 기반의 요약
Umemoto et al. Search intent estimation from user's eye movements for supporting information seeking
US20170228464A1 (en) Finding users in a social network based on document content
JP2012256268A (ja) 広告配信装置及び広告配信プログラム
US8195458B2 (en) Open class noun classification
WO2013033445A2 (en) Systems and methods for contextualizing a toolbar, an image and inline mobile banner advertising
Coe et al. Looking for needles in a haystack: how do ebook reader applications handle active indexes? Part 3–tablet devices

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E90F Notification of reason for final refusal
E601 Decision to refuse application