KR102075874B1 - 전자책 변환 방법 및 이러한 방법을 수행하는 장치 - Google Patents

전자책 변환 방법 및 이러한 방법을 수행하는 장치 Download PDF

Info

Publication number
KR102075874B1
KR102075874B1 KR1020190114390A KR20190114390A KR102075874B1 KR 102075874 B1 KR102075874 B1 KR 102075874B1 KR 1020190114390 A KR1020190114390 A KR 1020190114390A KR 20190114390 A KR20190114390 A KR 20190114390A KR 102075874 B1 KR102075874 B1 KR 102075874B1
Authority
KR
South Korea
Prior art keywords
epub
component
daisy
format file
mappable
Prior art date
Application number
KR1020190114390A
Other languages
English (en)
Inventor
이종윤
김현영
Original Assignee
주식회사 보인정보기술
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 보인정보기술 filed Critical 주식회사 보인정보기술
Priority to KR1020190114390A priority Critical patent/KR102075874B1/ko
Application granted granted Critical
Publication of KR102075874B1 publication Critical patent/KR102075874B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

본 발명은 전자책 변환 방법 및 이러한 방법을 수행하는 장치에 관한 것이다. 전자책 변환 방법은 입력부가 EPUB(Electric Publications) 포맷 파일을 수신하고, 수신한 EPUB 포맷 파일에 대한 유효성을 검정하는 단계, 변환부가 EPUB 포맷 파일을 DAISY(Digital Accessible Information System) 포맷 파일로 변환하는 단계와 출력부가 DAISY 포맷 파일을 출력하는 단계를 포함할 수 있다.

Description

전자책 변환 방법 및 이러한 방법을 수행하는 장치{Method for conversion of e-book and apparatus using the method}
본 발명은 전자책 변환 방법 및 이러한 방법을 수행하는 장치에 관한 것이다. 보다 상세하게는 독서 장애인도 접근 가능하도록 전자책을 변환하여 독서 장애인용 전자책으로 제공하기 위한 전자책 변환 방법 및 이러한 방법을 수행하는 장치에 관한 것이다.
출판 시장의 흐름은 종이에 인쇄하여 책과 같은 형태의 출판물 시대에서 벗어나, 최근 IT(information technology) 기술의 발달로 개인 스마트폰, 태블릿, 노트북 등을 이용해 앱 스토어 같은 북 스토어에서 온라인 디지털 형태로 출판되는 추세로 바뀌어 가고 있다. 전자책(eBook) 출판 형태는 두 가지로 나뉘는데 첫째는 모바일 애플리케이션 형태의 앱 북과 두 번째는 전자 문서로 제작하여 별도의 뷰어를 통해 읽을 수 있는 전자책 문서 형태이다. 앱 북은 개인 디바이스에만 국한되어 확장의 어려움이 있어, 현재는 전자책 문서 형태를 선호하는 시장이 형성되어 가고 있다.
현재까지 출판된 책들을 다시 전자책으로 만드는 과정은 PDF(Portable Document Format)나 종이로 된 책을 사람이 수작업을 통하여 제작하고 있다. 따라서, 기존에 책을 제작했던 작업 시간과 인건 비용이 재투자되어 낭비되는 부분이 많다. 또한, 전자책 초창기에는 PDF문서 자체를 보여주는 전자책 시장이었지만, 다양한 콘텐츠를 담아 내기에는 PDF문서가 미디어를 처리하는데 한계가 있다. 이러한 문제를 해결하기 위하여 현재 PDF를 EPUB(Electronic Publication)의 형태로 변환하는 도구가 개발되어 전자책 콘텐츠 제작자들이 사용하고 있다. 그러나 폰트가 추출되지 않는 문제, 글자 누락, 색감 저조, 표 추출 누락 등으로 완벽히 변환되지 않아 아직은 미흡한 실정이다.
이뿐만 아니라, EPUB 포맷의 책의 경우, 독서 장애인들이 컨텐츠를 제공받을 수 없는 포맷이기 때문에 추가적인 변환이 필요하다. 따라서, 독서 장애인들에게 컨텐츠를 용이하게 제공하기 위해 EPUB 포맷의 책을 독서 장애인들이 활용 가능한 포맷으로 용이하게 변경하기 위한 연구가 필요하다.
본 발명은 상술한 문제점을 모두 해결하는 것을 그 목적으로 한다.
또한, 본 발명은, 독서 장애인들에게 컨텐츠를 용이하게 제공하기 위해 EPUB 포맷의 책을 독서 장애인들이 활용 가능한 포맷으로 용이하게 변경하는 것을 목적으로 한다.
또한, 본 발명은, 멀티미디어와 인터랙션을 포함한 EPUB에서 음성 도서인 DAISY로 변환시 멀티미디어와 인터랙션 관련 정보를 정확하게 변환하는 것을 목적으로 한다.
상기 목적을 달성하기 위한 본 발명의 대표적인 구성은 다음과 같다.
본 발명의 일 태양에 따르면, 전자책 변환 방법은 입력부가 EPUB(Electric Publications) 포맷 파일을 수신하고, 수신한 상기 EPUB 포맷 파일에 대한 유효성을 검정하는 단계, 변환부가 상기 EPUB 포맷 파일을 DAISY(Digital Accessible Information System) 포맷 파일로 변환하는 단계와 출력부가 상기 DAISY 포맷 파일을 출력하는 단계를 포함할 수 있다.
한편, 상기 변환부는 스키마 파싱 및 스키마 컨버팅을 수행하고, 상기 스키마 파싱은 상기 EPUB 포맷 파일에 대한 구조적 위계 파악, 메타데이터 분석, XHTML(Extensible Hypertext Markup Language) 목차 및 페이지 정보에 따른 구성 요소 분석을 포함하고, 상기 스키마 컨버팅은 상기 스키마 파싱된 상기 EPUB 포맷 파일의 구성 요소(EPUB)를 상기 DAISY 포맷 파일의 구성 요소(DAISY)로 변환할 수 있다.
또한, 상기 변환부는 SMIL(synchronized multimedia integration language) 목록의 생성 및 상기 DAISY 파일 포맷의 유효화를 수행하고, 상기 SMIL 목록은 텍스트 정보를 음성 정보로서 변환하기 위한 목록이고, 상기 DAISY 파일 포맷의 유효화는 DAISY 포맷으로 변경된 페이지 각각에 대한 검토를 포함할 수 있다.
본 발명의 다른 태양에 따르면, 전자책 변환을 수행하는 전자책 변환 장치는 입력부, 변환부 및 출력부를 포함하고, 상기 입력부는 EPUB(Electric Publications) 포맷 파일을 수신하고, 수신한 상기 EPUB 포맷 파일에 대한 유효성을 검정하도록 구현되고, 상기 변환부가 상기 EPUB 포맷 파일을 DAISY(Digital Accessible Information System) 포맷 파일로 변환하도록 구현되고, 상기 출력부는 상기 DAISY 포맷 파일을 출력하도록 구현될 수 있다.
한편, 상기 변환부는 스키마 파싱 및 스키마 컨버팅을 수행하도록 구현되고, 상기 스키마 파싱은 상기 EPUB 포맷 파일에 대한 구조적 위계 파악, 메타데이터 분석, XHTML(Extensible Hypertext Markup Language) 목차 및 페이지 정보에 따른 구성 요소 분석을 포함하고, 상기 스키마 컨버팅은 상기 스키마 파싱된 상기 EPUB 포맷 파일의 구성 요소(EPUB)를 상기 DAISY 포맷 파일의 구성 요소(DAISY)로 변환할 수 있다.
또한, 상기 변환부는 SMIL(synchronized multimedia integration language) 목록의 생성 및 상기 DAISY 파일 포맷의 유효화를 수행하도록 구현되고, 상기 SMIL 목록은 텍스트 정보를 음성 정보로서 변환하기 위한 목록이고, 상기 DAISY 파일 포맷의 유효화는 DAISY 포맷으로 변경된 페이지 각각에 대한 검토를 포함할 수 있다.
본 발명에 의하면, 독서 장애인들에게 컨텐츠를 용이하게 제공하기 위해 EPUB 포맷의 책이 독서 장애인들이 활용 가능한 포맷으로 용이하게 변경될 수 있다.
또한, 본 발명에 의하면, 멀티미디어와 인터랙션을 포함한 EPUB에서 음성 도서인 DAISY로 변환시 멀티미디어와 인터랙션 관련 정보가 정확하게 변환될 수 있다.
도 1은 본 발명의 실시예에 따른 전자책 변환 장치를 나타낸 개념도이다.
도 2는 본 발명의 실시예에 따른 전자책 변환 방법을 나타낸 개념도이다.
도 3은 본 발명의 실시예에 따른 EPUB 포맷 파일에 대한 유효성 판단 절차를 나타낸 개념도이다.
도 4는 본 발명의 실시예에 따른 스키마 파싱 단계를 나타낸 개념도이다.
도 5는 본 발명의 실시예에 따른 스키마 컨버팅 단계를 나타내는 개념도이다.
도 6은 본 발명의 실시예에 따른 구성 요소 재정의 및 배열 단계를 나타낸 개념도이다.
도 7은 본 발명의 실시예에 따른 SMIL 생성 방법을 나타낸 개념도이다.
도 8은 본 발명의 실시예에 따른 DAISY 유효화(validation) 과정을 나타낸 개념도이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이러한 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 본 명세서에 기재되어 있는 특정 형상, 구조 및 특성은 본 발명의 정신과 범위를 벗어나지 않으면서 일 실시예로부터 다른 실시예로 변경되어 구현될 수 있다. 또한, 각각의 실시예 내의 개별 구성요소의 위치 또는 배치도 본 발명의 정신과 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 행하여 지는 것이 아니며, 본 발명의 범위는 특허청구범위의 청구항들이 청구하는 범위 및 그와 균등한 모든 범위를 포괄하는 것으로 받아들여져야 한다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 구성요소를 나타낸다.
이하에서는, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 여러 바람직한 실시예에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
독서 장애인을 위한 모든 전자책은 목차, 내용, 각주, 미주, 색인 등 독서 장애인이 이해할 수 있는 책의 구성 및 그림 설명을 포함해야 한다. 앞으로 전자책을 제작할 때 반드시 준수해야 할 독서장애인 접근성 표준 기준이 DAISY Consortium, W3C Consortium, ISO/IEC JTC1 SC34 등에서 제시되어 있다. 이들 표준에서 독서 장애인을 위한 전자책 규격은 DTBOOK(Digital Talking Book)과 EPUB(Electric Publications)으로 정의되었다.
선진국에서는 2000년대 초반부터 DTBOOK 및 DAISY(Digital Accessible Information System) 규격을 상용화하여 도서관 중심의 독서 장애인용 전자책 서비스를 제공하고 있었으며, 2010년부터는 새로운 EPUB 규격도 상용화하여 DAISY와 함께 서비스하고 있다. DAISY는 텍스트 기반의 음성 도서이고, 멀티미디어 자료 및 표, 전자책 콘텐츠와의 상호 인터랙션 등이 부족하여 새로운 EPUB 규격이 필요하였기 때문이다.
따라서 기존에 만들어진 DAISY 파일을 EPUB 파일로 변환하는 도구나 EPUB 저작 도구에 대한 수요가 많음으로 이들에 대한 연구와 개발은 상당히 많이 이루어져 있다. DAISY와 EPUB의 도서관 서비스가 동시에 이루어져야 함으로, 제작 단계에서는 두 규격 중 하나의 규격을 만들어 변환하는 도구에 대한 관심이 상당하다. 특히 멀티미디어와 인터랙션을 포함한 EPUB에서 음성 도서인 DAISY로 변환하는 작업이 필수적이다. 리소스 집합이 작은 전자책에서 리소스 집합이 큰 전자책으로의 변환이 불가능하기 때문이다.
이하, 본 발명의 실시예에 따른 전자책 변환 방법 및 이러한 방법을 수행하는 장치에서는 EPUB 포맷(EPUB 3.0.1 및 3.1 포맷)으로 생성된 파일의 구조와 구성 태그 요소 및 리소스를 분석하여 DAISY 포맷(DAISY 3.0 포맷)에 맞게 변환하는 방법 및 장치가 개시된다.
도 1은 본 발명의 실시예에 따른 전자책 변환 장치를 나타낸 개념도이다.
도 1에서는 EPUB 포맷 파일을 DAISY 포맷 파일로 변환하기 위한 전자책 변환 장치가 개시된다.
도 1을 참조하면, 파일 포맷 변환 장치는 입력부(100), 변환부(120) 및 출력부(140)를 포함할 수 있다.
입력부(100)는 EPUB 포맷 파일을 수신하고, EPUB 포맷에 대한 유효성을 검증하기 위해 구현될 수 있다.
변환부(120)는 EPUB 포맷을 DAISY 포맷으로 변환하기 위해 구현될 수 있다. 변환부는 스키마 파싱(schema parsing), 스키마 컨버팅(schema converting), 구성 요소 재정의 및 재배열, SMIL(Synchronized Multimedia Integration Language) 목록 생성, DAISY 유효화 등을 통해 EPUB 포맷을 DAISY 포맷으로 변환할 수 있다.
출력부(140)는 EPUB 포맷 파일을 기준으로 변환된 DAISY 포맷 파일을 출력하기 위해 구현될 수 있다.
도 2는 본 발명의 실시예에 따른 전자책 변환 방법을 나타낸 개념도이다.
도 2에서는 EPUB 포맷(예를 들어, EPUB 3.0.1 또는 EPUB 3.1) 규격으로 생성된 파일의 구조와 구성 태그 요소 및 리소스를 분석하여 DAISY 포맷에 맞게 변환하기 위한 방법이 개시된다.
도 2를 참조하면, 입력된 EPUB 포맷 파일에 대한 구조적 검증 및 유효성 판단이 수행될 수 있다(단계 S200).
EPUB 포맷 파일에 대한 구조적 검증 및 유효성 판단 단계에서는 EPUB 포맷 파일에 대한 구조적 검증 및 유효성 판단이 수행될 수 있다. EPUB 포맷 파일에 대한 구조적 검증 및 유효성 판단이 실패한 경우, 문제를 가진 파일에 대한 변환 취소 처리가 이루어질 수 있다. EPUB 포맷 파일에 대한 구조적 검증 및 유효성 판단이 성공한 경우, 다음으로 XML 스키마 파싱 단계가 수행될 수 있다.
EPUB 파일에 대한 XML(extensible markup language) 스키마(schema) 파싱이 수행될 수 있다(단계 S210).
XML 스키마 파싱 단계에서는 EPUB 파일에 대한 구조적 위계 파악, 메타데이터 분석, XHTML(Extensible Hypertext Markup Language) 목차 및 페이지 정보에 따른 구성 요소 분석이 수행될 수 있다. XHTML 목차 및 페이지 정보에 따른 구성 요소 분석은 페이지 구성요소 분석, 부/장/절 및 본문 관계, 이미지 및 표 요소, 각주 및 미주 요소 등에 대한 분석을 포함할 수 있다.
스키마 컨버팅이 수행될 수 있다(단계 S220).
스키마 컨버팅은 EPUB 파일 포맷을 DAISY 파일 포맷으로 변환하는 절차일 수 있다. 스키마 컨버팅 절차는 구체적으로 후술된다.
구성 요소(element)의 재정의 및 재배열 절차가 수행될 수 있다(단계 S230).
분석된 EPUB 구조 및 변환할 DAISY 구조에 따라 콘텐츠의 재정의 및 재배열 절차가 수행될 수 있다.
SMIL 목록이 생성될 수 있다(단계 S240).
SMIL 목록은 재정의 및 재배열 절차를 통해 생성된 DAISY 파일 포맷에 대한 분석을 통해 생성된 음성 정보를 포함할 수 있다.
DAISY 파일 포맷의 유효화가 수행될 수 있다(단계 S250).
DAISY 파일 포맷의 유효화는 DAISY 파일의 구조적 유효성에 대한 점검을 포함할 수 있다.
이하, 각 단계의 구체적인 방법이 개시된다.
도 3은 본 발명의 실시예에 따른 EPUB 포맷 파일에 대한 유효성 판단 절차를 나타낸 개념도이다.
도 3에서는 EPUB 포맷 파일에 대한 구조적 검증 및 유효성 판단을 위한 절차가 개시된다.
도 3을 참조하면, EPUB 포맷 파일은 META-INF(310), OEBPS(320), mimetype(330)을 포함할 수 있다.
META-INF(310)는 container.xml 파일을 포함할 수 있다. 이 파일은 뷰어가 EPUB파일을 열 때 다른 파일들이 어디에 있는지 위치를 알려주는 역할을 할 수 있다. 또한, META-INF(310)는 metadata, manifest, rights, signatures 등 다양한 메타 정보 파일을 포함할 수 있다.
OEBPS(320)는EPUB 파일의 루트(Root) 폴더 역할을 할 수 있다. 루트 폴더란 컴퓨터에서 최상위 폴더를 의미하고 콘텐츠 파일은 루트 폴더 내에 존재해야 하기 때문에 콘텐츠 편집에 필요한 모든 파일은 OEBPS(320) 내에 위치할 수 있다.
예를 들어, OEBPS(320)는 content.opf 파일을 포함할 수 있다. content.opf 파일은 컨텐츠를 패키징하기 위한 정보들을 담고 있다. E-북은 여러 개의 XHTML 문서들과 이들 문서의 순서를 담고 있는 목차, 이미지, CSS 파일들을 포함할 수 있다. content.opf 파일은 위와 같은 정보가 어떻게 패키징 되었는지에 대한 정보를 담고 있다. 또한, content.opf 파일은 E-북에 대한 메타 정보를 담고 있는데, 메타 정보는 타이틀, 언어정보, 저자, 출판사, book id등의 정보를 포함한다. OEBPS(320)는 toc.ncx 파일을 포함할 수 있다. toc.ncx 파일은 책의 목차와 각 목차가 가리키는 파일에 대한 정보를 포함할 수 있다.
mimetype(330)은 이 파일이 EPUB 파일임을 알려주기 위한 식별자의 역할을 할 수 있다.
EPUB 포맷 파일에 대한 구조적 검증 및 유효성 판단을 위한 절차에서는 이러한 EPUB 포맷 파일을 구성하는 하위 정보들이 구조적으로 잘 위치하였는지 하위 정보들이 유효한지 여부에 대한 판단이 수행될 수 있다.
도 4는 본 발명의 실시예에 따른 스키마 파싱 단계를 나타낸 개념도이다.
도 4에서는 스키마 컨버팅 단계 전에 수행되는 스키마 파싱 단계에서 수행되는 절차가 구체적으로 개시된다.
도 4를 참조하면, 전술한 바와 같이 스키마 파싱 단계에서는 전자책 EPUB에 대한 구조적 위계 파악, 메타데이터 분석, XTML 목차 및 페이지 정보에 따른 구성 요소 분석이 수행될 수 있다.
스키마 컨버팅을 위해 코어 문서 파서(core document parser)에 의한 EPUB 파일 분해가 수행될 수 있다(단계 S400).
코어 문서 파서는 EPUB 파일을 구성하는 구성 요소(EPUB)인 XHTML, CSS(cascading style sheets), meta 등에 대한 분해를 수행할 수 있다.
웰 포메이션 신택스 체커(well formation syntax checker)에 의해 분해된 구성 요소(EPUB)에 대한 점검이 수행될 수 있다(단계 S410).
웰 포메이션 신택스 체커는 XHTML 문법에 맞게 정렬된 구성 요소(EPUB)에 대한 점검을 수행할 수 있다.
어트리뷰트 체킹(attribute checking)은 구성 요소(EPUB) 별 속성에 대한 점검을 수행할 수 있다(단계 S420).
어트리뷰트 체킹을 통해 웰 포메이션 신택스 체커에 의해 점검된 구성 요소(EPUB)의 속성에 대한 점검이 수행될 수 있다.
네임스페이스 변환(namespace transformation)이 수행될 수 있다(단계 S430).
네임스페이스 변환은 구성 요소(EPUB)들이 필수 참조하는 네임스페이스의 변환일 수 있다.
데이터타입 유효화(datatype validating)가 수행될 수 있다(단계 S440).
데이터타입 유효화는 구성 요소(EPUB) 및 구성 요소(EPUB)의 속성 별로 데이터에 대한 타당성을 점검하기 위해 수행될 수 있다.
계층적 구조 체커(hierarchical structure checker)에 의한 구성 요소 계층화가 수행될 수 있다(단계 S450).
계층적 구조 체커는 구성 요소(EPUB)에 대한 계층화를 수행할 수 있고, 타당성이 확보된 구성 요소(EPUB)의 계층도(또는 위계도)를 생성할 수 있다.
크로스-레퍼런스 유효화(cross-reference validating)가 수행될 수 있다(단계 S460).
크로스-레퍼런스 유효화는 XHTML 내부 및 외부 style sheet 상호 참조 타당성을 점검하고 유효화하기 위한 절차일 수 있다.
트리 빌딩(tree building)이 수행될 수 있다(단계 S470).
트리 빌딩은 내부 구조 및 연결된 외부 구조에 대한 혼합 트리를 생성하기 위한 절차일 수 있다.
시멘틱 체커(semantic checker)에 의한 체킹 절차가 수행될 수 있다(단계 S480).
시멘틱 체커는 함수적 종속성, XML key와 keyref 제약 조건 등의 문서 의미에 대한 점검을 수행할 수 있다.
문서 유효화(document validation)이 수행될 수 있다(단계 S490).
문서 유효화는 문서 타당성 점검을 수행하고, 변환 준비를 완료하는 절차일 수 있다.
도 5는 본 발명의 실시예에 따른 스키마 컨버팅 단계를 나타내는 개념도이다.
도 5에서는 스키마 파싱 단계에서 파싱된 EPUB 파일의 구성 요소(EPUB)를 DAISY 구조로 변환하기 위한 방법이 개시된다.
도 5를 참조하면, 코어 문서 빌딩(core document building)이 수행된다(단계 S500)
코어 문서 빌딩을 통해 DAISY의 구성 요소(DAISY)인 XML, CSS, meta 등의 기본 구조에 대한 준비가 수행될 수 있다.
웰 포메이션 신택스 마킹(well formation syntax marking)이 수행될 수 있다(단계 S510).
웰 포메이션 신택스 마커가 daisy Xml 문법에 맞게 정렬된 구성 요소(DAISY)에 대한 정의를 수행할 수 있다.
엔터티 레졸루션(entity resolution)에 의한 구성 요소(DAISY) 간의 릴레이션이 수행될 수 있다(단계 S520).
엔터티 레졸루션은 구성 요소(DAISY) 간의 릴레이션(또는 연결)을 수행하기 위해 구현될 수 있다.
어트리뷰트 메이킹(attribute making)이 수행될 수 있다(단계 S530).
어트리뷰트 메이커(attribute maker)는 릴레이션된 구성 요소(DAISY)의 속성에 대한 정의를 생성할 수 있다.
데이터타입 정의(data type definition)가 수행될 수 있다(단계 S540).
데이터타입 정의는 구성 요소(DAISY) 및 구성 요소(DAISY)의 속성 전체 집합에 대한 정의일 수 있다.
계층 구조가 생성될 수 있다(단계 S550).
계층 구조 메이커(hierarchical structure maker)에 의해 타당성이 확보된 구성 요소에 대한 계층 구조를 생성할 수 있다.
크로스-레퍼런스 정의(cross-reference definition)가 수행될 수 있다(단계S560).
크로스-레퍼런스 정의는 XML 내부 및 외부에 대한 상호 참조 타당성에 대한 확보가 가능하게 수행될 수 있다.
트리 빌딩이 수행될 수 있다(단계 S570).
트리 빌딩을 통해 내부 구조 및 연결된 외부 구조의 혼합 트리가 완성될 수 있다.
도 6은 본 발명의 실시예에 따른 구성 요소 재정의 및 배열 단계를 나타낸 개념도이다.
도 6에서는 XSLT 프로세서가 분석된 EPUB 구조 및 변환할 DAISY 구조에 따라 콘텐츠를 변환하기 위한 방법이 개시된다.
도 6을 참조하면, 전술한 단계를 통해 파싱된 EPUB 파일의 구성 요소(EPUB) 및 EPUB 파일의 구성 요소(EPUB)(620)를 기반으로 생성된 구성 요소(DAISY)(640)를 기반으로 XSLT 프로세서(600)가 매핑 룰을 기준으로 매핑 절차를 수행할 수 있다.
구성 요소(EPUB)(620)와 구성 요소(DAISY)(640)에 대한 매핑 룰은 아래의 표 1과 같이 정의될 수 있다.
구분 EPUB DAISY
페이지번호 <span class="__daisy_pagenum" epub:type="pagebreak" title="1" id="page1">1</span> <pagenum id="dtb10" page="normal" smilref="dtbook.smil#tcp10">1</pagenum>
제목 h1-h6 level1-level6h1-h6
본문 <p>내용</p>pre, code, blockquote, article, aside, div, span, strong, em, u, del, 태그 사용 <p>내용</p>
문단 태그 외 사용하는 태그 유지
이미지 <figure><p>[그림]제목</p>
<img role="img" alt="대체텍스트" src=".. | Images | map1.jpg" aria-describedby="ID 번호" | >
<figcaption id="ID 번호"> 설명내용[그림 끝]
</figcation>
</figure>
<imggroup>
<p>[그림]제목</p>
<img alt="대체텍스트" src="map1.jpg" | >
<caption> 설명내용[그림 끝]</cation>
</imggroup>
<table id="lot1"><caption>[표]제목</caption>
<tbody>
<th><th>
<tr>
<td>내용</td>
<td>내용</td>
</tr>
</tbody>
<table id="lot1" border="1">
<caption>[표]제목</caption>
<tbody>
<th>&#160;<th>
<tr>
<td>내용</td>
<td>내용</td>
</tr>
</tbody>
주석 주석번호: role="doc-noteref"주석내용: role=" doc-endnote" 또는 role=" doc-footnote" 주석번호 태그: noteref
주석내용 태그: note
목록 ul | ol list type="ul" | list type="ol"
위와 같이 페이지 번호, 제목, 본문, 이미지, 표, 주석, 목록 등에 대해서 EPUB의 구성 요소(EPUB)(620)와 DAISY의 구성 요소(DAISY)(640) 간의 변환이 수행될 수 있다.
아래의 표 2는 두 규격의 매핑해야 하는 72개 액세서빌리티 구성요소 태그용 매핑룰을 포함할 수 있다.
DAISY EPUB 설명
1 annoref,
noteref
A Link 요소는 현재 문서와 외부 리소스와의 관계를 명시하며, a 태그는 링크 시작점 지시
2 book body 문서의 내용
3 h1~h6 h1 ~ h6 6단계의 문서 제목
4 imggroup figure 이미지 독립적인 콘텐츠를 표현. 설명(figcaption) 과 함께 사용
5 level section 문서의 일반적인 구획 즉, 전형적으로 제목을 가지고 있는 콘텐츠의 주제 그룹
6 list ol, ul 리스트 목록은 순서가 의미없는 목록 및 순서가 의미있는 목록으로 구분하여 정의
7 acronym abbr epub:type="acronym" 약자 표시 요소
8 annotation aside epub:type="annotation" 주석 처리 요소
9 note aside epub:type="note" 노트 처리 요소
10 pagenum span epub:type="pagebreak" 페이지 구분자 요소
11 sidebar aside epub:type="sidebar" 사이드바 요소
12 author span epub:type="z3998:author" 전체 도서의 저자 요소
13 covertitle h1 epub:type="z3998:covertitle" 책제목 요소
14 docauthor p epub:type="z3998:author" 도서 내 각 chapter별 저자 요소
15 byline span class="byline" 작업자, contributor 요소
16 dateline span class="dateline" 날짜 요소
17 lic span class="lic" 목록 li 항목의 순서 있는 서브구조 요소
18 line span class="line" 도서 구조적 한 행 요소
19 linegroup section/div class="linegroup" 행의 그룹 요소
20 linenum span class="linenum" 행 번호 요소
21 Title strong class="title" 도서의 부문별 제목 요소
22 Prodnote aside epub:type="z3998:production" 제작자가 대체 형식 버전에 추가 한 언어 요소
23 Sent span epub:type="z3998:sentence" Sentence 요소
기타 49개(=72-23)
위와 같은 매핑 룰을 사용하여 파싱된 EPUB 파일의 구성 요소(EPUB)(620) 및 EPUB 파일의 구성 요소(EPUB)(620)를 기반으로 생성된 구성 요소(DAISY)(640)를 기반으로 XSLT 프로세서(600)가 매핑 룰을 기준으로 매핑 절차를 수행할 수 있다.
본 발명의 실시예에 따르면, 매핑 룰을 기반으로 매핑 절차를 수행시 매핑되지 않는 항목에 대한 추가적인 항목 매핑 작업이 수행될 수 있다. 구체적으로 구성 요소(EPUB) 중 매핑 룰을 기반으로 매핑되지 않는 매핑 불가 항목이 추출되고, 매핑 불가 항목을 위한 별도의 추가 매핑 룰이 정의될 수 있다. 추가 매핑 룰은 매핑 불가 구성 요소(EPUB)를 기준으로 정의될 수 있다.
매핑 불가 구성 요소(EPUB)는 1차적으로 이미 매핑된 구성 요소(EPUB)인 매핑 가능 구성 요소(EPUB)와의 비교를 통해 1차 유사도를 결정할 수 있다.
1차 유사도는 매핑 불가 구성 요소(EPUB)에 해당하는 항목의 변화로 인한 EPUB 포맷 파일 기반의 출력물의 제1 변화와 매핑 가능 구성 요소(EPUB)에 해당하는 항목의 변화로 인한 EPUB 포맷 파일 기반의 출력물의 제2 변화 간의 차이를 고려하여 결정될 수 있다. 제1 변화와 제2 변화에 대한 정보는 출력물에 대한 결과물 간의 비교를 통해 결정될 수 있다. 제1 변화와 제2 변화가 상대적으로 유사할수록 상대적으로 높은 1차 유사도를 가지는 것으로 정의될 수 있다.
매핑 불가 구성 요소(EPUB)는 2차적으로 이미 매핑된 구성 요소(DAISY)인 매핑 가능 구성 요소(DAISY)와의 비교를 통해 2차 유사도를 결정할 수 있다.
2차 유사도는 매핑 불가 구성 요소(EPUB)에 해당하는 항목의 변화로 인한 EPUB 포맷 파일 기반의 출력물의 제1 변화와 매핑 가능 구성 요소(DAISY)에 해당하는 항목의 변화로 인한 DAISY 포맷 파일 기반의 출력물의 제3 변화 간의 차이를 고려하여 결정될 수 있다. 제1 변화와 제3 변화에 대한 정보는 출력물에 대한 결과물 간의 비교를 통해 결정될 수 있다. 제1 변화와 제3 변화가 상대적으로 유사할수록 상대적으로 높은 2차 유사도를 가지는 것으로 정의될 수 있다.
1차 유사도와 2차 유사도를 고려하여 매핑 불가 구성 요소(EPUB)는 후보 매핑 가능 구성 요소(EPUB)와 후보 매핑 가능 구성 요소(DAISY)를 결정할 수 있다.
이러한 후보 매핑 가능 구성 요소(EPUB)와 후보 매핑 가능 구성 요소(DAISY)를 기반으로 매핑 불가 구성 요소(EPUB)를 처리한 결과를 사용자에게 제공하고, 사용자는 결과를 기반으로 매핑 불가 구성 요소(EPUB)에 대한 후보 매핑 가능 구성 요소(EPUB)와 후보 매핑 가능 구성 요소(DAISY)에 대한 최종 결정을 수행할 수 있다.
후보 매핑 가능 구성 요소(EPUB)만을 고려한 출력물, 후보 매핑 가능 구성 요소(DAISY)만을 고려한 출력물, 후보 매핑 가능 구성 요소(EPUB)와 후보 매핑 가능 구성 요소(DAISY)를 모두 고려한 출력물에 대한 제공을 통해 사용자가 선택을 수행할 수 있고, 후보 매핑 가능 구성 요소(EPUB)와 후보 매핑 가능 구성 요소(DAISY)가 기존의 매핑 룰을 기반으로 한 매핑 관계에 있을 경우, 후보 매핑 가능 구성 요소(EPUB)와 후보 매핑 가능 구성 요소(DAISY)를 모두 고려한 하나의 출력물만이 사용자 장치로 제공될 수도 있다.
도 7은 본 발명의 실시예에 따른 SMIL 생성 방법을 나타낸 개념도이다.
도 7에서는 최종 DAISY 파일을 분석하여 SMIL 목록을 생성하기 위한 방법이 개시된다.
도 7을 참조하면, SMIL 목록은 텍스트 정보를 음성 정보로서 변환하기 위한 것으로써 텍스트 정보와 음성 정보 간의 변환을 위한 SMIL 목록이 생성될 수 있다.
도7에 개시된 방식으로 변환된 매핑을 마친 구성 요소(DAISY)에 대하여 SMIL 목록이 생성되고, SMIL 목록을 기반으로 추후 음성 변환이 수행될 수 있다.
본 발명의 실시예에 따르면 구성 요소(DAISY) 중 SMIL 목록이 생성되지 않는 부분에 대한 추출이 수행될 수 있다. 표와 같은 항목의 경우, 텍스트로 변환한 후 음성 변환이 수행되는 경우에도 시각 장애인의 입장에서는 이해가 어려운 부분이 존재할 수 있다. 따라서, 음성 변환을 위한 SMIL 목록은 이를 고려하여 텍스트 정보와 음성 정보 간의 변환을 위해 생성될 수 있다.
선택적으로 온전한 텍스트가 아닌 표, 그림 등과 같은 비텍스트 영역에 대하여 시각 장애인에게 제공시 이해가 가능한지 여부에 대한 판단을 위한 비텍스트 영역 이해 가능도와 비텍스트 영역이 전체 콘텐츠에서 가지는 중요도인 비텍스트 영역 중요도에 대한 판단이 수행될 수 있다.
비텍스트 영역 이해 가능도는 텍스트 해석 가능 스코어와 전체 이해 가능 스코어를 기반으로 결정될 수 있다.
텍스트 해석 가능 스코어는 이미지에 대한 텍스트적인 표현이 가능한 정도로서 이는 이미지 분류 정보 및 이미지에 포함된 객체 해석 정보를 기반으로 결정될 수 있다.
이미지 분류는 이미지가 사진인지, 그림인지 여부, 그림인 경우, 그림에 포함된 화풍에 대한 분류로서 기존에 학습된 인공지능 엔진을 기반으로 수행될 수 있다. 객체 해석 가능 정보는 그림/사진에 포함된 객체의 존재 및 객체의 인식 및 해석이 가능한 범위를 고려하여 결정될 수 있다.
전체 이해 가능 스코어는 해석을 수행시 사용자가 해석된 결과를 기반으로 이미지에 대한 인식 및 이해가 얼마나 가능할지를 측정하는 스코어로서 기존의 사용자(예를 들어, 시각장애인)의 인식 결과를 기반으로 결정될 수 있다. 비텍스트 영역이 단순한 그림일 경우 전체 해석 가능 스코어가 상대적으로 높을 수 있고, 비텍스트 영역이 복잡한 표인 경우, 전체 해석 가능 스코어가 상대적으로 낮을 수 있다. 이러한 사용자 피드백 결과를 기반으로 해당 이미지의 전체 해석 가능 스코어가 결정될 수 있다.
비텍스트 영역 중요도는 비텍스트 영역이 전체 컨텐츠에서 차지하는 중요도에 관한 것으로서 비텍스트 영역과 관련된 텍스트 영역을 기준으로 결정될 수 있다. 비텍스트 영역과 관련도가 높은 텍스트 영역이 상대적으로 많아질수록 비텍스트 영역 중요도는 상대적으로 높아질 수 있다. 관련도는 비텍스트 영역에 대한 언급을 한 텍스트에 대한 탐색을 기준으로 결정될 수 있다. 예를 들어, 비텍스트 영역을 텍스트화한 정보와 텍스트 영역 간의 단어의 중첩 횟수를 기반으로 비텍스트 영역 중요도가 결정될 수 있다.
텍스트 해석 가능 스코어와 전체 이해 가능 스코어를 기반으로 결정된 비텍스트 영역 이해 가능도 및 비텍스트 영역 중요도에 대한 정보를 기반으로 비텍스트 영역에 대한 스킵 가능 여부가 결정될 수 있고, 시각 장애인이 미리 비텍스트 영역을 제공받을지를 결정할 수 있다.
도 8은 본 발명의 실시예에 따른 DAISY 유효화(validation) 과정을 나타낸 개념도이다.
도 8에서는 DAISY에 대한 유효화를 검토하기 위한 방법이 개시된다.
도 8을 참조하면, DAISY 포맷으로 변경된 페이지 각각에 대한 검토가 수행될 수 있다.
예를 들어, 표와 같은 경우, 시각장애인들이 확인할 수 없기 때문에 표에 대한 텍스트 변환이 이루어질 수 있는데 이러한 표에 대한 텍스트 변환이 되었는지 여부에 대한 판단이 수행될 수 있다.
DAISY 포맷으로 변경된 페이지 각각에 대해 표준 규격에 맞게 구조화되었는지에 대한 점검이 수행될 수 있다.
예를 들어 오픈 이북(Open E-Book)에 대한 패키지 아이덴터티(package identity)에 대한 확인, 퍼블리케이션 메타데이터(제목, 저자, 퍼블리셔 등)에 대한 확인, 매니패스트(manifest)(파일 리스트(문서, 이미지, 스타일 시트 등))에 대한 확인, 스파인(spine)(문서 정렬 상태)에 대한 확인 등이 수행될 수 있다.
이상 설명된 본 발명에 따른 실시예는 다양한 컴퓨터 구성요소를 통하여 실행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위하여 하나 이상의 소프트웨어 모듈로 변경될 수 있으며, 그 역도 마찬가지이다.
이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항과 한정된 실시예 및 도면에 의하여 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위하여 제공된 것일 뿐, 본 발명이 상기 실시예에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정과 변경을 꾀할 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 또는 이로부터 등가적으로 변경된 모든 범위는 본 발명의 사상의 범주에 속한다고 할 것이다.

Claims (6)

  1. 전자책 변환 방법은,
    입력부가 EPUB(Electric Publications) 포맷 파일을 수신하고, 수신한 상기 EPUB 포맷 파일에 대한 유효성을 검정하는 단계;
    변환부가 상기 EPUB 포맷 파일을 DAISY(Digital Accessible Information System) 포맷 파일로 변환하는 단계; 및
    출력부가 상기 DAISY 포맷 파일을 출력하는 단계를 포함하되,
    상기 변환부는 스키마 파싱 및 스키마 컨버팅 및 구성 요소 재정의 및 배열을 수행하고,
    상기 스키마 파싱은 상기 EPUB 포맷 파일에 대한 구조적 위계 파악, 메타데이터 분석, XHTML(Extensible Hypertext Markup Language) 목차 및 페이지 정보에 따른 구성 요소 분석을 포함하고,
    상기 스키마 컨버팅은 상기 스키마 파싱된 상기 EPUB 포맷 파일의 구성 요소(EPUB)를 상기 DAISY 포맷 파일의 구성 요소(DAISY)로 변환하고,
    상기 구성 요소 재정의 및 배열은 상기 스키마 파싱 및 상기 스키마 컨버팅을 기반으로 생성된 상기 EPUB 포맷 파일의 구성 요소(EPUB) 및 상기 구성 요소(EPUB)를 기반으로 생성된 구성 요소(DAISY)를 기반으로 한 매핑 룰을 기준으로 한 매핑 절차를 포함하고,
    상기 구성 요소 재정의 및 배열은 매핑 불가 항목을 위한 별도의 추가 매핑 룰을 기반으로 추가 매핑을 수행하고,
    상기 추가 매핑 룰은 매핑 불가 구성 요소(EPUB)를 기준으로 정의되고,
    상기 추가 매핑 룰은 상기 매핑 불가 구성 요소(EPUB)과 이미 매핑된 구성 요소(EPUB)인 매핑 가능 구성 요소(EPUB) 및 이미 매핑된 구성 요소(DAISY)인 매핑 가능 구성 요소(DAISY)를 기반으로 정의되고,
    상기 추가 매핑 룰은 상기 매핑 불가 구성 요소(EPUB)와 상기 매핑 가능 구성 요소(EPUB)를 기반으로 결정된 1차 유사도 및 상기 매핑 불가 구성 요소(EPUB)와 상기 매핑 가능 구성 요소(DAISY)를 기반으로 결정된 2차 유사도를 기반으로 결정되는 것을 특징을 하는 방법.
  2. 제1항에 있어서,
    상기 1차 유사도는 상기 매핑 불가 구성 요소(EPUB)에 해당하는 항목의 변화로 인한 EPUB 포맷 파일 기반의 출력물의 제1 변화와 상기 매핑 가능 구성 요소(EPUB)에 해당하는 항목의 변화로 인한 상기 EPUB 포맷 파일 기반의 출력물의 제2 변화 간의 차이를 기반으로 결정되고,
    상기 2차 유사도는 상기 매핑 불가 구성 요소(EPUB)에 해당하는 항목의 변화로 인한 상기 EPUB 포맷 파일 기반의 출력물의 상기 제1 변화와 매핑 가능 구성 요소(DAISY)에 해당하는 항목의 변화로 인한 DAISY 포맷 파일 기반의 출력물의 제3 변화 간의 차이를 기반으로 결정되고,
    상기 1차 유사도와 상기 2차 유사도를 고려하여 상기 매핑 불가 구성 요소(EPUB)의 후보 매핑 가능 구성 요소(EPUB)와 후보 매핑 가능 구성 요소(DAISY)가 결정되는 것을 특징으로 하는 방법.
  3. 제2항에 있어서,
    상기 변환부는 SMIL(synchronized multimedia integration language) 목록의 생성 및 DAISY 포맷으로 변경된 페이지 각각에 대한 검토를 수행하는 상기 DAISY 포맷 파일의 유효화를 수행하고,
    상기 SMIL 목록은 텍스트 정보를 음성 정보로서 변환하기 위한 목록이고,
    상기 DAISY 포맷 파일의 유효화는 오픈 이북(Open E-Book)에 대한 패키지 아이덴터티(package identity)에 대한 확인, 퍼블리케이션 메타데이터에 대한 확인, 매니패스트(manifest)에 대한 확인 또는 스파인(spine)에 대한 확인을 포함하고,
    상기 SMIL 목록을 기반으로 한 음성 변환은 비텍스트 영역 이해 가능도와 비텍스트 영역이 전체 콘텐츠에서 가지는 중요도인 비텍스트 영역 중요도에 대한 판단을 기반으로 수행되고,
    상기 비텍스트 영역 이해 가능도는 텍스트 해석 가능 스코어와 전체 이해 가능 스코어를 기반으로 결정되고,
    상기 텍스트 해석 가능 스코어는 이미지에 대한 텍스트적인 표현이 가능한 정도로서 이미지 분류 정보 및 이미지에 포함된 객체 해석 정보를 기반으로 결정되고,
    상기 전체 이해 가능 스코어는 사용자가 해석된 결과를 기반으로 이미지에 대한 인식 및 이해가 얼마나 가능할지를 측정하는 스코어로서 기존의 사용자의 인식 결과를 기반으로 결정되는 것을 특징으로 하는 방법.
  4. 전자책 변환을 수행하는 전자책 변환 장치에 있어서,
    상기 전자책 변환 장치는 입력부, 변환부 및 출력부를 포함하고,
    상기 입력부는 EPUB(Electric Publications) 포맷 파일을 수신하고, 수신한 상기 EPUB 포맷 파일에 대한 유효성을 검정하도록 구현되고,
    상기 변환부가 상기 EPUB 포맷 파일을 DAISY(Digital Accessible Information System) 포맷 파일로 변환하도록 구현되고,
    상기 출력부는 상기 DAISY 포맷 파일을 출력하도록 구현되되,
    상기 변환부는 스키마 파싱 및 스키마 컨버팅 및 구성 요소 재정의 및 배열을 수행하고,
    상기 스키마 파싱은 상기 EPUB 포맷 파일에 대한 구조적 위계 파악, 메타데이터 분석, XHTML(Extensible Hypertext Markup Language) 목차 및 페이지 정보에 따른 구성 요소 분석을 포함하고,
    상기 스키마 컨버팅은 상기 스키마 파싱된 상기 EPUB 포맷 파일의 구성 요소(EPUB)를 상기 DAISY 포맷 파일의 구성 요소(DAISY)로 변환하고,
    상기 구성 요소 재정의 및 배열은 상기 스키마 파싱 및 상기 스키마 컨버팅을 기반으로 생성된 상기 EPUB 포맷 파일의 구성 요소(EPUB) 및 상기 구성 요소(EPUB)를 기반으로 생성된 구성 요소(DAISY)를 기반으로 한 매핑 룰을 기준으로 한 매핑 절차를 포함하고,
    상기 구성 요소 재정의 및 배열은 매핑 불가 항목을 위한 별도의 추가 매핑 룰을 기반으로 추가 매핑을 수행하고,
    상기 추가 매핑 룰은 매핑 불가 구성 요소(EPUB)를 기준으로 정의되고,
    상기 추가 매핑 룰은 상기 매핑 불가 구성 요소(EPUB)과 이미 매핑된 구성 요소(EPUB)인 매핑 가능 구성 요소(EPUB) 및 이미 매핑된 구성 요소(DAISY)인 매핑 가능 구성 요소(DAISY)를 기반으로 정의되고,
    상기 추가 매핑 룰은 상기 매핑 불가 구성 요소(EPUB)와 상기 매핑 가능 구성 요소(EPUB)를 기반으로 결정된 1차 유사도 및 상기 매핑 불가 구성 요소(EPUB)와 상기 매핑 가능 구성 요소(DAISY)를 기반으로 결정된 2차 유사도를 기반으로 결정되는 것을 특징을 하는 전자책 변환 장치.
  5. 제4항에 있어서,
    상기 1차 유사도는 상기 매핑 불가 구성 요소(EPUB)에 해당하는 항목의 변화로 인한 EPUB 포맷 파일 기반의 출력물의 제1 변화와 상기 매핑 가능 구성 요소(EPUB)에 해당하는 항목의 변화로 인한 상기 EPUB 포맷 파일 기반의 출력물의 제2 변화 간의 차이를 기반으로 결정되고,
    상기 2차 유사도는 상기 매핑 불가 구성 요소(EPUB)에 해당하는 항목의 변화로 인한 상기 EPUB 포맷 파일 기반의 출력물의 상기 제1 변화와 매핑 가능 구성 요소(DAISY)에 해당하는 항목의 변화로 인한 DAISY 포맷 파일 기반의 출력물의 제3 변화 간의 차이를 기반으로 결정되고,
    상기 1차 유사도와 상기 2차 유사도를 고려하여 상기 매핑 불가 구성 요소(EPUB)의 후보 매핑 가능 구성 요소(EPUB)와 후보 매핑 가능 구성 요소(DAISY)가 결정되는 것을 특징으로 하는 전자책 변환 장치.
  6. 제5항에 있어서,
    상기 변환부는 SMIL(synchronized multimedia integration language) 목록의 생성 및 DAISY 포맷으로 변경된 페이지 각각에 대한 검토를 수행하는 상기 DAISY 포맷 파일의 유효화를 수행하도록 구현되고,
    상기 SMIL 목록은 텍스트 정보를 음성 정보로서 변환하기 위한 목록이고,
    상기 DAISY 포맷 파일의 유효화는 오픈 이북(Open E-Book)에 대한 패키지 아이덴터티(package identity)에 대한 확인, 퍼블리케이션 메타데이터에 대한 확인, 매니패스트(manifest)에 대한 확인 또는 스파인(spine)에 대한 확인을 포함하고,
    상기 SMIL 목록을 기반으로 한 음성 변환은 비텍스트 영역 이해 가능도와 비텍스트 영역이 전체 콘텐츠에서 가지는 중요도인 비텍스트 영역 중요도에 대한 판단을 기반으로 수행되고,
    상기 비텍스트 영역 이해 가능도는 텍스트 해석 가능 스코어와 전체 이해 가능 스코어를 기반으로 결정되고,
    상기 텍스트 해석 가능 스코어는 이미지에 대한 텍스트적인 표현이 가능한 정도로서 이미지 분류 정보 및 이미지에 포함된 객체 해석 정보를 기반으로 결정되고,
    상기 전체 이해 가능 스코어는 사용자가 해석된 결과를 기반으로 이미지에 대한 인식 및 이해가 얼마나 가능할지를 측정하는 스코어로서 기존의 사용자의 인식 결과를 기반으로 결정되는 것을 특징으로 하는 전자책 변환 장치.
KR1020190114390A 2019-09-17 2019-09-17 전자책 변환 방법 및 이러한 방법을 수행하는 장치 KR102075874B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190114390A KR102075874B1 (ko) 2019-09-17 2019-09-17 전자책 변환 방법 및 이러한 방법을 수행하는 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190114390A KR102075874B1 (ko) 2019-09-17 2019-09-17 전자책 변환 방법 및 이러한 방법을 수행하는 장치

Publications (1)

Publication Number Publication Date
KR102075874B1 true KR102075874B1 (ko) 2020-03-17

Family

ID=70003947

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190114390A KR102075874B1 (ko) 2019-09-17 2019-09-17 전자책 변환 방법 및 이러한 방법을 수행하는 장치

Country Status (1)

Country Link
KR (1) KR102075874B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090110108A (ko) * 2008-04-17 2009-10-21 (주)토모텍 데이지 플레이어의 파싱 장치 및 그 방법
KR20110026286A (ko) * 2009-09-07 2011-03-15 주식회사 인큐브테크 표준화된 전자책 생성장치 및 방법
KR20120025960A (ko) * 2011-03-22 2012-03-16 주식회사 오티앤씨 커뮤니티 북 콘텐츠 서비스 제공 시스템
US20180276717A1 (en) * 2015-09-25 2018-09-27 Bookgrabbr, Inc. Automated generation of content-limited previews for electronic media in a sharing platform

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090110108A (ko) * 2008-04-17 2009-10-21 (주)토모텍 데이지 플레이어의 파싱 장치 및 그 방법
KR20110026286A (ko) * 2009-09-07 2011-03-15 주식회사 인큐브테크 표준화된 전자책 생성장치 및 방법
KR20120025960A (ko) * 2011-03-22 2012-03-16 주식회사 오티앤씨 커뮤니티 북 콘텐츠 서비스 제공 시스템
US20180276717A1 (en) * 2015-09-25 2018-09-27 Bookgrabbr, Inc. Automated generation of content-limited previews for electronic media in a sharing platform

Similar Documents

Publication Publication Date Title
CN101361063B (zh) 支持基于规则的文档内容挖掘的系统与方法
Travis et al. The SGML implementation guide: a blueprint for SGML migration
US9690770B2 (en) Analysis of documents using rules
US7886225B2 (en) Method and apparatus for the creation, location and formatting of digital content
Lewis et al. Developing ODIN: A multilingual repository of annotated language data for hundreds of the world's languages
Dekker et al. It’s more than just overlap: Text As Graph
US20070233465A1 (en) Information extracting apparatus, and information extracting method
Haaf et al. The dta “base format”: A tei subset for the compilation of a large reference corpus of printed text from multiple sources
US10042880B1 (en) Automated identification of start-of-reading location for ebooks
US20080091699A1 (en) Method of converting structured data
Stührenberg The TEI and current standards for structuring linguistic data. An overview
Witt et al. On the lossless transformation of single-file, multi-layer annotations into multi-rooted trees
Wilkinson et al. Document computing: technologies for managing electronic document collections
Abolhassani et al. Information extraction and automatic markup for XML documents
KR102075874B1 (ko) 전자책 변환 방법 및 이러한 방법을 수행하는 장치
Changuel et al. A general learning method for automatic title extraction from html pages
Haaf et al. Historical newspapers & journals for the DTA
Dipper et al. Challenges in modelling a richly annotated diachronic corpus of German
Bonch-Osmolovskaya Digital edition of Leo Tolstoy works: contributing to advances in Russian literary scholarship
KR102129705B1 (ko) 장애인 접근성 전자책 변환 방법 및 장치
Hankinson et al. An Interchange Format for Optical Music Recognition Applications.
Filip et al. Internationalization Tag Set (ITS) Version 2.0
Muniz et al. Taming the Tiger Topic: An XCES Compliant Corpus Portal to Generate Subcorpora Based on Automatic Text-Topic Identification
Hockey Making Technology Work for Scholarship: Investing in the Data.
Fan et al. Semantic Annotation of Office Documents

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant