KR20090016214A - System for forming data format of electronic book, and apparatus for converting format applied to the same - Google Patents

System for forming data format of electronic book, and apparatus for converting format applied to the same Download PDF

Info

Publication number
KR20090016214A
KR20090016214A KR1020070080695A KR20070080695A KR20090016214A KR 20090016214 A KR20090016214 A KR 20090016214A KR 1020070080695 A KR1020070080695 A KR 1020070080695A KR 20070080695 A KR20070080695 A KR 20070080695A KR 20090016214 A KR20090016214 A KR 20090016214A
Authority
KR
South Korea
Prior art keywords
data
text
book
format
image
Prior art date
Application number
KR1020070080695A
Other languages
Korean (ko)
Other versions
KR100986886B1 (en
Inventor
유태호
권오인
오지영
양중근
Original Assignee
에스케이 텔레콤주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이 텔레콤주식회사 filed Critical 에스케이 텔레콤주식회사
Priority to KR1020070080695A priority Critical patent/KR100986886B1/en
Publication of KR20090016214A publication Critical patent/KR20090016214A/en
Application granted granted Critical
Publication of KR100986886B1 publication Critical patent/KR100986886B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/154Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Abstract

A system for forming data format of electronic book and an apparatus for converting format applied to the same are provided to form a data format of an electronic book according to an electronic book terminal by performing a format conversion device for supporting multi functions. A document supply server(100) provides source data based on a document. An electronic book server includes an electronic book performed with the source data. An electronic terminal is contacted in the electronic book server, and is implemented by receiving the electronic book. A format conversion device(200) forms a data format of the electronic book corresponding to an electronic book terminal based on the source data, extracts property data from news data, classifies the property data according to the electronic book terminal for displaying an electronic newspaper based on the property data. The format conversion device not only converts the property data into at least one or more intermediate data but also forms the data format of the electronic newspaper by packaging the intermediate data.

Description

전자책을 이루는 데이터 포맷의 형성 시스템 및 이에 적용되는 포맷변환장치{SYSTEM FOR FORMING DATA FORMAT OF ELECTRONIC BOOK, AND APPARATUS FOR CONVERTING FORMAT APPLIED TO THE SAME}SYSTEM FOR FORMING DATA FORMAT OF ELECTRONIC BOOK, AND APPARATUS FOR CONVERTING FORMAT APPLIED TO THE SAME}

본 발명은 전자책의 구현을 위한 기술에 관한 것으로, 전자책 단말의 운용환경에 부합하는 전자책 전용 솔루션을 구현하여 단말 내에서 전자책에 대한 다양한 열람방식, 문서내용 검색, 해당 문서내용에 대한 세션확대 및 해당 문서내용의 스크랩을 포함하는 기능들을 지원하기 위한 전자책을 이루는 데이터 포맷의 형성 시스템 및 이에 적용되는 포맷변환장치에 관한 것이다.The present invention relates to a technology for the implementation of an e-book, by implementing a dedicated e-book solution corresponding to the operating environment of the e-book terminal, the various reading methods for the e-book in the terminal, document content search, for the document content The present invention relates to a system for forming a data format constituting an e-book for supporting functions including session extension and scraping of contents of a document, and a format conversion apparatus applied thereto.

최근에는 정보 인프라 구축, 통신환경개선 등과 함께 인터넷을 사용하는 사람 수는 기하급수적으로 늘고 있으며, 앞으로도 계속하여 증가추세를 유지할 것이다.In recent years, the number of people using the Internet has increased exponentially with the establishment of information infrastructure and communication environment improvement, and it will continue to increase in the future.

이러한 흐름에 맞추어 인터넷을 통하여 다양한 상거래가 가능하게 되고, 정보 제공이 가능해지고 있으며, 이와 같은 네트워크 환경과 더불어 다양한 멀티미디어 기술이 가능해짐에 따라 종이를 이용한 책으로 판매되던 일반 서적 등도 전자책으로 인터넷을 통해 유통되고 있다.In line with this trend, various commercial transactions are made possible through the Internet, and information can be provided. In addition to this network environment, various multimedia technologies are possible, and general books sold as paper books are also used as e-books. Is being distributed through.

전자책(e-Book ; Electronic Book)이란 지식과 정보의 콘텐츠를 종이 매체를 이용하지 않고 디지털(digital) 형태로 출간된 책(file)을 가리키는 것으로, 이와 같은 전자책은 전차책을 읽을 수도 있도록 하는 프로그램이 탑재된 PC나 전용 휴대용 단말기 등을 통해 볼 수 있으며, 이와 같은 장치(device)를 통칭해 전자책으로 칭하기도 한다. 즉, 넓은 의미에서 컨텐츠가 포함된 모든 소프트웨어적, 하드웨어적인 미디어물 전체를 말할 수 있는 것이다.An electronic book (e-Book) refers to a file published in digital form without the use of paper media for the content of knowledge and information. Such an e-book can be used to read tram books. It can be viewed through a PC equipped with a program or a dedicated portable terminal, and such a device is sometimes called an e-book. In other words, it can refer to all software and hardware media including contents in a broad sense.

여기서, 책, 주간지, 광고 및 신문과 같이 다양한 컨텐츠로 구현되는 전자책 중에서 신문으로 구현되는 전자책(이하, '전자신문'이라 함)은 일반적으로 전자신문 제공서버(예를 들면, 신문사 서버)로부터 제공되는 PDF 파일의 형태를 유지한 채 전자책 단말에서 열람 실행되고 있다.Here, an e-book (hereinafter referred to as an “e-newspaper”) that is implemented as a newspaper among e-books implemented with various contents such as books, weekly papers, advertisements, and newspapers is generally an electronic newspaper providing server (for example, a newspaper company server). The reading is performed in the e-book terminal while maintaining the form of the PDF file provided from.

이와 같이, 전자책 단말에서 전자신문의 열람을 위하여 단말 전용의 열람 솔루션이 지원되고 있는 상황이 아니므로 신문사 서버로부터 제공되는 전자신문의 PDF 파일을 전자책 단말에서 그래도 디스플레이함에 따라, 실제의 신문형태로 단말화면에 디스플레이하거나 텍스트 형태로 열람하는 등의 다양한 열람방식을 지원할 수 없을 뿐만 아니라 해당 기사의 검색, 기사별 확대 및 기사 스크랩 등의 다양한 신문보기 기능을 지원할 수가 없는 한계가 있었다.As such, since the reading solution for the terminal is not supported for the reading of the electronic newspaper in the e-book terminal, the PDF file of the e-newspaper provided from the newspaper server is still displayed on the e-book terminal. This could not support various reading methods such as displaying on the terminal screen or reading in text form, and also could not support various newspaper viewing functions such as searching for the article, expanding by article, and scraping the article.

따라서, 본 발명은 상기의 문제점들을 해결하기 위해 창출된 것으로, 본 발명의 목적은 전자책 단말의 운용환경에 부합하는 전자책 전용 솔루션을 구현하여 단말 내에서 전자책에 대한 다양한 열람방식, 문서내용 검색, 해당 문서내용에 대한 세션확대 및 해당 문서내용의 스크랩을 포함하는 기능들을 지원하기 위한 전자책을 이루는 데이터 포맷의 형성 시스템 및 이에 적용되는 포맷변환장치을 제공하는 데 있다.Accordingly, the present invention has been made to solve the above problems, the object of the present invention is to implement an e-book-specific solution corresponding to the operating environment of the e-book terminal, various reading methods for the e-book in the terminal, document content The present invention provides a system for forming a data format constituting an e-book for supporting functions including retrieval, session expansion for a corresponding document content, and scrapping of the corresponding document content, and a format conversion apparatus applied thereto.

상기 목적을 달성하기 위한 본 발명의 제 1 관점에 따른 전자책을 이루는 데이터 포맷의 형성 시스템은, 문서 기반의 소스 데이터를 제공하는 문서공급서버 및 상기 소스 데이터로부터 이미지 데이터, 텍스트 데이터, 상기 텍스트 데이터와 대응하는 좌표정보 및 세션영역 정보 중 적어도 하나 이상의 특성 데이터를 추출하고, 상기 특성 데이터를 토대로 형성되는 전자책을 디스플레이하는 전자책 단말별로 상기 특성 데이터를 분류하여 적어도 하나 이상의 중간 데이터로 변환하며, 상기 적어도 하나 이상의 중간 데이터를 패키징하여 상기 전자책의 데이터 포맷을 형성하기 위한 포맷변환장치를 포함하는 것을 특징으로 한다.According to a first aspect of the present invention, there is provided a system for forming a data format of an e-book, including: a document supply server providing document-based source data and image data, text data, and text data from the source data. Extracting at least one feature data of coordinate information and session area information corresponding to the at least one of the at least one feature, classifying the feature data into at least one intermediate data for each e-book terminal displaying an e-book formed based on the feature data, and And a format conversion device for packaging the at least one intermediate data to form a data format of the e-book.

바람직하게는, 상기 데이터 포맷은 상기 소스 데이터를 판별하기 위한 헤더 정보, 상기 소스 데이터에 포함되는 상기 이미지 데이터를 랜더링 처리로 추출하여 상기 전자책 단말의 디스플레이 사이즈에 대응하기 위한 디더링 처리를 통해 형성 되는 이미지 중간데이터, 상기 텍스트 데이터에 대한 XML 포맷팅을 실행하여 형성되는 텍스트 중간데이터, 상기 텍스트 중간데이터의 폰트크기 조정으로 인하거나, 상기 이미지 중간데이터와 상기 텍스트 중간데이터의 레이아웃 조합으로 인한 텍스트 배치를 기반으로 하여 형성되는 상기 좌표정보의 중간데이터, 상기 세션영역 정보를 토대로 문서 내용을 세션별로 구분하여 상기 전자책 단말의 화면에 디스플레이하기 위한 상기 세션영역 정보의 중간데이터 및 상기 텍스트 중간데이터를 기초로 하여 텍스트 검색을 실행하기 위한 텍스트 검색데이터를 포함하는 것을 특징으로 한다.Preferably, the data format is formed through header information for determining the source data and dithering processing corresponding to the display size of the e-book terminal by extracting the image data included in the source data in a rendering process. Image intermediate data, text intermediate data formed by executing XML formatting on the text data, text size adjustment due to font size adjustment of the text intermediate data, or based on text arrangement due to layout combination of the image intermediate data and the text intermediate data Based on the intermediate data of the coordinate information, the intermediate data of the session area information and the text intermediate data for displaying the document content on a screen of the e-book terminal based on the session area information. text It characterized in that it comprises a text search data for executing a color.

바람직하게는, 상기 이미지 중간데이터는 상기 전자책 단말에서의 디스플레이 사이즈에 대한 선택 변경에 대응하여 이미지 크기 조절을 지원하고, 그레이 스케일 모드 및 컬러 모드 중 어느 하나의 모드로 그래픽 지원하기 위한 포맷으로 설정되는 것을 특징으로 한다.Preferably, the image intermediate data supports image size adjustment in response to selection change of the display size in the e-book terminal, and is set as a format for graphic support in any one of gray scale mode and color mode. It is characterized by.

바람직하게는, 상기 포맷변환장치는 상기 소스 데이터를 로드하기 위한 파일 로더(File Loader), 상기 로드한 소스 데이터의 헤더 정보를 판별하여 포맷 변환의 실행을 제어하기 위한 헤더 파서(Header Parser), 상기 헤더 파서의 실행 명령을 통해 상기 소스 데이터로부터 상기 이미지 데이터를 추출하여 상기 이미지 중간데이터를 형성하기 위한 이미지 매니저(Image Manager), 상기 헤더 파서의 실행 명령을 통해 상기 텍스트 데이터를 추출하여 상기 텍스트 중간데이터로 XML 포맷팅하기 위한 텍스트 XML 포맷터(Text XML Formatter), 상기 텍스트 데이터 및 상기 세션영역 정보의 중간데이터를 형성하고, 각 중간데이터에 대한 좌표정보를 처리하기 위 한 좌표처리 매니저 및 상기 적어도 하나 이상의 중간 데이터를 패키징하여 상기 전자책의 데이터 포맷을 형성하기 위한 패키징 프로세서를 포함하는 것을 특징으로 한다.Preferably, the format conversion apparatus includes a file loader for loading the source data, a header parser for controlling the execution of format conversion by determining header information of the loaded source data, An image manager for extracting the image data from the source data through an execution command of a header parser to form the image intermediate data, and extracting the text data through an execution command of the header parser A text XML formatter for formatting an XML data, a coordinate processing manager for forming intermediate data of the text data and the session area information, and processing coordinate information for each intermediate data, and the at least one intermediate For packaging data to form the data format of the e-book It characterized in that it comprises a packaging processor.

바람직하게는, 상기 텍스트 검색데이터는 상기 텍스트 XML 포맷터 및 상기 좌표처리 매니저의 상호 연동을 통해 형성되는 데이터인 것을 특징으로 한다.Preferably, the text search data is characterized in that the data is formed through the interworking of the text XML formatter and the coordinate processing manager.

바람직하게는, 상기 이미지 매니저는 상기 이미지 중간데이터를 16-그레이 이미지로 디더링하는 것을 특징으로 한다.Advantageously, said image manager dithers said image intermediate data into a 16-gray image.

바람직하게는, 상기 좌표처리 매니저는 상기 소스 데이터가 PDF 파일인 경우, 상기 PDF 파일로부터 각 텍스트에 대한 좌표정보 및 각 세션영역에 대한 좌표정보를 추출하는 것을 특징으로 한다.Preferably, when the source data is a PDF file, the coordinate processing manager extracts coordinate information about each text and coordinate information about each session area from the PDF file.

또한, 상기 목적을 달성하기 위한 본 발명의 제 2 관점에 따른 전자책을 이루는 데이터 포맷으로의 포맷변환장치는, 문서 기반의 소스 데이터를 제공받아 로드하기 위한 파일 로더, 상기 로드한 소스 데이터의 헤더 정보를 판별하여 포맷 변환의 실행을 제어하기 위한 헤더 파서, 상기 헤더 파서의 실행 명령을 통해 상기 소스 데이터로부터 상기 이미지 데이터를 추출하여 상기 이미지 중간데이터를 형성하기 위한 이미지 매니저, 상기 헤더 파서의 실행 명령을 통해 상기 텍스트 데이터를 추출하여 상기 텍스트 중간데이터로 XML 포맷팅하기 위한 텍스트 XML 포맷터, 상기 텍스트 데이터 및 상기 세션영역 정보의 중간데이터를 형성하고, 각 중간데이터에 대한 좌표정보를 처리하기 위한 좌표처리 매니저 및 상기 적어도 하나 이상의 중간 데이터를 패키징하여 상기 전자책의 데이터 포맷을 형성하기 위한 패키징 프 로세서를 포함하는 것을 특징으로 한다.In addition, a format converting apparatus into a data format forming an e-book according to a second aspect of the present invention for achieving the above object, a file loader for receiving and loading document-based source data, the header of the loaded source data A header parser for determining information and controlling execution of format conversion, an image manager for extracting the image data from the source data to form the image intermediate data through an execution command of the header parser, and an execution command of the header parser A text XML formatter for extracting the text data from the text data and formatting the text data with the XML data, and forming intermediate data of the text data and the session area information, and a coordinate processing manager for processing coordinate information on each intermediate data. And packaging the at least one intermediate data. W is characterized in that it comprises a packaging processor for forming a data format of the electronic book.

바람직하게는, 상기 파일 로더는 상기 소스 데이터를 제공하는 문서공급서버와 HTTP 또는 SOAP(Simple Object Access Protocol)를 통해 연결되는 것을 특징으로 한다.Preferably, the file loader is connected to the document supply server providing the source data through HTTP or Simple Object Access Protocol (SOAP).

바람직하게는, 상기 포맷변환장치는 상기 전자책을 제공하는 전자책 서버 및 상기 전자책을 제공받아 열람 실행하는 전자책 단말 중 적어도 어느 하나에 구비되는 것을 특징으로 한다.Preferably, the format conversion apparatus is provided in at least one of an e-book server for providing the e-book and an e-book terminal for receiving and executing the e-book.

따라서, 본 발명에서는 전자책 단말의 운용환경에 부합하는 전자책 전용 솔루션을 구현하여 단말 내에서 전자책에 대한 다양한 열람방식, 문서내용 검색, 해당 문서내용에 대한 세션확대 및 해당 문서내용의 스크랩을 포함하는 기능들을 지원하기 위한 전자책을 이루는 데이터 포맷의 형성 시스템 및 이에 적용되는 포맷변환장치를 구현함으로써, 다양한 열람기능을 지원하는 전자책 단말별로 대응하기 위한 전자신문과 같은 전자책의 데이터 포맷을 형성할 수 있을 뿐만 아니라, 전자신문과 같은 특성있는 전자책을 실행하기 위한 전자책 단말에 부가되는 기능의 개발도 더욱 활성화될 수 있으며, 사용자의 입장에서도 더욱 편리하게 실제 신문을 보는 것과 같이 전자신문을 열람할 수 있는 이점이 있다.Therefore, the present invention implements a dedicated e-book solution corresponding to the operating environment of the e-book terminal, various reading methods for the e-book, document content search, session expansion for the document content and scrap of the document content in the terminal By implementing a data format forming system for forming an e-book for supporting functions including a format conversion device and a format conversion apparatus applied thereto, the data format of an e-book such as an e-newspaper for each e-book terminal supporting various reading functions is implemented. Not only can it be formed, but also the development of functions added to an e-book terminal for executing a characteristic e-book such as an e-newspaper can be further activated. There is an advantage that can be viewed.

이하, 첨부도면들을 참조하여 본 발명에 따른 전자책을 이루는 데이터 포맷의 형성 시스템의 바람직한 실시예를 보다 상세히 설명하면 다음과 같다.Hereinafter, with reference to the accompanying drawings will be described in detail a preferred embodiment of a system for forming a data format of an e-book according to the present invention in detail.

도 1은 본 발명의 일실시 예에 따른 전자책을 이루는 데이터 포맷의 형성 시스템의 구성도이다. 도 1에 도시된 바와 같이, 전자책을 이루는 데이터 포맷의 형성 시스템은 문서기반의 소스 데이터를 제공하는 문서공급서버(100), 상기 소스 데이터를 토대로 하여 구현되는 전자책을 구비하는 전자책 서버, 상기 전자책 서버에 접속하여 해당하는 전자책을 제공받아 실행하는 전자책 단말 및 상기 소스 데이터를 토대로 하여 상기 전자책 단말별로 대응하는 전자책의 데이터 포맷을 형성하기 위한 포맷변환장치(200)를 포함한다.1 is a block diagram of a system for forming a data format constituting an e-book according to an embodiment of the present invention. As shown in FIG. 1, a system for forming a data format constituting an e-book includes a document supply server 100 for providing document-based source data, an e-book server having an e-book implemented based on the source data, An e-book terminal connected to the e-book server to receive and execute a corresponding e-book, and a format conversion device 200 for forming a data format of the e-book corresponding to each e-book based on the source data. do.

여기서, 상기 포맷변환장치(200)는 전자책 서버 및 전자책 단말 중 적어도 하나에는 구비되는 것이 바람직하다.Here, the format conversion apparatus 200 is preferably provided in at least one of the e-book server and the e-book terminal.

또한, 상기 문서 기반의 소스 데이터는 다양한 전자책 중에서 전자신문을 구현하기 위한 뉴스 데이터인 것으로 하여 이하에서 상술하기로 한다.The document-based source data is news data for implementing an electronic newspaper among various e-books.

이에 포맷변환장치(200)는 뉴스 데이터로부터 이미지 데이터, 텍스트 데이터, 텍스트 데이터와 대응하는 좌표정보 및 세션영역 정보 중 적어도 하나 이상의 특성 데이터를 추출하고, 이러한 특성 데이터를 기초로 하는 전자신문을 디스플레이하기 위한 전자책 단말별로 상기 특성 데이터를 분류하여 적어도 하나 이상의 중간 데이터로 변환할 뿐만 아니라, 이러한 적어도 하나 이상의 중간 데이터를 패키징 및 압축하여 전자신문의 데이터 포맷을 형성하게 된다.The format conversion apparatus 200 extracts at least one feature data from image data, text data, coordinate information corresponding to the text data, and session area information from the news data, and displays an electronic newspaper based on the feature data. In addition to classifying the characteristic data for each e-book terminal and converting the characteristic data into at least one intermediate data, the data format of the electronic newspaper is formed by packaging and compressing the at least one intermediate data.

이를 위해, 포맷변환장치(200)는 HTTP 또는 SOAP(Simple Object Access Protocol) 연결을 통해 제공되는 뉴스 데이터를 로드하기 위한 파일 로더(210)(File Loader), 로드한 뉴스 데이터의 헤더 정보를 판별하여 포맷 변환의 실행을 제어하기 위한 헤더 파서(220)(Header Parser), 상기 헤더 파서(220)의 실행 명령을 통해 뉴스 데이터로부터 이미지 데이터를 추출하여 이미지 중간데이터를 형성하기 위한 이미지 매니저(230)(Image Manager), 상기 헤더 파서(220)의 실행 명령을 통해 텍스트 데이터를 추출하여 텍스트 중간데이터로 XML 포맷팅하기 위한 텍스트 XML 포맷터(240)(Text XML Formatter), 텍스트 데이터 및 세션영역 정보의 중간데이터를 형성하고, 각 중간데이터에 대한 좌표정보를 처리하기 위한 좌표처리 매니저(250) 및 상기 적어도 하나 이상의 중간 데이터를 패키징하여 상기 전자책의 데이터 포맷을 형성하기 위한 패키징 프로세서(250)를 포함한다.To this end, the format conversion apparatus 200 determines a file loader 210 for loading news data provided through an HTTP or Simple Object Access Protocol (SOAP) connection, and header information of the loaded news data. An image manager 230 for forming image intermediate data by extracting image data from news data through a header parser 220 for controlling execution of format conversion and an execution command of the header parser 220 ( Image Manager), the text XML formatter 240 for extracting the text data through the execution command of the header parser 220 and formatting the XML into the text intermediate data, and the intermediate data of the text data and the session area information. And a coordinate processing manager 250 for processing coordinate information of each intermediate data and the at least one intermediate data to package the e-book. A packaging processor 250 for forming the data format of the.

또한, 상기 텍스트 검색데이터는 텍스트 XML 포맷터(240) 및 좌표처리 매니저(250)의 상호 연동을 통해 XML 포맷팅된 텍스트 중간데이터와 이러한 텍스트 중간데이터 및 세션영역 정보의 중간데이터에 대한 좌표정보의 조합으로 형성되는 데이터이다. 이러한 텍스트 검색데이터는 원문 기사조회와 더불어 텍스트 기반의 뉴스 검색을 하기 위하여 부가적으로 구성된다.In addition, the text search data is a combination of text intermediate data formatted in XML through the interworking of the text XML formatter 240 and the coordinate processing manager 250 and coordinate information about the intermediate data of the text intermediate data and the session area information. Data that is formed. The text search data is additionally configured for text-based news search together with the original article search.

도 2는 도 1에 도시된 전자책 파일에 대한 데이터 포맷의 형태를 도시한 도면이다. 도 2에 도시된 바와 같이, 전자책 파일에 대한 데이터 포맷의 형태는 뉴스 데이터를 판별하기 위한 헤더 정보, 뉴스 데이터에 포함되는 이미지 데이터를 랜더링 처리로 추출하여 전자책 단말의 디스플레이 사이즈에 대응하기 위한 디더링 처리를 통해 형성되는 이미지 중간데이터, 텍스트 데이터에 대한 XML 포맷팅을 실행하여 형성되는 텍스트 중간데이터, 텍스트 중간데이터의 폰트크기 조정으로 인하거 나, 이미지 중간데이터와 텍스트 중간데이터의 레이아웃 조합으로 인한 텍스트 배치를 기반으로 하여 형성되는 좌표정보의 중간데이터, 세션영역 정보를 토대로 문서 내용을 세션별로 구분하여 전자책 단말의 화면에 디스플레이하기 위한 세션영역 정보의 중간데이터 및 텍스트 중간데이터를 기초로 하여 텍스트 검색을 실행하기 위한 텍스트 검색데이터를 포함한다.FIG. 2 is a diagram illustrating a format of a data format for the e-book file illustrated in FIG. 1. As shown in FIG. 2, the data format of the e-book file is configured to correspond to the display size of the e-book terminal by extracting header information for determining news data and image data included in the news data by rendering processing. Image intermediate data formed through dithering, text intermediate data formed by executing XML formatting for text data, font size adjustment of text intermediate data, or text due to layout combination of image intermediate data and text intermediate data Text search based on the intermediate data and text intermediate data of the session area information to display the document contents on the screen of the e-book terminal by dividing the document contents by session based on the intermediate data of the coordinate information formed based on the arrangement and the session area information. Text search to run And a data.

여기서, 이미지 중간데이터는 이미지 매니저(230)를 통해 16-그레이 이미지로 디더링되어 데이터 사이즈를 줄이는 것이 바람직하며, 전자책 단말에서의 디스플레이 사이즈에 대한 선택 변경에 대응하여 이미지 크기 조절을 지원하고, 그레이 스케일 또는 컬러 모드 중 어느 하나의 모드로 그래픽 지원하기 위한 포맷으로 설정되는 것이 바람직하다.Here, the image intermediate data is preferably dithered into a 16-gray image through the image manager 230 to reduce the data size, and supports image size adjustment in response to the selection change of the display size in the e-book terminal, Preferably, the format is set to a format for graphic support in either the scale or color mode.

상기 헤더정보에는 포맷식별자, 포맷버전 정보, 발신신문사 정보, 신문발간 일자 및 컨버전 파일 제작자 정보가 포함될 수 있다.The header information may include format identifier, format version information, outgoing newspaper company information, newspaper publication date, and conversion file producer information.

상기 뉴스 데이터가 PDF 파일인 경우, 상기 텍스트 중간데이터 및 상기 좌표정보의 중간데이터는 PDF 원문에서는 각 텍스트들의 좌표정보가 그대로 포함되지 않기 때문에 전자책을 이루기 위한 데이터 포맷에는 폰트 크기 및 각 레이아웃의 조합을 거쳐 최종적인 랜더링 된 상태의 좌표정보를 추출하는 것이 바람직하며, 이러한 과정을 거쳐 추출된 좌표정보는 해당하는 텍스트와 함께 XML 형태로 구성된다.When the news data is a PDF file, since the text intermediate data and the intermediate data of the coordinate information do not include the coordinate information of each text in the original text of the PDF, a combination of font size and each layout is included in the data format for the e-book. It is preferable to extract the coordinate information of the final rendered state through, and the coordinate information extracted through this process is configured in the XML form with the corresponding text.

이러한 좌표정보는 전자책 단말의 전자신문에서 텍스트 검색시 단어 표시기능이나 사용자의 입력설정을 통한 단어 선택으로 사전 연동 등의 응용 서비스 를 구현하기 위한 매우 유용한 정보이다.Such coordinate information is very useful information for implementing an application service such as dictionary linkage by selecting a word through a word display function or user input setting when searching text in an electronic newspaper of an e-book terminal.

이하에서는, 첨부도면을 참조하여 본 발명에 따른 전자책을 이루는 데이터 포맷의 형성 시스템의 동작과정에 대해 보다 상세히 설명하면 다음과 같다.Hereinafter, with reference to the accompanying drawings will be described in more detail with respect to the operation of the system for forming a data format of the e-book according to the present invention.

도 3은 도 1에 도시된 전자책을 이루는 데이터 포맷의 형성 시스템의 동작과정을 도시한 도면이다. 도 3에 도시된 바와 같이, 포맷변환장치(200)는 문서공급서버(100)로부터 HTTP 또는 SOAP로 제공되는 뉴스 데이터에 대한 데이터 특성별 분류를 통해 비트맵 또는 JPEG와 같은 이미지 데이터, PDF 파일원문, 세션영역 정보 및 텍스트 데이터 등을 추출하게 된다.3 is a diagram illustrating an operation process of a system for forming a data format constituting the e-book shown in FIG. 1. As shown in FIG. 3, the format conversion apparatus 200 may classify image data, such as a bitmap or JPEG, or a PDF file text through classification by data characteristics for news data provided from the document supply server 100 in HTTP or SOAP. In addition, session area information and text data are extracted.

이후로, 이미지 데이터에 대한 16-그레이 디더링을 실행하여 전자책 단말의 화면에 최적화되도록 하고, 단말 사용자의 의해 특정 단어의 선택 시 그 단어의 위치를 파악하기 위해 PDF 파일로부터 텍스트 좌표정보를 추출하며, 세션영역 정보 및 텍스트 데이터에 포함되는 텍스트들에 대한 XML 포맷팅을 실행하는 것을 포함하는 중간데이터로의 변환과정을 진행한다.Then, 16-gray dithering is performed on the image data to be optimized for the screen of the e-book terminal, and text coordinate information is extracted from the PDF file to determine the position of the word when the specific word is selected by the terminal user. In addition, the process of converting to intermediate data including performing XML formatting on texts included in session area information and text data is performed.

이렇게 형성되는 중간데이터들(이미지, 좌표, XML 등을 포함)에 대한 패키징 및 압축을 실행하여 전자책을 이루는 데이터 포맷을 구현하게 된다.The intermediate data (including image, coordinates, XML, etc.) formed in this way is packaged and compressed to implement a data format that forms an e-book.

상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다. Although the above has been described with reference to a preferred embodiment of the present invention, those skilled in the art will be variously modified and changed within the scope of the invention without departing from the spirit and scope of the invention described in the claims below. I can understand that you can.

또한, 본 발명은 전자책 단말의 운용환경에 부합하는 전자책 전용 솔루션을 구현하기 위한 데이터 포맷을 형성하고 이러한 데이터 포맷의 전자책을 전자책 단말에서 다양한 방식으로 열람되도록 하고자 하는 것임에 따라, 시판 또는 영업의 가능성이 충분할 뿐만 아니라 현실적으로 명백하게 실시할 수 있는 정도이므로 산업상 이용가능성이 있는 발명이다.In addition, the present invention is to form a data format for implementing an e-book dedicated solution that meets the operating environment of the e-book terminal, so that the e-book of this data format to be viewed in various ways in the e-book terminal, commercially available Or it is an invention with industrial applicability, since not only the possibility of a business is sufficient but also the degree which can be implemented in reality clearly.

도 1은 본 발명의 일실시 예에 따른 전자책을 이루는 데이터 포맷의 형성 시스템의 구성도,1 is a block diagram of a system for forming a data format constituting an e-book according to an embodiment of the present invention;

도 2는 도 1에 도시된 전자책 파일에 대한 데이터 포맷의 형태를 도시한 도면, 및FIG. 2 is a diagram showing the format of a data format for the e-book file shown in FIG. 1; and

도 3은 도 1에 도시된 전자책을 이루는 데이터 포맷의 형성 시스템의 동작과정을 도시한 도면이다.3 is a diagram illustrating an operation process of a system for forming a data format constituting the e-book shown in FIG. 1.

< 도면의 주요 부분에 대한 부호의 설명 ><Description of Symbols for Main Parts of Drawings>

100 : 문서공급서버 200 : 포맷변환장치100: document supply server 200: format conversion device

210 : 파일 로더 220 : 헤더 파서210: File Loader 220: Header Parser

230 : 이미지 매니저 240 : 텍스트 XML 포맷터230: Image Manager 240: Text XML Formatter

250 : 좌표처리 매니저 260 : 패키징 프로세서250: coordinate processing manager 260: packaging processor

Claims (10)

문서 기반의 소스 데이터를 제공하는 문서공급서버; 및A document supply server for providing document-based source data; And 상기 소스 데이터로부터 이미지 데이터, 텍스트 데이터, 상기 텍스트 데이터와 대응하는 좌표정보 및 세션영역 정보 중 적어도 하나 이상의 특성 데이터를 추출하고, 상기 특성 데이터를 토대로 형성되는 전자책을 디스플레이하는 전자책 단말별로 상기 특성 데이터를 분류하여 적어도 하나 이상의 중간 데이터로 변환하며, 상기 적어도 하나 이상의 중간 데이터를 패키징하여 상기 전자책의 데이터 포맷을 형성하기 위한 포맷변환장치를 포함하는 것을 특징으로 하는 전자책을 이루는 데이터 포맷의 형성 시스템.Extracting at least one feature data of image data, text data, coordinate information corresponding to the text data, and session area information from the source data, and displaying the feature for each e-book terminal displaying an e-book formed based on the feature data. And classifying data into at least one intermediate data and packaging the at least one intermediate data to form a data format of the e-book. system. 제 1 항에 있어서, 상기 데이터 포맷은The method of claim 1, wherein the data format 상기 소스 데이터를 판별하기 위한 헤더 정보;Header information for determining the source data; 상기 소스 데이터에 포함되는 상기 이미지 데이터를 랜더링 처리로 추출하여 상기 전자책 단말의 디스플레이 사이즈에 대응하기 위한 디더링 처리를 통해 형성되는 이미지 중간데이터;Image intermediate data formed through a dithering process for extracting the image data included in the source data by a rendering process and corresponding to the display size of the e-book device; 상기 텍스트 데이터에 대한 XML 포맷팅을 실행하여 형성되는 텍스트 중간데이터;Text intermediate data formed by executing XML formatting on the text data; 상기 텍스트 중간데이터의 폰트크기 조정으로 인하거나, 상기 이미지 중간데이터와 상기 텍스트 중간데이터의 레이아웃 조합으로 인한 텍스트 배치를 기반으로 하여 형성되는 상기 좌표정보의 중간데이터;Intermediate data of the coordinate information formed by adjusting a font size of the text intermediate data or based on text arrangement due to a layout combination of the image intermediate data and the text intermediate data; 상기 세션영역 정보를 토대로 문서 내용을 세션별로 구분하여 상기 전자책 단말의 화면에 디스플레이하기 위한 상기 세션영역 정보의 중간데이터; 및Intermediate data of the session area information for classifying document contents for each session based on the session area information for display on the screen of the e-book device; And 상기 텍스트 중간데이터를 기초로 하여 텍스트 검색을 실행하기 위한 텍스트 검색데이터를 포함하는 것을 특징으로 하는 전자책을 이루는 데이터 포맷의 형성 시스템.And text search data for executing a text search based on the text intermediate data. 제 2 항에 있어서, 상기 이미지 중간데이터는The method of claim 2, wherein the image intermediate data is 상기 전자책 단말에서의 디스플레이 사이즈에 대한 선택 변경에 대응하여 이미지 크기 조절을 지원하고, 그레이 스케일 모드 및 컬러 모드 중 어느 하나의 모드로 그래픽 지원하기 위한 포맷으로 설정되는 것을 특징으로 하는 전자책을 이루는 데이터 포맷의 형성 시스템.In response to the selection change of the display size of the e-book terminal, the image size is controlled, and the e-book is set to a format for graphic support in any one of gray scale mode and color mode. Formation system of data format. 제 2 항에 있어서, 상기 포맷변환장치는The apparatus of claim 2, wherein the format conversion device is 상기 소스 데이터를 로드하기 위한 파일 로더(File Loader);A file loader for loading the source data; 상기 로드한 소스 데이터의 헤더 정보를 판별하여 포맷 변환의 실행을 제어하기 위한 헤더 파서(Header Parser);A header parser for controlling execution of format conversion by determining header information of the loaded source data; 상기 헤더 파서의 실행 명령을 통해 상기 소스 데이터로부터 상기 이미지 데이터를 추출하여 상기 이미지 중간데이터를 형성하기 위한 이미지 매니저(Image Manager);An image manager configured to extract the image data from the source data through an execution command of the header parser to form the image intermediate data; 상기 헤더 파서의 실행 명령을 통해 상기 텍스트 데이터를 추출하여 상기 텍스트 중간데이터로 XML 포맷팅하기 위한 텍스트 XML 포맷터(Text XML Formatter);A text XML formatter for extracting the text data through the execution command of the header parser and formatting the text data into the XML data; 상기 텍스트 데이터 및 상기 세션영역 정보의 중간데이터를 형성하고, 각 중간데이터에 대한 좌표정보를 처리하기 위한 좌표처리 매니저; 및A coordinate processing manager for forming intermediate data of the text data and the session area information and processing coordinate information for each intermediate data; And 상기 적어도 하나 이상의 중간 데이터를 패키징하여 상기 전자책의 데이터 포맷을 형성하기 위한 패키징 프로세서를 포함하는 것을 특징으로 하는 전자책을 이루는 데이터 포맷의 형성 시스템.And a packaging processor for packaging the at least one intermediate data to form a data format of the e-book. 제 4 항에 있어서, 상기 텍스트 검색데이터는The method of claim 4, wherein the text search data is 상기 텍스트 XML 포맷터 및 상기 좌표처리 매니저의 상호 연동을 통해 형성되는 데이터인 것을 특징으로 하는 전자책을 이루는 데이터 포맷의 형성 시스템.And a data format formed through the interworking of the text XML formatter and the coordinate processing manager. 제 4 항에 있어서, 상기 이미지 매니저는The method of claim 4, wherein the image manager 상기 이미지 중간데이터를 16-그레이 이미지로 디더링하는 것을 특징으로 하는 전자책을 이루는 데이터 포맷의 형성 시스템.And dithering the intermediate image data into a 16-gray image. 제 4 항에 있어서, 상기 좌표처리 매니저는The method of claim 4, wherein the coordinate processing manager 상기 소스 데이터가 PDF 파일인 경우, 상기 PDF 파일로부터 각 텍스트에 대한 좌표정보 및 각 세션영역에 대한 좌표정보를 추출하는 것을 특징으로 하는 전자책을 이루는 데이터 포맷의 형성 시스템.And if the source data is a PDF file, extracting coordinate information for each text and coordinate information for each session area from the PDF file. 문서 기반의 소스 데이터를 제공받아 로드하기 위한 파일 로더;A file loader for receiving and loading document-based source data; 상기 로드한 소스 데이터의 헤더 정보를 판별하여 포맷 변환의 실행을 제어하기 위한 헤더 파서;A header parser for controlling execution of a format conversion by determining header information of the loaded source data; 상기 헤더 파서의 실행 명령을 통해 상기 소스 데이터로부터 상기 이미지 데이터를 추출하여 상기 이미지 중간데이터를 형성하기 위한 이미지 매니저;An image manager for extracting the image data from the source data through an execution command of the header parser to form the image intermediate data; 상기 헤더 파서의 실행 명령을 통해 상기 텍스트 데이터를 추출하여 상기 텍스트 중간데이터로 XML 포맷팅하기 위한 텍스트 XML 포맷터;A text XML formatter for extracting the text data through the execution command of the header parser and formatting the text data into the XML intermediate data; 상기 텍스트 데이터 및 상기 세션영역 정보의 중간데이터를 형성하고, 각 중간데이터에 대한 좌표정보를 처리하기 위한 좌표처리 매니저; 및A coordinate processing manager for forming intermediate data of the text data and the session area information and processing coordinate information for each intermediate data; And 상기 적어도 하나 이상의 중간 데이터를 패키징하여 상기 전자책의 데이터 포맷을 형성하기 위한 패키징 프로세서를 포함하는 것을 특징으로 하는 전자책을 이루는 데이터 포맷으로의 포맷변환장치.And a packaging processor for packaging the at least one intermediate data to form a data format of the e-book. 제 8 항에 있어서, 상기 파일 로더는The method of claim 8, wherein the file loader 상기 소스 데이터를 제공하는 문서공급서버와 HTTP 또는 SOAP(Simple Object Access Protocol)를 통해 연결되는 것을 특징으로 하는 전자책을 이루는 데이터 포맷으로의 포맷변환장치.And a document supply server for providing the source data and a data conversion device to a data format constituting an e-book, characterized in that it is connected through HTTP or Simple Object Access Protocol (SOAP). 제 8 항에 있어서, 상기 포맷변환장치는9. The apparatus of claim 8, wherein the format conversion device is 상기 전자책을 제공하는 전자책 서버 및 상기 전자책을 제공받아 열람 실행하는 전자책 단말 중 적어도 어느 하나에 구비되는 것을 특징으로 하는 전자책을 이루는 데이터 포맷으로의 포맷변환장치.At least one of an e-book server for providing the e-book and an e-book terminal for receiving and executing the e-book.
KR1020070080695A 2007-08-10 2007-08-10 System for forming data format of electronic book, and apparatus for converting format applied to the same KR100986886B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070080695A KR100986886B1 (en) 2007-08-10 2007-08-10 System for forming data format of electronic book, and apparatus for converting format applied to the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070080695A KR100986886B1 (en) 2007-08-10 2007-08-10 System for forming data format of electronic book, and apparatus for converting format applied to the same

Publications (2)

Publication Number Publication Date
KR20090016214A true KR20090016214A (en) 2009-02-13
KR100986886B1 KR100986886B1 (en) 2010-10-08

Family

ID=40685471

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070080695A KR100986886B1 (en) 2007-08-10 2007-08-10 System for forming data format of electronic book, and apparatus for converting format applied to the same

Country Status (1)

Country Link
KR (1) KR100986886B1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101147256B1 (en) * 2009-09-07 2012-05-18 주식회사 인큐브테크 Producing apparatus and method for a standized electronic book
KR101500598B1 (en) * 2014-10-06 2015-03-10 한국과학기술정보연구원 Systems and Methods for Producing XML
CN105786515A (en) * 2016-03-01 2016-07-20 惠州Tcl移动通信有限公司 Electronic book file and generation processing method and opening processing method thereof

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100426010B1 (en) * 2000-06-24 2004-04-03 한국전자북 주식회사 Method for Converting DeskTop Publishing Documents to XML documents
KR100385061B1 (en) * 2001-08-10 2003-05-23 삼성전자주식회사 electronic Book for displaying emulation data at screen inputting from outside
JP2005056039A (en) * 2003-08-01 2005-03-03 Sony Corp Information processing system and method, program, and recording medium
KR20090013927A (en) * 2007-08-03 2009-02-06 에스케이 텔레콤주식회사 Method for executing memo at viewer screen of electronic book, apparatus applied to the same

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101147256B1 (en) * 2009-09-07 2012-05-18 주식회사 인큐브테크 Producing apparatus and method for a standized electronic book
KR101500598B1 (en) * 2014-10-06 2015-03-10 한국과학기술정보연구원 Systems and Methods for Producing XML
CN105786515A (en) * 2016-03-01 2016-07-20 惠州Tcl移动通信有限公司 Electronic book file and generation processing method and opening processing method thereof
CN105786515B (en) * 2016-03-01 2020-01-14 惠州Tcl移动通信有限公司 Electronic book file, generation processing method and opening processing method thereof

Also Published As

Publication number Publication date
KR100986886B1 (en) 2010-10-08

Similar Documents

Publication Publication Date Title
US6996772B2 (en) Formatting a content item in a text file using a discrimination stylesheet created using a heuristics stylesheet
KR101203335B1 (en) Using a word processor with accounting data
US20030158969A1 (en) Authoring of media content and dissemination via an information technology network
GB2364802A (en) Electronic document delivery and transformation
US8411956B2 (en) Associating optical character recognition text data with source images
KR20050052421A (en) Creative method and active viewing method for a electronic document
US20020156813A1 (en) Developing documents
AU2015243080B2 (en) Browsing system, terminal, imager server, program, computer-readable recording medium recording said program, and method
TW201423554A (en) Conversion of non-book documents for consistency in e-reader experience
KR100884195B1 (en) Method for reformating contents and recalculating number of pages of electronic book in case of a font size change, and apparatus applied to the same
US7203898B2 (en) Document processing method and apparatus
KR100986886B1 (en) System for forming data format of electronic book, and apparatus for converting format applied to the same
JP2008077171A (en) Data distribution device, data display device, data distribution method, data display method, data distribution program, data display program and recording medium with the same program recorded thereon
JP4451925B1 (en) Guideline management device and guideline management program
US10606932B2 (en) Partitioning of markup language documents
US20100191751A1 (en) Information processing system, information processing apparatus, information processing method and computer readable medium
US20040139229A1 (en) Method for outputting content from the internet or an intranet
KR20010026567A (en) Method of printing HTML documents, System and Recording media
JP2005107635A (en) Electronic form input system, method and program, and medium
JP7178033B1 (en) Document setting system, document setting method and program
WO2023276646A1 (en) Information processing device, information processing method, and program
JP5085147B2 (en) Layout processing apparatus, layout processing method, program, and recording medium
JP2003108424A (en) Information display device and information display program
JP2012226678A (en) Information processor, image processing device, image forming device, and program
JP2014119968A (en) Information processing system, server device, display control method and computer program

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130926

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140923

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150921

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20161004

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20171010

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20181002

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20191001

Year of fee payment: 10