KR102429135B1 - System and Method for creating customized e-books - Google Patents

System and Method for creating customized e-books Download PDF

Info

Publication number
KR102429135B1
KR102429135B1 KR1020210091759A KR20210091759A KR102429135B1 KR 102429135 B1 KR102429135 B1 KR 102429135B1 KR 1020210091759 A KR1020210091759 A KR 1020210091759A KR 20210091759 A KR20210091759 A KR 20210091759A KR 102429135 B1 KR102429135 B1 KR 102429135B1
Authority
KR
South Korea
Prior art keywords
text
file
book
information
html5
Prior art date
Application number
KR1020210091759A
Other languages
Korean (ko)
Inventor
강종도
Original Assignee
(주)이앤아이월드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)이앤아이월드 filed Critical (주)이앤아이월드
Priority to KR1020210091759A priority Critical patent/KR102429135B1/en
Application granted granted Critical
Publication of KR102429135B1 publication Critical patent/KR102429135B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

A DIY electronic book service system that supports a talking friend service according to one embodiment of the present invention comprises: a user terminal that provides the speech information; and an electronic book web server that generates an electronic book in an HTML5 file format by integrating page-unit HTML5 format files comprising scalable vector graphics (SVG) tag into one after converting the speech information into text information, after processing the converted text information into the HTML5 format file, and after converting the text information included in the HTML5 format file into the scalable vector graphics (SVG) tag. Therefore, the present invention is capable of having an advantage in that the produced electronic book can be easily produced as a book.

Description

DIY 전자책 서비스 시스템 및 방법{System and Method for creating customized e-books}DIY e-book service system and method {System and Method for creating customized e-books}

본 발명은 DIY 전자책 서비스 시스템에 관한 것이다.The present invention relates to a DIY e-book service system.

일반적으로 전자책이라 함은 종이로 인쇄된 책이 아니라 실제 출판되는 책의 내용을 컴퓨터 또는 전용 단말기를 이용하여 화면상에서 읽을 수 있도록 한 것을 말한다. In general, an e-book is not a book printed on paper, but a book that is actually published so that the contents of the book can be read on the screen using a computer or a dedicated terminal.

전자책은 실제 종이책과 동일한 모양으로 화면상에 출력하는 이미지북과 텍스트 위주로 책을 화면상에 출력하는 텍스트북으로 구별되어진다. The e-book is divided into an image book that is output on the screen in the same shape as an actual paper book, and a text book that outputs a book mainly on the screen.

종래의 이미지북과 텍스트북은 모두 출판사에서 제공되는 쿼억파일(전자출판 편집용으로 많이 사용되는 소프트 웨어로서 미국의 쿼억(Quark)사에서 개발한 출판편집 전문가용 소프트웨어이며, 이 소프트웨어에의해 생성된 책제본용 파일을 쿼억파일이라 함. 또한 쿼억파일은 PDF파일로 간단히 변환할 수 있다.)을 EZ-PDF Gate를 이용 하여 PDF파일로 변환한 후 그 전자책용 PDF파일을 이용하여 생성하는데, 이미지북은 전자책용 PDF파일을 이미지파일인 JPG파일로 변환시켜 생성하고, 텍스트북은 전자책용 PDF파일을 TXT파일로 변환시킨 후 XML형식으로 생성시킨 것이다.Conventional image books and text books are both published and edited by Quark files (software widely used for electronic publication editing, published by Quark, USA) provided by publishers. A file for bookbinding is called a quouk file. Also, a quouk file can be simply converted into a PDF file) using the EZ-PDF Gate to convert it into a PDF file and then create it using the PDF file for the e-book. Books are created by converting PDF files for e-books into JPG files, which are image files, and text books are created in XML format after converting PDF files for e-books into TXT files.

이에 본 발명은 사용자가 녹취한 음성파일 내의 음성정보를 HTML5 형식의 파일로 가공하여 가공된 HTML5 형식의 파일로 제작된 전자책을 제공하고, 제작된 전자책을 단행본으로 출력가능할 수 있는 DIY 전자책 서비스 시스템 및 방법을 개시하고자 한다. Accordingly, the present invention provides an e-book produced by processing the audio information in the audio file recorded by the user into an HTML5 format file and processing the processed HTML5 format file, and a DIY e-book that can output the produced e-book as a book. Disclosed is a service system and method.

대한민국 등록특허 제10-1808689호(2017.12.14. 공고)Republic of Korea Patent Registration No. 10-1808689 (2017.12.14. Announcement)

본 발명이 해결하고자 하는 과제는 종래의 문제점을 해결할 수 있는 사용자 DIY 전자책 서비스 시스템을 제공하는 데 그 목적이 있다.An object of the present invention is to provide a user DIY e-book service system that can solve the problems of the prior art.

상기 과제를 해결하기 위한 본 발명의 일 실시예에 따른 DIY 전자책 서비스 시스템은 음성파일을 제공하는 사용자 단말; 및 상기 음성파일 내의 음성정보를 텍스트 정보로 변환한 후, 변환된 텍스트 정보를 HTML5 형식의 파일로 가공한 후, 상기 HTML5 형식의 파일에 포함된 텍스트 정보를 SVG(Scalable Vector Graphics) 태그로 변환한 후, 상기 SVG(Scalable Vector Graphics) 태그를 포함하는 페이지 단위의 HTML5 형식의 파일들을 하나로 통합하여 HTML5 파일 형식의 전자 책을 생성하는 전자책 웹 서버를 포함하고, 상기 전자책 웹 서버는 상기 음성파일 내의 음성정보를 텍스트 정보로 변환하는 변환부; 상기 텍스트 정보 내의 단어 및 문법을 보정한 후, 사용자 단말에서 지정한 텍스트 및 레이아웃 속성정보로 보정된 텍스트 정보의 속성값을 변경하는 데이터 처리부; 및 상기 데이터 처리부에서 반영된 텍스트 정보를 HTML5 파일로 변환하는 포맷 변환부를 포함하고, 상기 데이터 처리부는 변환된 텍스트 내의 문자열의 진행방향, 배열위치, 간격, 들여쓰기, 내어쓰기에 대한 레이아웃을 설정하고, 상기 사용자 단말에서 지정한 레이아웃 설정정보를 레퍼런스로 세팅하는 레이아웃 설정부; 텍스트 및 레이아웃의 속성정보를 설정하는 속성정보 설정부; 상기 변환된 텍스트 내의 문자와 문자 간의 어법, 불필요한 동일문자의 연속성, 음성의 높낮이, 억양으로 인한 오류문자를 보정하는 텍스트 보정부; 상기 텍스트 정보를 복수 개의 텍스트 그룹으로 분리한 후, 분리된 복수 개의 텍스트 그룹 내의 단어들의 발생빈도를 추출하고, 추출된 단어들 중 발생빈도가 높은 순위의 단어가 포함된 텍스트 그룹을 선별한 후, 선별된 텍스트 그룹에 기초하여 상기 텍스트 정보의 요약 정보를 생성하는 텍스트 요약 생성부; 레이아웃 데이터를 소정의 연산과정을 통해 SVG 태그 형태로 변환하고, 변환된 결과가 반영된 HTML5 형식의 파일을 생성하는 HTML 5 파일 가공부를 포함하는 것을 특징으로 한다.DIY e-book service system according to an embodiment of the present invention for solving the above problems is a user terminal that provides a voice file; and converting the audio information in the audio file into text information, processing the converted text information into an HTML5 format file, and converting the text information included in the HTML5 format file into a Scalable Vector Graphics (SVG) tag. Then, an e-book web server for generating an e-book in an HTML5 file format by integrating the files in the HTML5 format of the page unit including the SVG (Scalable Vector Graphics) tag into one, wherein the e-book web server includes the audio file a conversion unit for converting voice information in the text information into text information; a data processing unit for correcting words and grammar in the text information and then changing the attribute values of the corrected text information with text and layout attribute information designated by the user terminal; and a format conversion unit that converts the text information reflected in the data processing unit into an HTML5 file, wherein the data processing unit sets a layout for the progress direction, arrangement position, spacing, indentation, and indentation of the character string in the converted text, a layout setting unit for setting the layout setting information specified by the user terminal as a reference; an attribute information setting unit for setting attribute information of text and layout; a text correction unit for correcting erroneous characters due to usage between characters in the converted text, unnecessary continuity of identical characters, pitch of voice, and intonation; After dividing the text information into a plurality of text groups, the frequency of occurrence of words in the plurality of separated text groups is extracted, and a text group including a word having a high frequency of occurrence among the extracted words is selected, a text summary generator generating summary information of the text information based on the selected text group; and an HTML 5 file processing unit that converts the layout data into an SVG tag form through a predetermined operation process and generates an HTML5 format file in which the converted result is reflected.

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

따라서, 본 발명의 일 실시예에 따른 DIY 전자책 출판 서비스 시스템을 이용하면, 사용자에게서 제공된 음성파일 내의 음성을 텍스트로 변환하고, 변환된 텍스트를 사용자가 원하는 형태의 레이아웃 및 텍스트 속성 정보를 부여하여 HTML5 파일로 제작된 전자책을 제작할 수 있고, 제작된 전자책을 단행본으로 손쉽게 제작할 수 있다는 이점이 있다.Therefore, by using the DIY e-book publishing service system according to an embodiment of the present invention, the voice in the voice file provided from the user is converted into text, and the converted text is given the layout and text attribute information in the form desired by the user. It has the advantage of being able to produce an e-book made with HTML5 files and easily producing the produced e-book as a book.

도 1은 본 발명의 실시예에 따른 DIY 전자 책 서비스 시스템의 네트워크 구성도이다.
도 2는 도 1에 도시된 전자책 웹 서버의 세부구성을 나타낸 블럭도이다.
도 3은 도 2에 도시된 데이터 처리부의 세부구성을 나타낸 블록도이다.
도 4는 본 발명의 일 실시예에 따른 DIY 전자 책 서비스 방법을 설명한 흐름도이다.
도 5는 도 4에 도시된 S720 과정의 일 예를 설명한 흐름도이다.
도 6은 도 4에 도시된 S720 과정의 다른 일 예를 설명한 흐름도이다.
도 7은 도 1에 도시된 사용자 단말에서 실행된 DIY 전자책의 구조의 일 예시도이다.
도 8은 본 명세서에 개진된 하나 이상의 실시예가 구현될 수 있는 예시적인 컴퓨팅 환경을 도시한 도이다.
1 is a network configuration diagram of a DIY e-book service system according to an embodiment of the present invention.
FIG. 2 is a block diagram showing the detailed configuration of the e-book web server shown in FIG. 1 .
3 is a block diagram illustrating a detailed configuration of the data processing unit shown in FIG. 2 .
4 is a flowchart illustrating a DIY e-book service method according to an embodiment of the present invention.
5 is a flowchart illustrating an example of the process S720 illustrated in FIG. 4 .
6 is a flowchart illustrating another example of the process S720 illustrated in FIG. 4 .
FIG. 7 is an exemplary diagram of a structure of a DIY e-book executed in the user terminal shown in FIG. 1 .
8 illustrates an example computing environment in which one or more embodiments disclosed herein may be implemented.

본 발명에서 사용되는 기술적 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아님을 유의해야 한다. 또한, 본 발명에서 사용되는 기술적 용어는 본 발명에서 특별히 다른 의미로 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미로 해석되어야 하며, 과도하게 포괄적인 의미로 해석되거나, 과도하게 축소된 의미로 해석되지 않아야 한다. 또한, 본 발명에서 사용되는 기술적인 용어가 본 발명의 사상을 정확하게 표현하지 못하는 잘못된 기술적 용어일 때에는 당업자가 올바르게 이해할 수 있는 기술적 용어로 대체되어 이해되어야 할 것이다. 또한, 본 발명에서 사용되는 일반적인 용어는 사전에 정의되어 있는 바에 따라, 또는 전후 문맥상에 따라 해석되어야 하며, 과도하게 축소된 의미로 해석되지 않아야 한다.It should be noted that the technical terms used in the present invention are only used to describe specific embodiments, and are not intended to limit the present invention. In addition, the technical terms used in the present invention should be interpreted as meanings generally understood by those of ordinary skill in the art to which the present invention belongs, unless otherwise defined in the present invention, and excessively comprehensive It should not be construed as a human meaning or in an excessively reduced meaning. In addition, when the technical term used in the present invention is an incorrect technical term that does not accurately express the spirit of the present invention, it should be understood by being replaced with a technical term that can be correctly understood by those skilled in the art. In addition, the general terms used in the present invention should be interpreted as defined in advance or according to the context before and after, and should not be interpreted in an excessively reduced meaning.

또한, 본 발명에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함한다. 본 발명에서 "구성된다" 또는 "포함한다" 등의 용어는 발명에 기재된 여러 구성 요소들 또는 여러 단계를 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다.Also, the singular expression used in the present invention includes the plural expression unless the context clearly dictates otherwise. In the present invention, terms such as "consisting of" or "comprising" should not be construed as necessarily including all of the various components or various steps described in the invention, and some components or some steps may not be included. It should be construed that it may further include additional components or steps.

또한, 본 발명에서 사용되는 제 1, 제 2 등과 같이 서수를 포함하는 용어는 구성 요소들을 설명하는데 사용될 수 있지만, 구성 요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제 1 구성 요소는 제 2 구성 요소로 명명될 수 있고, 유사하게 제 2 구성 요소도 제 1 구성 요소로 명명될 수 있다.Also, terms including ordinal numbers such as first, second, etc. used in the present invention may be used to describe the components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, a first component may be referred to as a second component, and similarly, the second component may also be referred to as a first component.

이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성 요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, a preferred embodiment according to the present invention will be described in detail with reference to the accompanying drawings, but the same or similar components are given the same reference numerals regardless of the reference numerals, and the redundant description thereof will be omitted.

또한, 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 발명의 사상을 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 발명의 사상이 제한되는 것으로 해석되어서는 아니 됨을 유의해야 한다.In addition, in the description of the present invention, if it is determined that a detailed description of a related known technology may obscure the gist of the present invention, the detailed description thereof will be omitted. In addition, it should be noted that the accompanying drawings are only for easy understanding of the spirit of the present invention, and should not be construed as limiting the spirit of the present invention by the accompanying drawings.

도 1은 본 발명의 실시예에 따른 DIY 전자 책 서비스 시스템의 네트워크 구성도이고, 도 2는 도 1에 도시된 전자책 웹 서버의 세부구성을 나타낸 블록도이고, 도 3은 도 2에 도시된 데이터 처리부의 세부구성을 나타낸 블록도이다.1 is a network configuration diagram of a DIY e-book service system according to an embodiment of the present invention, FIG. 2 is a block diagram showing a detailed configuration of the e-book web server shown in FIG. 1, and FIG. 3 is shown in FIG. It is a block diagram showing the detailed configuration of the data processing unit.

도 1 내지 도 3을 참조, 본 발명의 일 실시예에 따른 DIY 전자책 서비스 시스템(100)은 사용자 단말(200) 및 전자책 웹 서버(300)를 포함합니다.1 to 3 , the DIY e-book service system 100 according to an embodiment of the present invention includes a user terminal 200 and an e-book web server 300 .

각 구성은 네트워크로 통신할 수 있고, 여기서, 네트워크는, 복수의 단말 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크의 일예에는 RF, 3GPP(3rd Generation Partnership Project) 네트워크, LTE(Long Term Evolution) 네트워크, 5GPP(5rd Generation Partnership Project) 네트워크, WIMAX(World Interoperability for Microwave Access) 네트워크, 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), 블루투스(Bluetooth) 네트워크, NFC 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함되나 이에 한정되지는 않는다.Each component can communicate with a network, where the network means a connection structure in which information exchange is possible between each node, such as a plurality of terminals and servers, and an example of such a network includes RF, 3GPP (3rd Generation Partnership Project network, LTE (Long Term Evolution) network, 5GPP (5th Generation Partnership Project) network, WIMAX (World Interoperability for Microwave Access) network, Internet, LAN (Local Area Network), Wireless LAN (Wireless Local Area) network Network), WAN (Wide Area Network), PAN (Personal Area Network), Bluetooth (Bluetooth) network, NFC network, satellite broadcasting network, analog broadcasting network, Digital Multimedia Broadcasting (DMB) network, etc. are included, but are not limited thereto. .

하기에서, 적어도 하나의 라는 용어는 단수 및 복수를 포함하는 용어로 정의되고, 적어도 하나의 라는 용어가 존재하지 않더라도 각 구성요소가 단수 또는 복수로 존재할 수 있고, 단수 또는 복수를 의미할 수 있음은 자명하다 할 것이다. 또한, 각 구성요소가 단수 또는 복수로 구비되는 것은, 실시예에 따라 변경가능하다할 것이다.In the following, the term at least one is defined as a term including the singular and the plural, and even if at least one term does not exist, each component may exist in the singular or plural, and may mean the singular or plural. it will be self-evident In addition, whether each component is provided in singular or plural will be changeable according to the embodiment.

먼저, 사용자 단말(200)은 음성파일(MP3, MP4 etc)을 전자책 웹 플랫폼(10)을 이용하여 문서파일로 변환한 후, 변환된 문서파일의 레이아웃 및 문서파일 내에 원하는 컨텐츠를 삽입한 나만의 DIY 전자책을 제공받는 단말일 수 있다.First, the user terminal 200 converts the audio file (MP3, MP4, etc.) into a document file using the e-book web platform 10, and then only the person who inserts the desired content in the layout of the converted document file and the document file It may be a terminal that is provided with a DIY e-book of

또한, 사용자 단말(200)은 전자책 웹 가이드 플랫폼(10)을 이용하여 제작한 DIY 전자책의 단행본을 주문 제작할 수 있는 단말일 수 있다.In addition, the user terminal 200 may be a terminal capable of custom-manufactured a monograph of a DIY e-book produced by using the e-book web guide platform 10 .

다음으로, 전자책 웹 서버(300)는 전자책 웹 가이드 플랫폼(10)을 실행한 사용자 단말(200)에서 제공된 음성파일(Mp3, Mp4 etc)을 텍스트 정보로 변환한 후, 변환된 텍스트 정보를 HTML5 형식의 파일로 가공한 후, 상기 HTML5 형식의 파일에 포함된 텍스트 정보를 SVG(Scalable Vector Graphics) 태그로 변환한 후, 상기 SVG(Scalable Vector Graphics) 태그를 포함하는 페이지 단위의 HTML5 형식의 파일들을 하나로 통합하여 HTML5 파일 형식의 전자 책을 생성하는 구성일 수 있다.Next, the e-book web server 300 converts the voice files (Mp3, Mp4, etc) provided by the user terminal 200 running the e-book web guide platform 10 into text information, and then converts the converted text information into text information. After processing into an HTML5 format file, the text information included in the HTML5 format file is converted into an SVG (Scalable Vector Graphics) tag, and the page unit HTML5 format file including the SVG (Scalable Vector Graphics) tag. It may be a configuration to create an e-book in an HTML5 file format by integrating them into one.

상기 전자책 웹 서버(300)는 사용자 단말(200)의 요청에 따라 HTML5 파일 형식의 전자 책을 제휴된 출판업체로 제작요청하는 구성일 수 있다.The e-book web server 300 may be configured to request production of an e-book in HTML5 file format to an affiliated publishing company in response to the request of the user terminal 200 .

보다 구체적으로, 전자책 웹 서버(300)는 변환부(310), 데이터 처리부(320), 파일 통합부(330), 포맷 변환부(340), 제작 요청부(350) 및 플랫폼 제공부(360)를 포함한다.More specifically, the e-book web server 300 includes a conversion unit 310 , a data processing unit 320 , a file integration unit 330 , a format conversion unit 340 , a production request unit 350 , and a platform providing unit 360 . ) is included.

상기 변환부(310)는 음성 텍스트 변환(Speech to Text: STT) 프로그램을 이용하여 사용자 단말(200)에서 전송된 음성파일(Mp3, Mp4 etc) 내의 음성정보를 텍스트로 변환하는 구성일 수 있다.The converter 310 may be configured to convert voice information in a voice file (Mp3, Mp4, etc.) transmitted from the user terminal 200 into text using a Speech to Text (STT) program.

다음으로, 데이터 처리부(320)는 텍스트 정보를 PDF, HWP, DOC, XLS, JPG, PNG 등의 전자 파일로 가공하는 구성일 수 있다. 여기서, 상기 전자파일은 기 설정된 속성 정보와 텍스트 속성 정보를 포함할 수 있다. Next, the data processing unit 320 may be configured to process text information into electronic files such as PDF, HWP, DOC, XLS, JPG, and PNG. Here, the electronic file may include preset attribute information and text attribute information.

한편, 상기 레이아웃 속성 정보 및 텍스트 속성 정보는 사용자 단말(200)에서 설정한 설정정보일 수 있다. 상기 텍스트 속성 정보는 텍스트의 문자의 크기, 폰트, 색상 등과 관련된 정보를 의미하고, 상기 레이아웃 속성 정보는 구획된 문단의 유형정보를 의미할 수 있다. 한편, 데이터 처리부(320)는 레이아웃 데이터를 소정의 연산과정을 통해 SVG 태그 형태로 변환하고, 상기 SVG 태그 형태로 변환된 결과를 HTML5(hypertext markup language 5) 형식의 파일에 반영하도록 처리하는 구성일 수 있다.Meanwhile, the layout attribute information and the text attribute information may be setting information set by the user terminal 200 . The text attribute information may refer to information related to a size, font, color, etc. of characters of text, and the layout attribute information may refer to type information of a divided paragraph. Meanwhile, the data processing unit 320 converts the layout data into an SVG tag form through a predetermined operation process, and processes the converted result into the SVG tag form to be reflected in a HTML5 (hypertext markup language 5) format file. can

보다 구체적으로, 상기 데이터 처리부(320)는 레이아웃 생성부(321), 속성정보 설정부(322), 텍스트 보정부(323), 텍스트 요약 생성부(324) 및 HTML 5 파일 가공부(326)를 포함할 수 있다.More specifically, the data processing unit 320 includes a layout generation unit 321 , an attribute information setting unit 322 , a text correction unit 323 , a text summary generation unit 324 , and an HTML 5 file processing unit 326 . may include

상기 레이아웃 설정부(321)는 변환된 텍스트 내의 문자열의 진행방향, 배열위치, 간격, 들여쓰기, 내어쓰기 등에 대한 레이아웃을 설정하는 구성일 수 있다.The layout setting unit 321 may be configured to set a layout for the progress direction, arrangement position, spacing, indentation, outdentation, etc. of the character string in the converted text.

상기 레이아웃 설정부(321)는 사용자 단말(200)에서 지정한 레이아웃 설정정보를 레퍼런스로 세팅하는 구성일 수 있다.The layout setting unit 321 may be configured to set layout setting information designated by the user terminal 200 as a reference.

다음으로, 속성정보 설정부(322)는 텍스트 및 레이아웃의 속성정보를 설정하는 구성일 수 있다.Next, the attribute information setting unit 322 may be configured to set attribute information of text and layout.

여기서, 레이아웃 속성정보는 상기 텍스트 속성 정보는 텍스트의 문자의 크기, 폰트, 색상 등과 관련된 정보를 의미하고, 상기 레이아웃 속성 정보는 구획된 문단의 유형정보를 의미할 수 있다.Here, the layout attribute information may refer to information related to the size, font, color, etc. of text characters, and the layout attribute information may refer to information on the type of a divided paragraph.

상기 텍스트 보정부(323)는 변환된 텍스트의 문자를 보정하는 구성으로, 변환된 텍스트 내의 문자와 문자 간의 어법, 불필요한 동일문자의 연속성, 음성의 높낮이, 억양으로 인한 오류문자 등을 보정하는 구성일 수 있다.The text correction unit 323 is a component that corrects the characters of the converted text, and corrects the usage between characters in the converted text, the continuity of unnecessary identical characters, the pitch of the voice, and the error characters due to intonation. can

상기 텍스트 요약 생성부(324)는 텍스트 내용을 요약하는 구성으로, 상기 텍스트 정보를 복수 개의 텍스트 그룹으로 분리한 후, 분리된 복수 개의 텍스트 그룹 내의 단어들의 발생빈도를 추출하고, 추출된 단어들 중 발생빈도가 높은 순위의 단어가 포함된 텍스트 그룹을 선별한 후, 선별된 텍스트 그룹에 기초하여 상기 텍스트 정보의 요약 정보를 생성하는 구성일 수 있다.The text summary generating unit 324 is configured to summarize text content, and after separating the text information into a plurality of text groups, extracts the frequency of occurrence of words in the plurality of separated text groups, and among the extracted words After selecting a text group including a word having a high frequency of occurrence, summary information of the text information may be generated based on the selected text group.

상기 HTML 5 파일 가공부(326)는 레이아웃 데이터를 소정의 연산과정을 통해 SVG 태그 형태로 변환하고, SVG 태그 형태로 변환된 결과가 반영된 HTML5(hypertext markup language 5) 형식의 파일을 생성하는 구성일 수 있다.The HTML 5 file processing unit 326 converts the layout data into an SVG tag form through a predetermined operation process, and generates a HTML5 (hypertext markup language 5) format file in which the converted result into the SVG tag form is reflected. can

다음으로, 파일 통합부(330)는 데이터 처리부(320)에서 변환된 페이지 단위의 HTML 5 형식의 파일들을 하나로 통합하여 HTML 파일 형식의 전자 책을 생성하는 구성일 수 있다.Next, the file integrator 330 may be configured to generate an e-book in an HTML file format by integrating the HTML 5 format files of the page unit converted by the data processing part 320 into one.

상기 포맷 변환부(340)는 상기 파일 통합부(330)을 통해 생성된 HTML5 파일 형식의 전자 책을 포맷 변환하여 IDPF(International Digital Publishing Forum)에서 제정된 국제표준인 EPUB 3.0(Electronic Publication 3.0) 포맷 또는 플래시 포맷의 전자 책 파일을 생성하는 구성일 수 있다. 예를 들어 자바 스크립트, CSS 파일 등을 첨가하여 하나의 EPUB 3.0 포맷 파일을 만들 수 있다.The format conversion unit 340 converts the e-book of the HTML5 file format generated through the file integration unit 330 to the EPUB 3.0 (Electronic Publication 3.0) format, which is an international standard established by the International Digital Publishing Forum (IDPF). Alternatively, it may be a configuration for generating an e-book file in a flash format. For example, one EPUB 3.0 format file can be created by adding JavaScript and CSS files.

상기 제작요청부(350)는 상기 파일 통합부(330)에서 생성된 HTML5 파일 형식의 전자 책을 단행본으로 제작되도록 출판업체에 제작 및 배송을 사용자에게 제공되도록 요청하는 구성일 수 있다.The production request unit 350 may be configured to request the publishing company to provide the user with production and delivery of the HTML5 file format e-book generated by the file integration unit 330 as a book.

상기 플랫폼 제공부(360)는 전자책 웹 가이드 플랫폼(10)을 제공하는 구성으로, 상기 전자책 웹 가이드 플랫폼(10)은 네트워크를 통하여 사용자 단말(200)에 설치 또는 구동되는 애플리케이션, 프로그램, 웹 페이지 등을 포함할 수 있다.The platform providing unit 360 is configured to provide an e-book web guide platform 10, wherein the e-book web guide platform 10 is installed or driven in the user terminal 200 through a network, applications, programs, web pages and the like.

여기서, 상기 웹 브라우저는 웹(WWW: World Wide Web) 서비스를 이용할 수 있게 하는 프로그램으로 HTML(hyper text mark-up languge)로 서술된 하이퍼 텍스트를 받아서 보여주는 프로그램을 의미하며, 예를 들어 넷스케이프(Netscape), 익스플로러(Explorer), 크롬(chrome) 등을 포함한다. 또한, 애플리케이션은 단말 상의 응용프로그램(application)을 의미하며, 예를 들어, 모바일 단말(스마트폰)에서 실행되는 앱(app)을 포함한다. 앱(app)은 모바일 콘텐츠를 자유롭게 사고 파는 가상의 장터인 애플리케이션 마켓에서 다운로드 받아서 설치할 수 있다.Here, the web browser is a program that enables the use of a web (World Wide Web) service, and refers to a program that receives and displays hyper text described in HTML (hyper text mark-up languge), for example, Netscape (Netscape). ), Explorer, and Chrome. In addition, the application means an application on the terminal, for example, includes an app (app) executed in a mobile terminal (smartphone). Apps can be downloaded and installed from the application market, a virtual marketplace where mobile content can be freely bought and sold.

다음으로, 상기 전자책 웹 가이드 플랫폼(10)은 웹 브라우저(web browser)를 통해 전자 책 저장부에 저장된 전자 책 파일 중 사용자 단말(200)의 화면 상에 보여질 부분만 로딩하여 뷰어 서비스를 지원한다.Next, the e-book web guide platform 10 supports the viewer service by loading only the portion to be displayed on the screen of the user terminal 200 among the e-book files stored in the e-book storage unit through a web browser. do.

또한 전자책 웹 가이드 플랫폼(10)은 로딩된 전자 책 파일에서 특정 텍스트에 다양한 컨텐츠를 설정하고, 사용자가 전자 책 파일의 페이지를 변경시 특정 텍스트가 출현되는 경우 설정된 컨텐츠를 실행시키도록 지원할 수 있다.In addition, the e-book web guide platform 10 can support to set various contents to specific text in the loaded e-book file, and to execute the set contents when a specific text appears when the user changes a page of the e-book file. .

또한, 전자책 웹 가이드 플랫폼(10)은 상기 음성파일 내의 음성정보를 텍스트 정보로 변환한 후, 변환된 텍스트 정보를 HTML5 형식의 파일로 가공한 후, 상기 HTML5 형식의 파일에 포함된 텍스트 정보를 SVG(Scalable Vector Graphics) 태그로 변환한 후, 상기 SVG(Scalable Vector Graphics) 태그를 포함하는 페이지 단위의 HTML5 형식의 파일들을 하나로 통합하여 HTML5 파일 형식의 전자 책을 생성 및 표시하는 기능을 지원한다.In addition, the e-book web guide platform 10 converts the voice information in the voice file into text information, processes the converted text information into a file of HTML5 format, and then converts the text information included in the file of the HTML5 format. After converting to a Scalable Vector Graphics (SVG) tag, the HTML5 format files in a page unit including the SVG (Scalable Vector Graphics) tag are integrated into one to support a function of generating and displaying an HTML5 file format e-book.

또한, 전자책 웹 가이드 플랫폼(10)은 HTML5 파일을 PDF, HWP, DOC, XLS, JPG, PNG 중 어느 하나의 전자 파일로 출력하는 기능을 지원한다.In addition, the e-book web guide platform 10 supports a function of outputting an HTML5 file as an electronic file of any one of PDF, HWP, DOC, XLS, JPG, and PNG.

또한, 전자책 웹 가이드 플랫폼(10)은 HTML5 파일을 PDF, HWP, DOC, XLS, JPG, PNG 중 어느 하나의 전자 파일로 출력하는 기능을 지원한다.In addition, the e-book web guide platform 10 supports a function of outputting an HTML5 file as an electronic file of any one of PDF, HWP, DOC, XLS, JPG, and PNG.

또한, 전자책 웹 가이드 플랫폼(10)은 편집된 속성 정보 및 문단 스타일 정보를 반영한 HTML5 파일로 자신만의 전자책의 제작을 주문/요청하는 기능을 지원한다.In addition, the e-book web guide platform 10 supports a function of ordering/requesting production of your own e-book with an HTML5 file reflecting the edited attribute information and paragraph style information.

한편, 본원에서 개시하는 전자책 웹 서버(300)는 빅데이터를 구축하기 위하여, 저장된 로우 데이터 내에 포함된 비정형(Unstructured) 데이터, 정형(Structured) 데이터 및 반정형 데이터(Semi-structured)를 정제하고, 메타 데이터 분류를 포함한 전처리를 실시할 수 있고, 전처리된 데이터를 데이터 마이닝(Data Mining)을 포함하는 분석을 실시할 수 있다. 그리고, 분석된 데이터를 시각화하여 출력할 수 있다. 이때, 데이터 마이닝은, 전처리된 데이터 간의 내재된 관계를 탐색하여 클래스가 알려진 훈련 데이터 셋을 학습시켜 새로운 데이터의 클래스를 예측하는 분류(Classification) 또는 클래스 정보 없이 유사성을 기준으로 데이터를 그룹짓는 군집화(Clustering)를 수행할 수 있다. 물론, 이외에도 다양한 마이닝 방법이 존재할 수 있으며, 수집 및 저장되는 빅데이터의 종류나 이후에 요청될 질의(Query)의 종류에 따라 다르게 마이닝될 수도 있다. 이렇게 구축된 빅데이터는, 인공신경망 딥러닝이나 기계학습 등으로 검증과정을 거칠 수도 있다.On the other hand, the e-book web server 300 disclosed herein refines unstructured data, structured data, and semi-structured data included in the stored raw data in order to build big data, and , preprocessing including metadata classification may be performed, and analysis including data mining may be performed on the preprocessed data. Then, the analyzed data can be visualized and output. At this time, data mining is a classification that predicts a class of new data by learning a training data set with a known class by exploring the inherent relationship between preprocessed data, or grouping data based on similarity without class information. clustering) can be performed. Of course, there may be various other mining methods, and mining may be performed differently depending on the type of big data to be collected and stored or the type of query to be requested later. The big data constructed in this way can be verified through artificial neural network deep learning or machine learning.

이때, 인공 신경망은 CNN(Convolutional neural network) 구조가 이용될 수 있는데, CNN은 컨볼루션 층을 이용한 네트워크 구조로 이미지 처리에 적합하며, 이미지 데이터를 입력하여 이미지 내의 특징을 기반으로 이미지를 분류할 수 있기 때문이다.At this time, the artificial neural network can use a CNN (Convolutional Neural Network) structure, which is a network structure using a convolutional layer and is suitable for image processing. because there is

또한, 텍스트 마이닝(Text Mining)은 비/반정형 텍스트 데이터에서 자연어처리 기술에 기반하여 유용한 정보를 추출, 가공하는 것을 목적으로 하는 기술이다. 텍스트 마이닝 기술을 통해 방대한 텍스트 뭉치에서 의미 있는 정보를 추출해 내고, 다른 정보와의 연계성을 파악하며, 텍스트가 가진 카테고리를 찾아내거나 단순한 정보 검색 그 이상의 결과를 얻어낼 수 있다. 이를 이용하여, 질의로 입력되는 식별자나 자연어를 분석하고, 그 안에 숨겨진 정보를 발굴해 내기 위해 대용량 언어자원과 통계적, 규칙적 알고리즘이 사용될 수 있다.In addition, text mining is a technology for the purpose of extracting and processing useful information from non/semi-structured text data based on natural language processing technology. Through text mining technology, it is possible to extract meaningful information from a large collection of texts, identify links with other information, find categories of texts, or obtain results beyond simple information search. Using this, large-capacity language resources and statistical and regular algorithms can be used to analyze identifiers or natural language input as queries, and to discover hidden information therein.

또한, 수집한 빅데이터인 로우 데이터(Raw Data)를 병렬 및 분산하여 저장하고, 저장된 로우 데이터 내에 포함된 비정형(Unstructured) 데이터, 정형(Structured) 데이터 및 반정형 데이터(Semi-structured)를 정제하고, 메타 데이터로 분류를 포함한 전처리를 실시하고, 전처리된 데이터를 데이터 마이닝(Data Mining)을 포함하는 분석을 실시하여, 분석된 데이터를 시각화하여 출력할 수 있다.In addition, the collected big data, raw data, is stored in parallel and distributed, and unstructured data, structured data, and semi-structured data included in the stored raw data are refined and semi-structured. , it is possible to perform preprocessing including classification as metadata, and perform analysis including data mining on the preprocessed data to visualize and output the analyzed data.

도 4는 본 발명의 일 실시예에 따른 DIY 전자책 서비스 방법을 설명한 흐름도이다.4 is a flowchart illustrating a DIY e-book service method according to an embodiment of the present invention.

도 4를 참조하면, 본 발명의 일 실시예에 따른 DIY 전자책 서비스 방법(S700)은 사용자 단말(200)에서 전자책 제작 플랫폼(10)을 통해 녹음한 음성파일을 전자책 웹 서버(300)로 제공(S710)하면, 전자책 웹 서버(300)에서 음성파일 내의 음성정보를 텍스트 정보로 변환한 후, 변환된 텍스트 정보를 HTML5 형식의 파일로 가공한 후, HTML5 형식의 파일에 포함된 텍스트 정보를 SVG(Scalable Vector Graphics) 태그로 변환한 후, SVG(Scalable Vector Graphics) 태그를 포함하는 페이지 단위의 HTML5 형식의 파일들을 하나로 통합하여 HTML5 파일 형식의 전자 책을 생성(S720)한다.Referring to FIG. 4 , the DIY e-book service method ( S700 ) according to an embodiment of the present invention transmits a voice file recorded through the e-book production platform 10 in the user terminal 200 to the e-book web server 300 . When provided to (S710), the e-book web server 300 converts the voice information in the voice file into text information, then processes the converted text information into an HTML5 format file, and then the text included in the HTML5 format file. After the information is converted into a Scalable Vector Graphics (SVG) tag, the HTML5 format files of the page unit including the SVG (Scalable Vector Graphics) tag are integrated into one to generate an HTML5 file format e-book ( S720 ).

이후, 사용자 단말(200)에서 전자책 제작 플랫폼(10)에서 지원하는 전자책 디자인 편집 기능을 이용하여 생성된 전자책의 표지를 편집(S730)한 최종 표지를 지정한 후, 지정된 최종 표지를 포함하는 전자책의 단행본을 주문요청하는 과정(S740)을 포함한다.After that, after designating the final cover of editing (S730) the cover of the generated e-book by using the e-book design editing function supported by the e-book production platform 10 in the user terminal 200, Including a process (S740) of requesting an order for a book of the e-book.

보다 구체적으로, 상기 S720 과정은 음성파일을 수신(S710)한 후, SST 변환 알고리즘을 이용하여 음성파일 내의 음성정보를 텍스트로 변환(S722)하고, 변환된 텍스트에 텍스트 속성 및 레이아웃 속성을 부여(S723)한다.More specifically, in the S720 process, after receiving the voice file (S710), the voice information in the voice file is converted into text (S722) using an SST conversion algorithm, and text properties and layout properties are given to the converted text ( S723).

이후, 텍스트 및 레이아웃 속성이 부여된 텍스트 파일을 HTML 5 파일로 변환 생성(S724)하고, 변환된 페이지 단위의 HTML 5 형식의 파일들을 하나로 통합(S725)한 후, 생성된 HTML5 파일 형식의 전자 책을 포맷 변환하여 IDPF(International Digital Publishing Forum)에서 제정된 국제표준인 EPUB 3.0(Electronic Publication 3.0) 포맷 또는 플래시 포맷의 전자 책 파일을 생성(S726)한다. 예를 들어 자바 스크립트, CSS 파일 등을 첨가하여 하나의 EPUB 3.0 포맷 파일을 만들 수 있다.Thereafter, the text file to which the text and layout attributes are given is converted into an HTML 5 file (S724), and the converted page unit HTML 5 format files are integrated into one (S725), and then the generated HTML5 file format e-book format conversion to create an e-book file in EPUB 3.0 (Electronic Publication 3.0) format or flash format, which is an international standard established by IDPF (International Digital Publishing Forum) (S726). For example, one EPUB 3.0 format file can be created by adding JavaScript and CSS files.

한편, 상기 S720 과정은 다음의 과정을 더 포함할 수 있다.Meanwhile, the process S720 may further include the following process.

예컨대, 상기 S722 과정 이후, 변환된 텍스트의 문자를 보정하는 과정(S722-1)을 더 포함할 수 있다.For example, after the process S722, the process of correcting the characters of the converted text (S722-1) may be further included.

상기 S722-1 과정은 텍스트 내의 문자와 문자 간의 어법, 불필요한 동일문자의 연속성, 음성의 높낮이, 억양으로 인한 오류문자 등을 보정하는 과정일 수 있다.The process S722-1 may be a process of correcting an erroneous character due to a word-to-character usage in a text, an unnecessary continuity of the same character, a pitch of a voice, and an intonation.

또한, 상기 S720 과정은 다음의 과정을 더 포함할 수 있다.In addition, the process S720 may further include the following process.

상기 S722-1 과정이 완료된 후, 텍스트 내용을 요약하는 과정(S722-2)을 더 포함할 수 있다.After the process S722-1 is completed, the process of summarizing the text content (S722-2) may be further included.

상기 S722-2 과정은 상기 텍스트 정보를 복수 개의 텍스트 그룹으로 분리한 후, 분리된 복수 개의 텍스트 그룹 내의 단어들의 발생빈도를 추출하고, 추출된 단어들 중 발생빈도가 높은 순위의 단어가 포함된 텍스트 그룹을 선별한 후, 선별된 텍스트 그룹에 기초하여 상기 텍스트 정보의 요약 정보를 생성하는 과정일 수 있다.In step S722-2, after dividing the text information into a plurality of text groups, the frequency of occurrence of words in the plurality of separated text groups is extracted, and a text including a word having a high occurrence frequency among the extracted words After selecting a group, it may be a process of generating summary information of the text information based on the selected text group.

한편, 본 발명의 DIY 전자책 서비스 방법(S700)은 상기 S724과정 이후, 컨텐츠 삽입 및 보정(S724-1) 과정을 더 포함할 수 있다.Meanwhile, the DIY e-book service method (S700) of the present invention may further include a content insertion and correction (S724-1) process after the process S724.

상기 S724-1 과정은 특정 단어에 대응되는 컨텐츠가 표시되도록 설정하는 과정일 수 있다. 즉, 컨텐츠가 텍스트 정보, 텍스트 정보와 시간 정보, 텍스트 정보와 위치 정보에 따라 각각 다른 실행 정보를 포함하도록 설정할 수 있다.The process S724-1 may be a process of setting content corresponding to a specific word to be displayed. That is, the content may be set to include different execution information according to text information, text information and time information, text information and location information.

여기서, 컨텐츠는 전자 책의 페이지 전환시 특정 단어가 드러났을 경우, 그 단어에 미리 설정해둔 애니메이션 및 전자 책의 페이지 전환시 특정 단어가 드러났을 경우, 그 단어에 미리 설정해둔 음향 및 전자책의 페이지 전환시 특정 단어가 드러났을 경우, 미리 설정된 프로그램에 의하여 그 단어에 일러스트일 수 있다. Here, when a specific word is revealed when a page of the e-book is switched, the content includes an animation preset to the word and a sound and an e-book page preset in the word when a specific word is revealed when a page of the e-book is switched. When a specific word is revealed during conversion, the word may be an illustration by a preset program.

따라서, 본 발명의 일 실시예에 따른 DIY 전자책 출판 서비스 시스템을 이용하면, 사용자에게서 제공된 음성파일 내의 음성을 텍스트로 변환하고, 변환된 텍스트를 사용자가 원하는 형태의 레이아웃 및 텍스트 속성 정보를 부여하여 HTML5 파일로 제작된 전자책을 제작할 수 있고, 제작된 전자책을 단행본으로 손쉽게 제작할 수 있다는 이점이 있다.Therefore, by using the DIY e-book publishing service system according to an embodiment of the present invention, the voice in the voice file provided from the user is converted into text, and the converted text is given the layout and text attribute information in the form desired by the user. It has the advantage of being able to produce an e-book made with HTML5 files and easily producing the produced e-book as a book.

도 8은 본 명세서에 개진된 하나 이상의 실시예가 구현될 수 있는 예시적인 컴퓨팅 환경을 도시하는 도면으로, 상술한 하나 이상의 실시예를 구현하도록 구성된 컴퓨팅 디바이스(1100)를 포함하는 시스템(1000)의 예시를 도시한다. 예를 들어, 컴퓨팅 디바이스(1100)는 개인 컴퓨터, 서버 컴퓨터, 핸드헬드 또는 랩탑 디바이스, 모바일 디바이스(모바일폰, PDA, 미디어 플레이어 등), 멀티프로세서 시스템, 소비자 전자기기, 미니 컴퓨터, 메인프레임 컴퓨터, 임의의 전술된 시스템 또는 디바이스를 포함하는 분산 컴퓨팅 환경 등을 포함하지만, 이것으로 한정되는 것은 아니다.8 is a diagram illustrating an example computing environment in which one or more embodiments disclosed herein may be implemented, and is an illustration of a system 1000 including a computing device 1100 configured to implement one or more embodiments described above. shows For example, computing device 1100 may be a personal computer, server computer, handheld or laptop device, mobile device (mobile phone, PDA, media player, etc.), multiprocessor system, consumer electronics, minicomputer, mainframe computer, distributed computing environments including any of the aforementioned systems or devices, and the like.

컴퓨팅 디바이스(1100)는 적어도 하나의 프로세싱 유닛(1110) 및 메모리(1120)를 포함할 수 있다. 여기서, 프로세싱 유닛(1110)은 예를 들어 중앙처리장치(CPU), 그래픽처리장치(GPU), 마이크로프로세서, 주문형 반도체(Application Specific Integrated Circuit, ASIC), Field Programmable Gate Arrays(FPGA) 등을 포함할 수 있으며, 복수의 코어를 가질 수 있다. 메모리(1120)는 휘발성 메모리(예를 들어, RAM 등), 비휘발성 메모리(예를 들어, ROM, 플래시 메모리 등) 또는 이들의 조합일 수 있다. 또한, 컴퓨팅 디바이스(1100)는 추가적인 스토리지(1130)를 포함할 수 있다. 스토리지(1130)는 자기 스토리지, 광학 스토리지 등을 포함하지만 이것으로 한정되지 않는다. The computing device 1100 may include at least one processing unit 1110 and a memory 1120 . Here, the processing unit 1110 may include, for example, a central processing unit (CPU), a graphic processing unit (GPU), a microprocessor, an Application Specific Integrated Circuit (ASIC), Field Programmable Gate Arrays (FPGA), etc. and may have a plurality of cores. The memory 1120 may be a volatile memory (eg, RAM, etc.), a non-volatile memory (eg, ROM, flash memory, etc.), or a combination thereof. Additionally, the computing device 1100 may include additional storage 1130 . Storage 1130 includes, but is not limited to, magnetic storage, optical storage, and the like.

스토리지(1130)에는 본 명세서에 개진된 하나 이상의 실시예를 구현하기 위한 컴퓨터 판독 가능한 명령이 저장될 수 있고, 운영 시스템, 애플리케이션 프로그램 등을 구현하기 위한 다른 컴퓨터 판독 가능한 명령도 저장될 수 있다. 스토리지(1130)에 저장된 컴퓨터 판독 가능한 명령은 프로세싱 유닛(1110)에 의해 실행되기 위해 메모리(1120)에 로딩될 수 있다. 또한, 컴퓨팅 디바이스(1100)는 입력 디바이스(들)(1140) 및 출력 디바이스(들)(1150)을 포함할 수 있다. The storage 1130 may store computer readable instructions for implementing one or more embodiments disclosed herein, and other computer readable instructions for implementing an operating system, an application program, and the like. Computer readable instructions stored in storage 1130 may be loaded into memory 1120 for execution by processing unit 1110 . Computing device 1100 may also include input device(s) 1140 and output device(s) 1150 .

여기서, 입력 디바이스(들)(1140)은 예를 들어 키보드, 마우스, 펜, 음성 입력 디바이스, 터치 입력 디바이스, 적외선 카메라, 비디오 입력 디바이스 또는 임의의 다른 입력 디바이스 등을 포함할 수 있다. 또한, 출력 디바이스(들)(1150)은 예를 들어 하나 이상의 디스플레이, 스피커, 프린터 또는 임의의 다른 출력 디바이스 등을 포함할 수 있다. 또한, 컴퓨팅 디바이스(1100)는 다른 컴퓨팅 디바이스에 구비된 입력 디바이스 또는 출력 디바이스를 입력 디바이스(들)(1140) 또는 출력 디바이스(들)(1150)로서 사용할 수도 있다. 또한, 컴퓨팅 디바이스(1100)는 컴퓨팅 디바이스(1100)가 다른 디바이스(예를 들어, 컴퓨팅 디바이스(1300))와 통신할 수 있게 하는 통신접속(들)(1160)을 포함할 수 있다. Here, the input device(s) 1140 may include, for example, a keyboard, mouse, pen, voice input device, touch input device, infrared camera, video input device, or any other input device, or the like. Further, the output device(s) 1150 may include, for example, one or more displays, speakers, printers, or any other output device, or the like. Also, the computing device 1100 may use an input device or an output device included in another computing device as the input device(s) 1140 or the output device(s) 1150 . Computing device 1100 may also include communication connection(s) 1160 that enable computing device 1100 to communicate with other devices (eg, computing device 1300 ).

여기서, 통신 접속(들)(1160)은 모뎀, 네트워크 인터페이스 카드(NIC), 통합 네트워크 인터페이스, 무선 주파수 송신기/수신기, 적외선 포트, USB 접속 또는 컴퓨팅 디바이스(1100)를 다른 컴퓨팅 디바이스에 접속시키기 위한 다른 인터페이스를 포함할 수 있다. 또한, 통신 접속(들)(1160)은 유선 접속 또는 무선 접속을 포함할 수 있다. 상술한 컴퓨팅 디바이스(1100)의 각 구성요소는 버스 등의 다양한 상호접속(예를 들어, 주변 구성요소 상호접속(PCI), USB, 펌웨어(IEEE 1394), 광학적 버스 구조 등)에 의해 접속될 수도 있고, 네트워크(1200)에 의해 상호접속될 수도 있다. 본 명세서에서 사용되는 "구성요소", "시스템" 등과 같은 용어들은 일반적으로 하드웨어, 하드웨어와 소프트웨어의 조합, 소프트웨어, 또는 실행중인 소프트웨어인 컴퓨터 관련 엔티티를 지칭하는 것이다. Here, communication connection(s) 1160 may be a modem, network interface card (NIC), integrated network interface, radio frequency transmitter/receiver, infrared port, USB connection, or other for connecting computing device 1100 to another computing device. It may include interfaces. Further, the communication connection(s) 1160 may include a wired connection or a wireless connection. Each component of the computing device 1100 described above may be connected by various interconnections such as a bus (eg, peripheral component interconnection (PCI), USB, firmware (IEEE 1394), optical bus structure, etc.) and may be interconnected by a network 1200 . As used herein, terms such as "component," "system," and the like, generally refer to a computer-related entity that is hardware, a combination of hardware and software, software, or software in execution.

예를 들어, 구성요소는 프로세서 상에서 실행중인 프로세스, 프로세서, 객체, 실행 가능물(executable), 실행 스레드, 프로그램 및/또는 컴퓨터일 수 있지만, 이것으로 한정되는 것은 아니다. 예를 들어, 컨트롤러 상에서 구동중인 애플리케이션 및 컨트롤러 모두가 구성요소일 수 있다. 하나 이상의 구성요소는 프로세스 및/또는 실행의 스레드 내에 존재할 수 있으며, 구성요소는 하나의 컴퓨터 상에서 로컬화될 수 있고, 둘 이상의 컴퓨터 사이에서 분산될 수도 있다.For example, a component can be, but is not limited to being, a process running on a processor, a processor, an object, an executable, a thread of execution, a program, and/or a computer. For example, both an application running on a controller and a controller may be a component. One or more components may reside within a process and/or thread of execution, and components may be localized on one computer or distributed between two or more computers.

본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 본 발명에 따른 구성요소를 치환, 변형 및 변경할 수 있다는 것이 명백할 것이다.The present invention is not limited by the above embodiments and the accompanying drawings. For those of ordinary skill in the art to which the present invention pertains, it will be apparent that components according to the present invention can be substituted, modified and changed without departing from the technical spirit of the present invention.

이상에서 설명한 것은 본 발명에 의한 전자 책 서비스 시스템을 실시하기 위한 하나의 실시예에 불과한 것으로서, 본 발명은 상기 실시예에 한정되지 않고, 이하의 특허청구범위에서 청구하는 바와 같이 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변경 실시가 가능한 범위까지 본 발명의 기술적 정신이 있다고 할 것이다.What has been described above is only one embodiment for implementing the e-book service system according to the present invention, and the present invention is not limited to the above embodiment, and the gist of the present invention is provided as claimed in the claims below. It will be said that the technical spirit of the present invention exists to the extent that various modifications can be made by anyone with ordinary knowledge in the field to which the invention pertains without departing from it.

100: 전자책 서비스 시스템
200: 사용자 단말
300: 전자책 웹 서버
310: 변환부
320: 데이터 처리부
321: 레이아웃 생성부
322: 속성정보 설정부
323: 텍스트 보정부
324: 텍스트 요약 생성부
325: HTML 5 파일 가공부
330: 파일 통합부
340: 포맷 변환부
350: 편집부
360: 플랫폼 제공부
100: e-book service system
200: user terminal
300: e-book web server
310: conversion unit
320: data processing unit
321: layout generating unit
322: property information setting unit
323: text correction unit
324: text summary generator
325: HTML 5 file processing unit
330: file consolidation unit
340: format conversion unit
350: editorial department
360: platform provider

Claims (6)

음성파일을 제공하는 사용자 단말; 및
상기 음성파일 내의 음성정보를 텍스트 정보로 변환한 후, 변환된 텍스트 정보를 HTML5 형식의 파일로 가공한 후, 상기 HTML5 형식의 파일에 포함된 텍스트 정보를 SVG(Scalable Vector Graphics) 태그로 변환한 후, 상기 SVG(Scalable Vector Graphics) 태그를 포함하는 페이지 단위의 HTML5 형식의 파일들을 하나로 통합하여 HTML5 파일 형식의 전자 책을 생성하는 전자책 웹 서버를 포함하고,
상기 전자책 웹 서버는
상기 음성파일 내의 음성정보를 텍스트 정보로 변환하는 변환부;
상기 텍스트 정보 내의 단어 및 문법을 보정한 후, 사용자 단말에서 지정한 텍스트 및 레이아웃 속성정보로 보정된 텍스트 정보의 속성값을 변경하는 데이터 처리부; 및
상기 데이터 처리부에서 반영된 텍스트 정보를 HTML5 파일로 변환하는 포맷 변환부를 포함하고,
상기 데이터 처리부는
변환된 텍스트 내의 문자열의 진행방향, 배열위치, 간격, 들여쓰기, 내어쓰기에 대한 레이아웃을 설정하고, 상기 사용자 단말에서 지정한 레이아웃 설정정보를 레퍼런스로 세팅하는 레이아웃 설정부;
텍스트 및 레이아웃의 속성정보를 설정하는 속성정보 설정부;
상기 변환된 텍스트 내의 문자와 문자 간의 어법, 불필요한 동일문자의 연속성, 음성의 높낮이, 억양으로 인한 오류문자를 보정하는 텍스트 보정부;
상기 텍스트 정보를 복수 개의 텍스트 그룹으로 분리한 후, 분리된 복수 개의 텍스트 그룹 내의 단어들의 발생빈도를 추출하고, 추출된 단어들 중 발생빈도가 높은 순위의 단어가 포함된 텍스트 그룹을 선별한 후, 선별된 텍스트 그룹에 기초하여 상기 텍스트 정보의 요약 정보를 생성하는 텍스트 요약 생성부;
레이아웃 데이터를 소정의 연산과정을 통해 SVG 태그 형태로 변환하고, 변환된 결과가 반영된 HTML5 형식의 파일을 생성하는 HTML 5 파일 가공부를 포함하는 DIY 전자책 서비스 시스템.
a user terminal providing a voice file; and
After converting the voice information in the voice file into text information, processing the converted text information into an HTML5 format file, and converting the text information included in the HTML5 format file into a Scalable Vector Graphics (SVG) tag , An e-book web server for generating an e-book in an HTML5 file format by integrating the files of the HTML5 format in a page unit including the SVG (Scalable Vector Graphics) tag into one,
The e-book web server is
a conversion unit for converting voice information in the voice file into text information;
a data processing unit for correcting words and grammar in the text information, and then changing an attribute value of the corrected text information with text and layout attribute information designated by the user terminal; and
and a format conversion unit for converting the text information reflected by the data processing unit into an HTML5 file,
The data processing unit
a layout setting unit for setting a layout for the progress direction, arrangement position, spacing, indentation, and indentation of the character string in the converted text, and setting layout setting information designated by the user terminal as a reference;
an attribute information setting unit for setting attribute information of text and layout;
a text correction unit for correcting erroneous characters due to usage between characters in the converted text, unnecessary continuity of identical characters, pitch of voice, and intonation;
After dividing the text information into a plurality of text groups, the frequency of occurrence of words in the plurality of separated text groups is extracted, and a text group including a word having a high frequency of occurrence among the extracted words is selected, a text summary generator generating summary information of the text information based on the selected text group;
A DIY e-book service system including an HTML 5 file processing unit that converts layout data into SVG tag form through a predetermined operation process and generates an HTML5 format file in which the converted result is reflected.
제1항에 있어서,
상기 전자책 웹 서버는
상기 사용자 단말로 전자책 웹 가이드 플랫폼을 제공하고,
상기 전자책 웹 가이드 플랫폼은
HTML5 파일을 PDF, HWP, DOC, XLS, JPG, PNG 중 어느 하나의 전자 파일로 출력하는 것을 특징으로 하는 DIY 전자책 서비스 시스템.
According to claim 1,
The e-book web server is
To provide an e-book web guide platform to the user terminal,
The e-book web guide platform
A DIY e-book service system, characterized in that the HTML5 file is output as an electronic file of any one of PDF, HWP, DOC, XLS, JPG, and PNG.
삭제delete 삭제delete 삭제delete 삭제delete
KR1020210091759A 2021-07-13 2021-07-13 System and Method for creating customized e-books KR102429135B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210091759A KR102429135B1 (en) 2021-07-13 2021-07-13 System and Method for creating customized e-books

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210091759A KR102429135B1 (en) 2021-07-13 2021-07-13 System and Method for creating customized e-books

Publications (1)

Publication Number Publication Date
KR102429135B1 true KR102429135B1 (en) 2022-08-05

Family

ID=82826581

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210091759A KR102429135B1 (en) 2021-07-13 2021-07-13 System and Method for creating customized e-books

Country Status (1)

Country Link
KR (1) KR102429135B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102621014B1 (en) * 2023-04-18 2024-01-05 주식회사 이앤아이월드 Method and Method for Providing book production services based on artificial intelligence

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008046738A (en) * 2006-08-11 2008-02-28 Softbank Mobile Corp Life record creation system and its control method
KR20170007106A (en) * 2015-07-09 2017-01-18 주식회사 이앤아이월드 System for electronic book service
KR101808689B1 (en) 2016-05-12 2017-12-14 주식회사 솔루게이트 Learning system of speech recognition reliability

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008046738A (en) * 2006-08-11 2008-02-28 Softbank Mobile Corp Life record creation system and its control method
KR20170007106A (en) * 2015-07-09 2017-01-18 주식회사 이앤아이월드 System for electronic book service
KR101808689B1 (en) 2016-05-12 2017-12-14 주식회사 솔루게이트 Learning system of speech recognition reliability

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102621014B1 (en) * 2023-04-18 2024-01-05 주식회사 이앤아이월드 Method and Method for Providing book production services based on artificial intelligence

Similar Documents

Publication Publication Date Title
US9411790B2 (en) Systems, methods, and media for generating structured documents
CN109408783B (en) Electronic document online editing method and system
US10671251B2 (en) Interactive eReader interface generation based on synchronization of textual and audial descriptors
US8181106B2 (en) Use of overriding templates associated with customizable elements when editing a web page
US9015657B2 (en) Systems and methods for developing and delivering platform adaptive web and native application content
Cervone MathJax: a platform for mathematics on the Web
US20190243842A1 (en) Information extraction method and system
US20140258817A1 (en) Context-based visualization generation
CN104699714B (en) Book version formatted file is converted to the method and device of EPUB formatted files
US9141596B2 (en) System and method for processing markup language templates from partial input data
US20180260389A1 (en) Electronic document segmentation and relation discovery between elements for natural language processing
JP2016042349A (en) Automatic method for division into chapters and sections
JP2016518652A (en) Web page style address integration
US20130124969A1 (en) Xml editor within a wysiwyg application
KR102574306B1 (en) dynamic typesetting
KR102429135B1 (en) System and Method for creating customized e-books
JP5020352B2 (en) Named element marking device, named element marking method and computer-readable medium thereof
WO2006001392A1 (en) Document processing method and device
JP2023010805A (en) Method for training document information extraction model and extracting document information, device, electronic apparatus, storage medium and computer program
CN111143749A (en) Webpage display method, device, equipment and storage medium
CN115587075A (en) Layout file processing method and device, terminal equipment and storage medium
Wang et al. Text anchor based metric learning for small-footprint keyword spotting
US20150161085A1 (en) Natural language-aided hypertext document authoring
US10402482B2 (en) Content management system
US8990219B2 (en) Processing and publishing digital contents including encyclopedia

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant