KR20240021426A - Webtoon Content Translation System - Google Patents

Webtoon Content Translation System Download PDF

Info

Publication number
KR20240021426A
KR20240021426A KR1020220099734A KR20220099734A KR20240021426A KR 20240021426 A KR20240021426 A KR 20240021426A KR 1020220099734 A KR1020220099734 A KR 1020220099734A KR 20220099734 A KR20220099734 A KR 20220099734A KR 20240021426 A KR20240021426 A KR 20240021426A
Authority
KR
South Korea
Prior art keywords
translation
webtoon
original
text
speech bubble
Prior art date
Application number
KR1020220099734A
Other languages
Korean (ko)
Inventor
이준형
Original Assignee
이준형
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이준형 filed Critical 이준형
Priority to KR1020220099734A priority Critical patent/KR20240021426A/en
Publication of KR20240021426A publication Critical patent/KR20240021426A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

본 발명은 웹툰 번역 시 웹툰에 포함된 이미지 색상, 텍스트대사, 표정, 효과음을 이용하여 번역 문맥, 뉘앙스, 감정선, 분위기, 개성을 반영하여 번역을 좀 더 정확하게 할 수 있는 웹툰 컨텐츠 번역 시스템에 관한 것으로, 웹툰 원본 파일을 수신하는 원본 데이터 베이스와, 상기 원본 데이터 베이스에 저장된 웹툰 원본 파일에서 이미지와 말풍선을 구분하여 말풍선을 판별하는 대사 판별부와, 상기 대사 판별부에서 판별한 말풍선 내부의 텍스트를 추출하여 해당국가 언어로 번역본을 생성하는 번역부 및 상기 대사 판별부에서 판별한 말풍선 내의 원본 텍스트의 폰트, 크기 및 자간을 상기 번역부에서 번역한 언어에 적용하는 폰트 적용부를 포함하는 것을 특징으로 한다.The present invention relates to a webtoon content translation system that can translate more accurately by reflecting the translation context, nuance, emotion, atmosphere, and personality using image colors, text dialogue, facial expressions, and sound effects included in the webtoon when translating a webtoon. , an original database that receives the original webtoon file, a dialogue discriminator that distinguishes the speech bubble from the image and the speech balloon in the webtoon original file stored in the original database, and extracts the text inside the speech bubble determined by the dialogue discriminator. It is characterized by comprising a translation unit that generates a translation in the language of the country and a font application unit that applies the font, size, and letter spacing of the original text in the speech bubble determined by the dialogue determination unit to the language translated by the translation unit.

Description

웹툰 컨텐츠 번역 시스템{Webtoon Content Translation System}Webtoon Content Translation System {Webtoon Content Translation System}

본 발명은 웹툰 컨텐츠 번역 시스템에 관한 것으로, 더욱 상세하게는, 웹툰 번역 시 웹툰에 포함된 이미지 색상, 텍스트대사, 표정, 효과음을 이용하여 번역 문맥, 뉘앙스, 감정선, 분위기, 개성을 반영하여 번역을 좀 더 정확하게 할 수 있는 웹툰 컨텐츠 번역 시스템에 관한 것이다.The present invention relates to a webtoon content translation system. More specifically, when translating a webtoon, the translation is performed by reflecting the translation context, nuance, emotion, atmosphere, and personality using the image color, text dialogue, facial expression, and sound effects included in the webtoon. It is about a webtoon content translation system that can be more accurate.

일반적으로, 번역은 한국의 수많은 콘텐츠(웹소설, 웹툰, 영상 자막)를 해외에 유통하여 외화를 벌고, 지식 부가가치 서비스로 성공하기 위해서 가장 중요한 기술이다.In general, translation is the most important skill to earn foreign currency by distributing numerous Korean contents (web novels, webtoons, video subtitles) overseas and to succeed as a knowledge-added service.

그러나 상업적 진출을 위한 번역은 전문 인력을 동원하기 때문에 매우 비용이 비싸고, 시간이 오래 걸리는 비효율적인 문제점이 있다.However, translation for commercial advancement has the problem of being very expensive, time-consuming, and inefficient because it requires specialized personnel.

콘텐츠는 번역이 필요한 텍스트 양이 매우 많고(소설의 경우 10권이면 평균 150만자), 번역 비용이 텍스트 양에 비례한다.Content requires a very large amount of text that needs to be translated (in the case of 10 novels, an average of 1.5 million characters), and the translation cost is proportional to the amount of text.

기계 번역은 매우 빠르고 대량의 번역을 수행할 수 있지만, 단순한 의미 전달이 아니라 완성도가 있는 콘텐츠/문학을 위한 자연스러운 번역이 불가능하다.Machine translation is very fast and can perform large amounts of translation, but it is not capable of natural translation for content/literature that is complete rather than simply conveying meaning.

특히, 웹툰의 번역은 색상, 말풍선의 효과음, 대사별 주요 표정 등에 따라 번역 문맥, 뉘앙스와 분위기가 많이 달라지므로 이러한 부분을 번역 시 완벽하게 반영하는 것이 불가능하다.In particular, in the translation of webtoons, the translation context, nuance, and atmosphere vary greatly depending on the color, sound effects of speech bubbles, and main facial expressions for each line, so it is impossible to perfectly reflect these aspects when translating.

웹툰 콘텐츠 분야는 불법 도용, 유통에 매우 피해가 큰 분야인데 이러한 배경 때문에 출판사 등 저작권자는 해외 진출 사업에 있어서 원본 콘텐츠의 외부 반출 및 관리에 대해 고려해야할 리스크가 많다는 특성이 있다.The field of webtoon content is very vulnerable to illegal theft and distribution, and due to this background, copyright holders such as publishers have many risks to consider regarding external export and management of original content when expanding overseas.

또한, 웹툰 콘텐츠 분야는 이미 번역의 대상인 텍스트대사가 비트맵 이미지에 동일한 비트맵 정보로 매몰되어 있어, 전통적인 번역 방법은 1) 수동으로 화면에서 글자를 드래그하여 추출하고, 2) 별도로 번역을 진행한 후, 3) 다시 수동으로 디자이너가 비트맵 이미지에 텍스트대사를 하나씩 씌우는 접근을 취하고 있어 실무적인 번역에 요구되는 시간과 요구 비용이 매우 높은 편이다.In addition, in the field of webtoon content, the text dialogue that is the subject of translation is already buried in the bitmap image with the same bitmap information, so the traditional translation method is 1) manually extracting the letters by dragging them on the screen, and 2) performing the translation separately. 3) Again, the designer takes the approach of manually writing text lines onto bitmap images one by one, so the time and cost required for practical translation are very high.

양질의 한국 콘텐츠를 신속하게 번역하여 해외로 수출하는데 번역이 걸림돌이 되고 있다.Translation is becoming an obstacle to quickly translating and exporting high-quality Korean content overseas.

대한민국 등록특허공보 제10-1099196호Republic of Korea Patent Publication No. 10-1099196

본 발명은 상기한 문제점을 해결하기 위하여 안출된 것으로, 본 발명의 목적은 웹툰 번역 시 웹툰에 포함된 이미지 색상, 텍스트대사, 표정, 효과음을 이용하여 번역 문맥, 뉘앙스, 감정선, 분위기, 개성을 반영하여 번역을 좀 더 정확하게 할 수 있는 웹툰 컨텐츠 번역 시스템을 제공하는 것이다.The present invention was created to solve the above problems, and the purpose of the present invention is to reflect the translation context, nuance, emotion, atmosphere, and personality by using the image color, text dialogue, facial expression, and sound effects included in the webtoon when translating a webtoon. This provides a webtoon content translation system that allows for more accurate translation.

본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 본 발명의 기술분야에서 통상의 지식을 지닌 자에게 명확하게 이해될 수 있을 것이다.The objects of the present invention are not limited to the objects mentioned above, and other objects not mentioned will be clearly understood by those skilled in the art from the description below.

본 발명은 상기의 목적을 달성하기 위해서, 웹툰 원본 파일을 수신하는 원본 데이터 베이스와, 상기 원본 데이터 베이스에 저장된 웹툰 원본 파일에서 이미지와 말풍선을 구분하여 말풍선을 판별하는 대사 판별부와, 상기 대사 판별부에서 판별한 말풍선 내부의 텍스트를 추출하여 해당국가 언어로 번역본을 생성하는 번역부 및 상기 대사 판별부에서 판별한 말풍선 내의 원본 텍스트의 폰트, 크기 및 자간을 상기 번역부에서 번역한 언어에 적용하는 폰트 적용부를 포함하는 것을 특징으로 한다.In order to achieve the above object, the present invention includes an original database that receives a webtoon original file, a dialogue determination unit that distinguishes a speech bubble from an image and a speech balloon in the webtoon original file stored in the original database, and the dialogue discriminator. A translation unit that extracts the text inside the speech bubble determined by the department and creates a translated version in the language of the corresponding country, and a translation unit that applies the font, size, and spacing of the original text in the speech bubble determined by the dialogue determination unit to the language translated by the translation unit. It is characterized by including a font application unit.

또한, 상기 번역부는 상기 대사 판별부에서 판별한 말풍선 내부의 텍스트를 추출하여 텍스트를 해당 국가의 언어 텍스트로 번역하는 초벌 번역본을 생성하는 초벌 번역 모듈과, 상기 원본 데이터 베이스에서 수신한 웹툰 원본 파일에서 웹툰의 장르 정보, 이미지 정보 및 시대 정보 중 적어도 하나 이상을 포함하는 기본정보를 추출하는 추출 모듈과, 상기 추출 모듈에서 추출한 웹툰 원본 파일의 기본정보에 대응하여 상기 초벌 번역 모듈에서 번역한 초벌 번역본에 뉘앙스, 감정선, 분위기 및 개성을 포함하는 문맥을 반영하여 번역한 문맥 번역본을 생성하는 문맥 번역 모듈을 포함하는 것을 특징으로 한다.In addition, the translation unit includes a rough translation module that extracts the text inside the speech bubble determined by the dialogue determination unit and generates a rough translation that translates the text into the language text of the corresponding country, and the webtoon original file received from the original database. An extraction module for extracting basic information including at least one of genre information, image information, and era information of a webtoon, and a rough translation translated by the rough translation module in response to the basic information of the webtoon original file extracted by the extraction module. It is characterized by including a context translation module that generates a translated context translation reflecting the context including nuance, emotion, mood, and personality.

또한, 상기 폰트 적용부는 상기 웹툰 원본 파일에서 말풍선에 포함된 텍스트의 글자수와 상기 번역부에의 번역본의 글자수를 비교하여 글자크기를 변경하여 상기 말풍선 내에 삽입되도록 적용하는 것을 특징으로 한다.In addition, the font application unit is characterized in that it compares the number of characters of the text included in the speech bubble in the webtoon original file with the number of characters in the translated version of the translation unit, changes the font size, and applies it to be inserted into the speech bubble.

본 발명은 대사 판별부를 통해 말풍선을 판별하고, 말풍선 내에 입력된 텍스트를 번역부에서 번역하며, 번역된 텍스트를 텍스트의 폰트, 크기 및 자간을 적용하여 기존의 웹툰에 적용하여 기존의 이미지를 변경하지 않고 정확하게 번역할 수 있는 효과를 제공한다.The present invention determines a speech bubble through a dialogue determination unit, translates the text entered in the speech bubble in a translation unit, and applies the translated text to an existing webtoon by applying the font, size, and spacing of the text, without changing the existing image. It provides the effect of accurately translating without any hassle.

또한, 추출 모듈에서 웹툰의 기본정보를 추출하여 추출된 웹툰의 기본정보를 기준으로 문맥 번역부에서 추가로 뉘앙스, 감정선, 분위기 및 개성에 맞게 번역하여 웹툰의 성격에 맞게 번역하여 정확한 번역을 제공할 수 있는 효과를 제공한다.In addition, the basic information of the webtoon is extracted from the extraction module, and based on the extracted basic information of the webtoon, the context translation department translates it according to the nuance, emotion, atmosphere, and personality to provide an accurate translation by translating to suit the nature of the webtoon. Provides an effect that can be achieved.

도 1은 본 발명의 바람직한 일실시예에 따른 웹툰 컨텐츠 번역 시스템을 나타낸 구성도이다.
도 2는 본 발명의 바람직한 일실시예에 따른 번역부를 나타낸 구성도이다.
도 3은 본 발명의 바람직한 일실시예에 따른 웹툰 컨텐츠 번역 시스템을 나타낸 순서도이다.
1 is a configuration diagram showing a webtoon content translation system according to a preferred embodiment of the present invention.
Figure 2 is a configuration diagram showing a translation unit according to a preferred embodiment of the present invention.
Figure 3 is a flowchart showing a webtoon content translation system according to a preferred embodiment of the present invention.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. The advantages and features of the present invention and methods for achieving them will become clear by referring to the embodiments described in detail below along with the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below and will be implemented in various different forms. The present embodiments only serve to ensure that the disclosure of the present invention is complete and that common knowledge in the technical field to which the present invention pertains is not limited. It is provided to fully inform those who have the scope of the invention, and the present invention is only defined by the scope of the claims.

아래 첨부된 도면을 참조하여 본 발명의 실시를 위한 구체적인 내용을 상세히 설명한다. 도면에 관계없이 동일한 부재번호는 동일한 구성요소를 지칭하며, "및/또는"은 언급된 아이템들의 각각 및 하나 이상의 모든 조합을 포함한다.Specific details for implementing the present invention will be described in detail with reference to the drawings attached below. Regardless of the drawings, like reference numerals refer to like elements, and “and/or” includes each and all combinations of one or more of the mentioned items.

비록 제1, 제2 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도있음은 물론이다. Although first, second, etc. are used to describe various components, these components are, of course, not limited by these terms. These terms are merely used to distinguish one component from another. Therefore, of course, the first component mentioned below may also be the second component within the technical spirit of the present invention.

본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며, 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다.The terminology used herein is for describing embodiments and is not intended to limit the invention. As used herein, singular forms also include plural forms, unless specifically stated otherwise in the context. As used in the specification, “comprises” and/or “comprising” does not exclude the presence or addition of one or more other elements in addition to the mentioned elements.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.Unless otherwise defined, all terms (including technical and scientific terms) used in this specification may be used with meanings that can be commonly understood by those skilled in the art to which the present invention pertains. Additionally, terms defined in commonly used dictionaries are not interpreted ideally or excessively unless clearly specifically defined.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the attached drawings.

도 1은 본 발명의 바람직한 일실시예에 따른 웹툰 컨텐츠 번역 시스템을 나타낸 구성도이고, 도 2는 본 발명의 바람직한 일실시예에 따른 번역부를 나타낸 구성도이며, 도 3은 본 발명의 바람직한 일실시예에 따른 웹툰 컨텐츠 번역 시스템을 나타낸 순서도이다.Figure 1 is a configuration diagram showing a webtoon content translation system according to a preferred embodiment of the present invention, Figure 2 is a configuration diagram showing a translation unit according to a preferred embodiment of the present invention, and Figure 3 is a preferred embodiment of the present invention. This is a flowchart showing the webtoon content translation system according to an example.

도 1 내지 도 3에 도시된 바와 같이, 본 발명의 웹툰 컨텐츠 번역 시스템(1000)은 원본 데이터 베이스(100), 대사 판별부(200), 번역부(300) 및 폰트 적용부(400)를 포함하여 구성된다.As shown in Figures 1 to 3, the webtoon content translation system 1000 of the present invention includes an original database 100, a dialogue determination unit 200, a translation unit 300, and a font application unit 400. It is composed by:

먼저, 상기 원본 데이터 베이스(100)는 웹툰 원본 파일을 수신하는 구성으로, 출판사 또는 저작권자가 업로드한 콘텐츠 원본 파일을 수신하여 저장하게 된다.First, the original database 100 is configured to receive webtoon original files, and receives and stores content original files uploaded by publishers or copyright holders.

이때, 상기 원본 데이터 베이스(100)에 저장되는 콘텐츠 원본 파일은 암호화되어 저장될 수 있으며, 이미지와 텍스트를 구분하여 저장될 수 있다.At this time, the content original file stored in the original database 100 may be encrypted and stored, and images and text may be separated from each other.

여기서, 상기 원본 데이터 베이스(100)는 내장된 OCR 엔진에 의해서 웹툰의 원본 언어 구조 및 위치 좌료를 인식 및 추출하여 저장한다.Here, the original database 100 recognizes, extracts, and stores the original language structure and location of the webtoon using a built-in OCR engine.

다음으로, 상기 대사 판별부(200)는 상기 원본 데이터 베이스(100)에 저장된 웹툰 원본 파일에서 이미지와 말풍선을 구분하여 말풍선을 판별한다.Next, the dialogue determination unit 200 distinguishes between images and speech balloons in the original webtoon file stored in the original database 100 and determines the speech balloon.

여기서, 상기 대사 판별부(200)는 말풍선 내의 대사들을 판별하고, 상기 번역부(300)에서 상기 대사 판별부(200)에서 판별한 말풍선 내부의 텍스트를 추출하여 해당국가 언어로 번역본을 생성하게 된다.Here, the dialogue determination unit 200 determines the dialogue within the speech bubble, and the translation unit 300 extracts the text inside the speech bubble identified by the dialogue determination unit 200 to generate a translation in the language of the corresponding country. .

보다 상세하게는, 상기 번역부(300)는 초벌 번역 모듈(310)과, 추출 모듈(320) 및 문맥 번역 모듈(330)을 포함하여 구성된다.More specifically, the translation unit 300 includes a rough translation module 310, an extraction module 320, and a context translation module 330.

먼저, 상기 초벌 번역 모듈(310)은 상기 대사 판별부(200)에서 판별한 말풍선 내부의 텍스트를 추출하여 텍스트를 해당 국가의 언어 텍스트로 번역하는 초벌 번역본을 생성한다.First, the rough translation module 310 extracts the text inside the speech bubble determined by the dialogue determination unit 200 and generates a rough translation that translates the text into the language text of the corresponding country.

여기서, 상기 초벌 번역 모듈(310)은 번역하는 다양한 원본 파일은, 저장된 날짜, 매출 또는 중요 순위에 따라 우선 순위를 지정할 수 있다.Here, the rough translation module 310 can prioritize the various original files being translated according to saved date, sales, or priority.

그리고 상기 초벌 번역 모듈(310)은 웹툰 원본 파일에서 대사의 위치 정보를 별도로 저장하고 있으므로, 후술할 문맥 번역 모듈(330)에서 이를 활용하여 문맥 번역본을 삽입하도록 한다.And since the rough translation module 310 separately stores the location information of the lines in the webtoon original file, the context translation module 330, which will be described later, uses this to insert the context translation.

또한, 상기 초벌 번역 모듈(310)은 상기 웹툰 원본 파일의 텍스트를 기계적으로 번역하여 1차 번역을 수행하게 된다.In addition, the rough translation module 310 mechanically translates the text of the original webtoon file and performs the first translation.

다음으로, 추출 모듈(320)은 상기 원본 데이터 베이스(100)에서 수신한 웹툰 원본 파일에서 웹툰의 장르 정보, 이미지 정보 및 시대 정보 중 적어도 하나 이상을 포함하는 기본정보를 추출하는 구성이다.Next, the extraction module 320 is configured to extract basic information including at least one of genre information, image information, and era information of the webtoon from the webtoon original file received from the original database 100.

여기서, 상기 추출 모듈(320)은 상기 웹툰 원본 파일의 기본 정보를 추출하여, 장르 등을 확정짓도록 한다.Here, the extraction module 320 extracts basic information of the webtoon original file and determines the genre, etc.

이때, 웹툰 원본 파일이 사극인 경우, 후술할 문맥 번역본에서 사극에 대응되는 대사로 번역하게 되고, 로맨스인 경우, 로맨스에 대응되는 대사로 번역하게 된다.At this time, if the original webtoon file is a historical drama, it is translated into lines corresponding to the historical drama in the context translation, which will be described later, and if it is a romance, it is translated into lines corresponding to the romance.

또한, 로맨스인 경우에도, 시대적 배경을 파악하여 그 시대에 사용되는 단어들을 선택하여 번역을 수행할 수 있도록 기본정보를 습득할 수 있게 된다.In addition, even in the case of romance, it is possible to obtain basic information so that the translation can be performed by understanding the historical background and selecting words used in that era.

다음으로, 상기 문맥 번역 모듈(330)은 상기 추출 모듈(320)에서 추출한 웹툰 원본 파일의 기본정보에 대응하여 상기 초벌 번역 모듈(310)에서 번역한 초벌 번역본에 뉘앙스, 감정선, 분위기 및 개성을 포함하는 문맥을 반영하여 번역한 문맥 번역본을 생성할 수 있다.Next, the context translation module 330 includes nuance, emotion, atmosphere, and personality in the rough translation translated by the rough translation module 310 in response to the basic information of the original webtoon file extracted by the extraction module 320. You can create a translated context that reflects the context.

이때, 상기 문맥 번역 모듈(330)에서 번역되는 문맥 번역본은 감정 정보(기쁨, 분노, 슬픔, 혐오, 중립, 수치 등)를 장르, 이미지 및 시대 정보에 대응되도록 번역하여 이미지와의 이질감이 들지 않도록 번역할 수 있게 된다.At this time, the context translation translated by the context translation module 330 translates emotional information (joy, anger, sadness, disgust, neutrality, shame, etc.) to correspond to genre, image, and era information so that there is no sense of heterogeneity with the image. It becomes possible to translate.

또한, 상기 문맥 번역 모듈(330)은 상기 웹툰 원본 파일의 작가가 기제작한 웹툰이 있을 경우, 기제작한 웹툰에서 사용한 텍스트의 문맥에 일부 가중치를 설정하여 문맥 번역본을 생성하게 된다.Additionally, if there is a webtoon already created by the author of the original webtoon file, the context translation module 330 sets some weights on the context of the text used in the already produced webtoon to generate a context translation.

상세하게는, 상기 웹툰의 제작자가 주로 사용하는 단어, 언어의 흐름 등을 참고하여 상기 문맥 번역본에 일정 가중치를 제공하여 번역할 수 있게 된다.In detail, the translation can be done by providing a certain weight to the context translation by referring to the words and language flow mainly used by the creator of the webtoon.

다음으로, 상기 폰트 적용부(400)는 상기 대사 판별부(200)에서 판별한 말풍선 내의 원본 텍스트의 폰트, 크기 및 자간을 상기 번역부에서 번역한 언어에 적용하는 구성이다.Next, the font application unit 400 is configured to apply the font, size, and spacing of the original text in the speech bubble determined by the dialogue determination unit 200 to the language translated by the translation unit.

보다 상세하게는, 상기 폰트 적용부(400)는 상기 웹툰 원본 파일에서 말풍선에 포함된 텍스트의 글자수와 상기 번역부에의 번역본의 글자수를 비교하여 글자크기를 변경하여 상기 말풍선 내에 삽입되도록 적용할 수 있다.More specifically, the font application unit 400 compares the number of characters of the text included in the speech bubble in the webtoon original file with the number of characters of the translated version in the translation unit, changes the font size, and applies it to be inserted into the speech bubble. can do.

이상과 첨부된 도면을 참조하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해되어야 한다. Although embodiments of the present invention have been described with reference to the above and the attached drawings, those skilled in the art will understand that the present invention can be implemented in other specific forms without changing the technical idea or essential features. You will understand that it exists. Therefore, the embodiments described above should be understood in all respects as illustrative and not restrictive.

1000 : 웹툰 컨텐츠 번역 시스템
100 : 원본 데이터 베이스
200 : 대사 판별부
300 : 번역부
400 : 폰트 적용부
1000: Webtoon content translation system
100: Original database
200: Ambassador determination unit
300: Translation Department
400: Font application part

Claims (3)

웹툰 원본 파일을 수신하는 원본 데이터 베이스;
상기 원본 데이터 베이스에 저장된 웹툰 원본 파일에서 이미지와 말풍선을 구분하여 말풍선을 판별하는 대사 판별부;
상기 대사 판별부에서 판별한 말풍선 내부의 텍스트를 추출하여 해당국가 언어로 번역본을 생성하는 번역부; 및
상기 대사 판별부에서 판별한 말풍선 내의 원본 텍스트의 폰트, 크기 및 자간을 상기 번역부에서 번역한 언어에 적용하는 폰트 적용부;를 포함하는 것을 특징으로 하는 웹툰 컨텐츠 번역 시스템.
An original database that receives webtoon original files;
a dialogue determination unit that determines a speech bubble by distinguishing between an image and a speech balloon in the original webtoon file stored in the original database;
a translation unit that extracts the text inside the speech bubble determined by the dialogue determination unit and generates a translated version in the language of the corresponding country; and
A webtoon content translation system comprising a font application unit that applies the font, size, and letter spacing of the original text in the speech bubble determined by the dialogue determination unit to the language translated by the translation unit.
제 1 항에 있어서,
상기 번역부는,
상기 대사 판별부에서 판별한 말풍선 내부의 텍스트를 추출하여 텍스트를 해당 국가의 언어 텍스트로 번역하는 초벌 번역본을 생성하는 초벌 번역 모듈과,
상기 원본 데이터 베이스에서 수신한 웹툰 원본 파일에서 웹툰의 장르 정보, 이미지 정보 및 시대 정보 중 적어도 하나 이상을 포함하는 기본정보를 추출하는 추출 모듈과,
상기 추출 모듈에서 추출한 웹툰 원본 파일의 기본정보에 대응하여 상기 초벌 번역 모듈에서 번역한 초벌 번역본에 뉘앙스, 감정선, 분위기 및 개성을 포함하는 문맥을 반영하여 번역한 문맥 번역본을 생성하는 문맥 번역 모듈을 포함하는 것을 특징으로 하는 웹툰 컨텐츠 번역 시스템.
According to claim 1,
The translation department,
A rough translation module that generates a rough translation that extracts the text inside the speech bubble determined by the speech determination unit and translates the text into the language text of the corresponding country;
An extraction module for extracting basic information including at least one of webtoon genre information, image information, and era information from the webtoon original file received from the original database;
Contains a context translation module that generates a translated context translation by reflecting the context, including nuance, emotion, atmosphere, and personality, in the rough translation translated by the rough translation module in response to the basic information of the webtoon original file extracted from the extraction module. A webtoon content translation system characterized by:
제 1 항에 있어서,
상기 폰트 적용부는,
상기 웹툰 원본 파일에서 말풍선에 포함된 텍스트의 글자수와 상기 번역부에의 번역본의 글자수를 비교하여 글자크기를 변경하여 상기 말풍선 내에 삽입되도록 적용하는 것을 특징으로 하는 웹툰 컨텐츠 번역 시스템.
According to claim 1,
The font application part is,
A webtoon content translation system, characterized in that the number of characters of the text included in the speech bubble in the webtoon original file is compared with the number of characters in the translated version of the translation unit, and the font size is changed and applied to be inserted into the speech bubble.
KR1020220099734A 2022-08-10 2022-08-10 Webtoon Content Translation System KR20240021426A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220099734A KR20240021426A (en) 2022-08-10 2022-08-10 Webtoon Content Translation System

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220099734A KR20240021426A (en) 2022-08-10 2022-08-10 Webtoon Content Translation System

Publications (1)

Publication Number Publication Date
KR20240021426A true KR20240021426A (en) 2024-02-19

Family

ID=90055856

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220099734A KR20240021426A (en) 2022-08-10 2022-08-10 Webtoon Content Translation System

Country Status (1)

Country Link
KR (1) KR20240021426A (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101099196B1 (en) 2003-06-20 2011-12-27 마이크로소프트 코포레이션 adaptive machine translation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101099196B1 (en) 2003-06-20 2011-12-27 마이크로소프트 코포레이션 adaptive machine translation

Similar Documents

Publication Publication Date Title
US10489682B1 (en) Optical character recognition employing deep learning with machine generated training data
US20190325626A1 (en) Graphic design system for dynamic content generation
US8494280B2 (en) Automated method for extracting highlighted regions in scanned source
JP5623079B2 (en) Automatic generation of form definitions from hardcopy forms
CN103914443B (en) A kind of mixing method and device of multilingual words
US9384389B1 (en) Detecting errors in recognized text
CN110889402A (en) Business license content identification method and system based on deep learning
FR2691819A1 (en) Computer based typesetting system - uses processor to operate on indexed fonts in memory taking account of context
EP1875374A1 (en) Comparison of documents containing graphic elements
US9286526B1 (en) Cohort-based learning from user edits
US6330073B1 (en) System and method for merging multi-platform documents
JP5446877B2 (en) Structure identification device
CN106815253A (en) A kind of method for digging based on mixed data type data
JP2018120286A (en) Advertisement creation support program, device, and method
CN109685061A (en) The recognition methods of mathematical formulae suitable for structuring
KR20240021426A (en) Webtoon Content Translation System
KR20240021428A (en) Automatic Webtoon Translation System
Bień The IMPACT project Polish Ground-Truth texts as a DjVu corpus
JP5928733B2 (en) Method for automatically generating test data consisting of character strings, method for identifying signatures embedded in test data consisting of character strings, and their computers and computer programs
KR102406098B1 (en) Image Specialized Translation Editing System via Quadruple Palette Data
Li et al. Numerical Simulation Technology Study on Automatic Translation of Foreign Language Images Based on Tesseract-ORC
CN104866607B (en) A kind of Dongba character textual research and explain database building method
KR20230104493A (en) Method, Apparatus and System for Converting Image Adaptively
CN104981819A (en) Character recognition system, character recognition program and character recognition method
Yamazaki et al. A handwritten Japanese historical kana reprint support system: Development of a graphical user interface