KR20170008357A - 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 - Google Patents

크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 Download PDF

Info

Publication number
KR20170008357A
KR20170008357A KR1020150099216A KR20150099216A KR20170008357A KR 20170008357 A KR20170008357 A KR 20170008357A KR 1020150099216 A KR1020150099216 A KR 1020150099216A KR 20150099216 A KR20150099216 A KR 20150099216A KR 20170008357 A KR20170008357 A KR 20170008357A
Authority
KR
South Korea
Prior art keywords
translation
webtoon
language
sentence
translated
Prior art date
Application number
KR1020150099216A
Other languages
English (en)
Other versions
KR101709693B1 (ko
Inventor
이청호
Original Assignee
주식회사 에버트란
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 에버트란 filed Critical 주식회사 에버트란
Priority to KR1020150099216A priority Critical patent/KR101709693B1/ko
Publication of KR20170008357A publication Critical patent/KR20170008357A/ko
Application granted granted Critical
Publication of KR101709693B1 publication Critical patent/KR101709693B1/ko

Links

Images

Classifications

    • G06F17/2809
    • G06F17/2705
    • G06F17/2854
    • G06F17/289

Abstract

크라우드 소싱을 이용한 웹툰 번역 시스템 및 웹툰 번역 서버를 개시한다. 웹툰에서의 사용빈도가 일정 이상인 웹툰 용어와 웹툰 구어체 및 구어체 문장과 어구에 대한 번역 데이터 베이스를 구축하는 단계; 문서 또는 웹툰에 포함된 텍스트를 자동 번역 가능한 번역 단위(Translation Unit)로 분할하는 단계; 분할된 번역 단위 별 형태소 분석을 통해 상기 번역 단위의 언어를 감지하고, 번역 단위의 번역에 필요한 단어, 상용구를 포함하는 번역 데이터를 검색하는 단계; 검색에 의해 검색 이전에 번역 완료 된 번역 단위에 대한 기 저장된 번역 데이터가 존재하는 경우, 번역 완료된 데이터와 상기 검색을 수행한 번역 단위의 유사도를 산출하는 단계; 유사도를 기반으로 상기 번역 완료된 번역 단위를 표시하고, 구축된 데이터 베이스를 이용하여 번역 단위의 번역을 수행하는 단계; 및 번역 수행 이후, 번역 완료된 번역문장에 포함된 숫자 불일치 횟수, 번역 용어 불일치 횟수를 통해 번역문장의 품질을 점검하는 단계; 를 포함한다.

Description

크라우드 소싱을 이용한 웹툰 번역 시스템, 웹툰 언어 자동 번역 서버 및 그 방법 {System for Translating Using Crowd Sourcing, Server and Method for Web toon Language Automatic Translating}
본 발명은 웹툰언어 번역 시스템 및, 웹툰언어 자동 번역 서버 및 그 방법에 관한 것으로 구체적으로, 크라우드 소싱을 이용하여 웹툰언어를 번역하고 그 품질을 향상시키는 시스템, 서버 및 그 방법에 관한 것이다.
스마트 디바이스가 보편화되고 관련 기술이 급속도로 발전함에 따라 이를 통한 컨텐츠 산업도 함께 발전하는 추세이다. 특히, 웹툰 시장은 긴 시간에 걸쳐 점진적으로 성장해 왔지만, 스마트 폰 기술 발전에 힘입어, 기존 PC를 통해 디스플레이 되던 때보다 급진적인 발전을 거듭하고 있다.
또한, 고 품질의 웹툰이 다수 존재하고, 웹툰을 원작으로 하는 드라마 제작 등도 활발해 지고 있고, 뿐만 아니라 고 품질의 웹툰은 해외에서도 좋은 평가를 받고 있다.
국내의 고 품질의 웹툰을 성공적으로 해외에 수출하기 위해서는 웹툰에서 사용되는 언어의 주의 깊은 번역 과정이 필수적이다. 종래에는 웹툰 또는 만화 번역 과정에서 해당 웹툰 및 만화에 대한 섬세한 이해 또는 현지 문화에 대한 이해 없이 번역이 이루어져 웹툰의 재미를 반감시키고, 품질을 저하 시키는 경우도 많이 있다.
이는 종래의 자동 번역 기술이 문어체를 중심으로 개발되어 있어 의성어 및 의태어가 많이 사용되는 웹툰에서의 웹툰 언어를 번역하기가 어렵기 때문이다. 또한, 웹툰언어는 대부분이 문어체이고, 세대간의 고유언어 및 줄임말 등도 상당 수 포함하고 있어 웹툰에서 빈번히 사용되는 언어의 특성을 파악하여 웹툰 특성에 알맞게 번역하는 기술이 필요하다.
아울러, 웹툰에 대한 작품성의 섬세한 이해 및 현지 문화에 대한 이해도가 높은 번역자가 사용하는 언어 데이터를 기반으로 웹툰 번역 품질을 향상 시킬 수 있는 기술이 요구되는 실정이다.
본 발명은 상술한 바와 같은 기술적 배경에서 안출된 것으로, 웹툰에 적합한 번역 기능을 제공하는 웹툰언어 자동 번역 서버 및 그 방법과 크라우드 소싱(Crowd Sourcing)을 이용하여 고 품질의 번역을 제공할 수 있는 웹툰 번역 시스템을 제공하는 것을 목적으로 한다.
전술한 과제를 해결하기 위한 본 발명의 일 면에 따른 웹툰에서의 사용빈도가 일정 이상인 웹툰 용어와 웹툰 구어체 및 구어체 문장과 어구에 대한 번역 데이터 베이스를 구축하는 단계; 문서 또는 웹툰에 포함된 텍스트를 자동 번역 가능한 번역 단위(Translation Unit)로 분할하는 단계; 분할된 번역 단위 별 형태소 분석을 통해 번역 단위의 언어를 감지하고, 번역 단위의 번역에 필요한 단어, 상용구를 포함하는 번역 데이터를 검색하는 단계; 검색에 의해 검색 이전에 번역 완료 된 번역 단위에 대한 기 저장된 번역 데이터가 존재하는 경우, 번역 완료된 데이터와 검색을 수행한 번역 단위의 유사도를 산출하는 단계; 유사도를 기반으로 번역 완료된 번역 단위를 표시하고, 구축된 데이터 베이스를 이용하여 번역 단위의 번역을 수행하는 단계; 및 번역 수행 이후, 번역 완료된 번역문장에 포함된 숫자 불일치 횟수, 번역 용어 불일치 횟수를 통해 번역문장의 품질을 점검하는 단계; 를 포함한다.
바람직한 실시예에 있어서, 번역 단위의 번역을 수행하는 단계는 웹툰어 구문 분석 단계: 분석된 웹툰어를 대역어로 변환하는 단계; 변환된 웹툰어 대역어의 복합 명사구를 생성하는 단계; 웹툰어를 단문으로 연결하는 단계; 연결된 웹툰어를 기반으로 문어체 웹툰어를 생성하는 단계; 및 웹툰어를 문장형으로 변환하는 단계; 를 포함한다.
바람직한 실시예에 있어서, 번역 단위의 번역을 수행하는 단계는 구축된 웹툰에서의 사용빈도가 일정 이상인 웹툰 용어와 웹툰 구어체 및 구어체 문장과 어구에 대한 번역 데이터 베이스를 참조하여, 다른 사용자에 의해 번역된 문장을 참조로 번역을 수행한다.
바람직한 실시예에 있어서, 번역문장의 품질을 점검하는 단계는 수학식 1의 평가식을 통해 이루어지고,
수학식 1
Figure pat00001
수학식 1에서 n 은 문장번호, scorej 는 j 번째 전문 번역가에 의해 평가된 점수이다.
본 발명의 다른 일면에 따른 웹툰 번역 시스템은 연재 웹툰(web toon) 데이터 및 웹툰에서 사용빈도가 높은 문장, 어구 및 구어체 언어의 번역 데이터를 기 저장 하는 자동 번역 엔진 서버; 자동 번역 엔진 서버에 기 저장된 웹툰 데이터와 번역 데이터를 이용하여 특정 웹툰을 번역한 결과를 공유하는 적어도 하나의 웹툰 번역자가 소지하는 스마트 디바이스; 스마트 디바이스로부터 웹툰 번역 결과를 수집하고, 번역자 별 상기 특정 웹툰을 번역한 결과를 평가하고, 평가 결과가 일정 이상인 번역문을 웹툰에 결합하여 번역 완료된 웹툰을 생성하는 웹툰 번역 평가 서버; 를 포함한다.
바람직한 실시예에 있어서, 자동 번역 엔진 서버는 웹툰에서 사용 빈도가 높은 상용구, 구어체 문장 및 어구의 번역 데이터를 저장하는 웹툰언어 데이터 베이스; 웹툰언어의 구문 분석을 통해 형태소를 생성하고, 웹툰언어를 대역어로 변환하고, 단문을 연결하여 웹툰어 문어체 생성 이후 웹툰언어를 문장으로 변환하는 웹툰언어 처리모듈; 크라우드 소싱을 이용한 웹툰언어 번역 결과와 상기 웹툰언어 데이터 베이스를 이용하여 웹툰언어의 패턴을 분석하는 패턴 분석 모듈; 크라우드 소싱을 위한 웹 기반(Web Based)의 번역지원 모듈과 번역 평가 모듈; 을 포함한다.
바람직한 실시예에 있어서, 크라우드 소싱을 이용한 웹툰 번역 시스템은 웹툰언어 처리 모듈에 의한 상기 웹툰언어 데이터 베이스; 를 검색 및 번역자가 소지하는 스마트 디바이스와 통신하여 다른 번역자가 번역한 문장을 참고하여 웹툰어를 번역 하도록 함으로써 번역 문장의 품질을 향상시킨다.
본 발명에 따르면, 웹툰 대사와 같은 구어체 텍스트의 자동 번역을 수행 함으로써 웹툰 번역 작업의 효율성과 품질을 향상시킨다.
도 1은 본 발명의 실시예에 따른 크라우드 소싱 기반 번역 시스템을 나타낸 도면이다.
도 2는 본 발명의 실시예에 따른 자동 번역 엔진 서버를 나타낸 도면이다.
도 3은 본 발명의 실시예에 따른 자동 번역 엔진 서버의 구체적인 구성을 나타낸 도면이다.
도 4는 본 발명의 실시예에 따른 웹툰 언어 자동 번역 흐름을 나타낸 도면이다.
도 5는 본 발명의 실시예에 따른 웹툰 언어 번역 과정을 나타낸 흐름도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 용이하게 이해할 수 있도록 제공되는 것이며, 본 발명은 청구항의 기재에 의해 정의된다. 한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 또는 "포함하는(comprising)"은 언급된 구성요소, 단계, 동작 및/또는 소자 이외의 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
이제 첨부한 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 상세히 설명한다.
본 명세서에서 사용되는 ‘모듈’ 이라는 용어는 용어가 사용된 문맥에 따라서, 소프트웨어, 하드웨어 또는 그 조합을 포함할 수 있는 것으로 해석되어야 한다. 예를 들어, 소프트웨어는 기계어, 펌웨어(firmware), 임베디드코드(embedded code), 및 애플리케이션 소프트웨어일 수 있다. 또 다른 예로, 하드웨어는 회로, 프로세서, 컴퓨터, 직접 회로, 직접 회로 코어, 센서, 멤스(MEMS; Micro-Electro-Mechanical System), 수동 디바이스, 또는 그 조합일 수 있다.
도 1은 본 발명의 실시예에 따른 크라우드 소싱 기반 번역 시스템을 나타낸 도면이다.
도 1을 참조하면, 본 발명의 실시예에 따른, 크라우드 소싱기반 번역 시스템은 자동 번역 엔진 서버(100), 스마트 디바이스(1,2……n), 웹툰 번역 평가 서버(200)를 포함하여 구성될 수 있고, 실시예에 따라 웹툰 제작툴(300)을 더 포함할 수 있다.
자동 번역 엔진 서버(100)는 연재 웹툰(web toon) 데이터 및 웹툰에서 사용빈도가 높은 문장, 어구 및 구어체 언어의 번역 데이터를 저장하고, 웹툰 번역자가 소지하는 스마트 디바이스(1,2,3….n) 또는 컴퓨터를 통해 자동 번역 엔진 서버(100)에 기 저장된 웹툰 데이터와 번역 데이터를 번역자가 이용할 수 있도록 한다. 예컨대, 자동 번역 엔진 서버(100)는 여러 번역자들로부터 번역 데이터를 수집하고, 이중 고 품질의 번역 데이터를 선별하여 저장하여 저장된 번역 데이터를 여러 번역자가 이용할 수 있도록 한다.
웹툰 번역 평가 서버(300)는 번역자가 소지한 컴퓨터 또는 스마트 디바이스로부터 웹툰 번역 결과를 수집하고, 번역자 별로 특정 웹툰을 번역한 결과를 평가한다. 이후, 실시예에 따라 웹툰 번역 평가 서버(300)는 평가 결과가 일정 이상인 번역문을 웹툰에 결합하여 번역 완료된 웹툰을 생성한다.
본 발명에 따른 실시예의 특징은, 대중을 제품이나 창작물의 생산 과정에 참여시키는 크라우드 소싱(crowd sourcing)을 이용하여 웹툰 번역의 품질을 향상시키는 것으로서 웹툰 번역 평가 서버(300)는 수학식 1을 비롯한 각종 평가 알고리즘 및 수식을 이용하여 번역 결과를 평가하고 평가 수준이 높은 결과물을 웹툰에 결합하여, 실질적으로 웹툰 번역 결과의 품질을 향상 시킬 수 있도록 한다.
수학식 1
Figure pat00002
상기 수학식 1에서 n 은 문장번호, scorej 는 j 번째 전문 번역가에 의해 평가된 점수인 것을 특징으로 하지만, 번역 품질 평가 방법이 위의 수학식으로 한정되는 것은 아니다.
도 2는 본 발명의 실시예에 따른 자동 번역 엔진 서버를 나타낸 도면이다.
도 2를 참조하면, 본 발명의 실시예에 따른 자동 번역 엔진 서버(100)는 웹툰어 처리모듈(120), 웹툰언어 데이터베이스(110)패턴분석 모듈(130), 번역 지원 모듈(140) 및 번역 평가 모듈(150)을 포함하여 구성될 수 있다.
웹툰언어 데이터 베이스(110)는 웹툰에서 사용 빈도가 높은 상용구, 구어체 문장 및 어구의 번역 데이터를 저장한다. 예컨대, 웹툰 언어 데이터베이스(110)에는 웹툰 기본어, 기본 어휘, 웹툰 전문어 등의 데이터가 저장 될 수 있다.
웹툰언어 처리모듈(120)은 웹툰언어의 구문 분석을 통해 형태소를 생성하고, 웹툰언어를 대역어로 변환하고, 단문을 연결하여 웹툰어 문어체 생성 이후 웹툰언어를 문장으로 변환하는 언어 처리 및 번역 일련의 과정을 수행한다.
패턴 분석 모듈(130)은 크라우드 소싱을 이용한 웹툰언어 번역 결과와 웹툰언어 데이터 베이스를 이용하여 웹툰언어의 패턴을 분석한다.
번역 지원 모듈(140) 및 번역 평가 모듈(150)는 각 구성부 모두 웹 기반으로 크라우드 소싱을 위해 동작한다. 예컨대, 번역 지원 모듈(140)은 번역 평가 모듈(150)과 데이터를 주고 받아, 번역 평가 모듈(150)에서 번역 레벨이 높은 번역 자의 번역 결과를 임의의 번역자에게 지원하여 임의의 번역자가 고 품질의 웹툰 번역 결과를 생성하도록 한다.
실시예에 따른 크라우드 소싱 기반 번역 시스템은 웹툰 언어 처리 모듈에 의한 웹툰언어 데이터 베이스; 를 검색하거나 번역자가 소지하는 스마트 디바이스와 통신하여 다른 번역자가 번역한 문장을 참고하여 웹툰어를 번역 하도록 함으로써 번역 문장의 품질을 향상시킬 수 있다.
도 3은 본 발명의 실시예에 따른 자동 번역 엔진 서버의 구체적인 구성을 나타낸 도면이다.
도 3을 참조하면, 실시예에 따른 자동 번역 엔진 서버는 웹툰 구문 분석부(121), 웹툰 형태소 생성부(122), 웹툰어 형태소 생성부(123), 복합명사/구 생성부(124), 단문 연결부(125), 웹툰 문어체 생성부(126), 웹툰어 문장형 변환부(127)을 포함하여 구성할 수 있다.
이하, 자동 번역 엔진 서버에 포함되는 구성요소의 기능을 설명함에 있어 도 5를 함께 참조한다. 도 5는 본 발명의 실시예에 따른 웹툰 언어 번역 과정을 나타낸 흐름도이다.
웹툰 구문 분석부(121)는 웹툰에 포함된 텍스트의 구문을 언어처리 알고리즘 등을 통해 분석한다(S510).
웹툰 형태소 생성부(122)는 분석된 구문을 기반으로 언어의 의미를 부여하는 웹툰 언어의 형태소를 생성한다.
웹툰 대역어 변환부(123)는 생성된 형태소의 번역 대역어로 변환하고(S520), 복합 명사/ 구생성부(124) 이를 기반으로 웹툰 텍스트의 번역 복합 명사 및 구를 생성한다(S530). 이후, 단문 연결부(125)는 생성된 복합 명사 및 구를 단문 형태로 연결하고(S540), 웹툰 문어체 생성부(126)는 연결된 단문을 문어체의 어구로 생성한다(S550). 이후, 웹툰어 문장형 변환부(127)에서 문장 형태로 변환한다(S560).
이하에서는 본 발명에 따른 웹툰 언어 자동 번역 방법에 대해서 차례로 설명한다. 본 발명에 따른 웹툰 언어 자동 번역 방법의 작용(기능)은 크라우드 소싱을 이용한 웹툰 번역 시스템상의 기능과 본질적으로 같은 것이므로 도 1 내지 도 3와 중복되는 설명은 생략하도록 한다.
도 4는 본 발명의 실시예에 따른 웹툰 언어 자동 번역 흐름을 나타낸 도면이다.
S100 단계에서는 웹툰에서의 사용빈도가 일정 이상인 웹툰 용어와 웹툰 구어체 및 구어체 문장과 어구에 대한 번역 데이터 베이스를 구축과정을 수행한다.
S200 단계에서는 문서 또는 웹툰에 포함된 텍스트를 자동 번역 가능한 번역 단위(Translation Unit)로 분할하는 과정을 수행한다.
S300 단계에서는 분할된 번역 단위 별 형태소 분석을 통해 상기 번역 단위의 언어를 감지하고, 번역 단위의 번역에 필요한 단어, 상용구를 포함하는 번역 데이터를 검색한다.
S400 단계에서는 검색에 의해 검색 이전에 번역 완료 된 상기 번역 단위에 대한 기 저장된 번역 데이터가 존재하는 경우, 상기 번역 완료된 데이터와 상기 검색을 수행한 번역 단위의 유사도를 산출하는 과정을 수행한다.
S500 단계에서는 유사도를 기반으로 번역 완료된 번역 단위를 표시하고, 구축된 데이터 베이스를 이용하여 번역 단위의 번역을 수행한다.
S600 단계에서는 번역 수행 이후, 번역 완료된 번역문장에 포함된 숫자 불일치 횟수, 번역 용어 불일치 횟수를 통해 번역문장의 품질을 점검과정을 수행한다.
한편, 본 발명의 실시예에 따른 크라우드 소싱을 이용한 웹툰 번역 방법은 컴퓨터 시스템에서 구현되거나, 또는 기록매체에 기록될 수 있다. 컴퓨터 시스템은 적어도 하나 이상의 프로세서와, 메모리와, 사용자 입력 장치와, 데이터 통신 버스와, 사용자 출력 장치와, 저장소를 포함할 수 있다. 전술한 각각의 구성 요소는 데이터 통신 버스를 통해 데이터 통신을 한다.
컴퓨터 시스템은 네트워크에 커플링된 네트워크 인터페이스를 더 포함할 수 있다. 상기 프로세서는 중앙처리 장치(central processing unit (CPU))이거나, 혹은 메모리 및/또는 저장소(128)에 저장된 명령어를 처리하는 반도체 장치일 수 있다.
상기 메모리 및 상기 저장소는 다양한 형태의 휘발성 혹은 비휘발성 저장매체를 포함할 수 있다. 예컨대, 상기 메모리는 ROM 및 RAM을 포함할 수 있다.
따라서, 본 발명의 실시예에 따른 데이터 플로 기반 대규모 데이터 스트림 처리 방법은 컴퓨터에서 실행 가능한 방법으로 구현될 수 있다. 본 발명의 실시예에 따른 데이터 플로 기반 대규모 데이터 스트림 처리 방법이 컴퓨터 장치에서 수행될 때, 컴퓨터로 판독 가능한 명령어들이 본 발명에 따른 정렬 방법을 수행할 수 있다.
한편, 상술한 본 발명의 실시예에 따른 데이터 플로 기반 대규모 데이터 스트림 처리 방법은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체로는 컴퓨터 시스템에 의하여 해독될 수 있는 데이터가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래시 메모리, 광 데이터 저장장치 등이 있을 수 있다. 또한, 컴퓨터로 판독 가능한 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
이상 바람직한 실시예와 첨부도면을 참조하여 본 발명의 구성에 관해 구체적으로 설명하였으나, 이는 예시에 불과한 것으로 본 발명의 기술적 사상을 벗어나지 않는 범주 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 안되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.

Claims (7)

  1. 웹툰에서의 사용빈도가 일정 이상인 웹툰 용어와 웹툰 구어체 및 구어체 문장과 어구에 대한 번역 데이터 베이스를 구축하는 단계;
    문서 또는 웹툰에 포함된 텍스트를 자동 번역 가능한 번역 단위(Translation Unit)로 분할하는 단계;
    상기 분할된 번역 단위 별 형태소 분석을 통해 상기 번역 단위의 언어를 감지하고, 상기 번역 단위의 번역에 필요한 단어, 상용구를 포함하는 번역 데이터를 검색하는 단계;
    상기 검색에 의해 상기 검색 이전에 번역 완료 된 상기 번역 단위에 대한 기 저장된 번역 데이터가 존재하는 경우, 상기 번역 완료된 데이터와 상기 검색을 수행한 번역 단위의 유사도를 산출하는 단계;
    상기 유사도를 기반으로 상기 번역 완료된 번역 단위를 표시하고, 상기 구축된 데이터 베이스를 이용하여 상기 번역 단위의 번역을 수행하는 단계; 및
    상기 번역 수행 이후, 번역 완료된 번역문장에 포함된 숫자 불일치 횟수, 번역 용어 불일치 횟수를 통해 번역문장의 품질을 점검하는 단계; 를 포함하는 웹툰 언어 자동 번역 방법.
  2. 제 1항에 있어서, 상기 번역 단위의 번역을 수행하는 단계는
    웹툰어 구문 분석 단계:
    상기 분석된 웹툰어를 대역어로 변환하는 단계;
    상기 변환된 웹툰어 대역어의 복합 명사구를 생성하는 단계;
    상기 웹툰어를 단문으로 연결하는 단계;
    연결된 웹툰어를 기반으로 문어체 웹툰어를 생성하는 단계; 및
    상기 웹툰어를 문장형으로 변환하는 단계; 를 포함하는 것을 특징으로 하는 웹툰 언어 자동 번역 방법.
  3. 제 1항에 있어서, 상기 번역 단위의 번역을 수행하는 단계는
    상기 구축된 상기 웹툰에서의 사용빈도가 일정 이상인 웹툰 용어와 웹툰 구어체 및 구어체 문장과 어구에 대한 번역 데이터 베이스를 참조하여, 다른 사용자에 의해 번역된 문장을 참조로 번역을 수행하는 것을 특징으로 하는 웹툰 언어 자동 번역 방법.
  4. 제 1항에 있어서, 상기 번역문장의 품질을 점검하는 단계는
    수학식 1의 평가식을 통해 이루어지고,
    수학식 1
    Figure pat00003

    상기 수학식 1에서 n 은 문장번호, scorej 는 j 번째 전문 번역가에 의해 평가된 점수인 것을 특징으로 하는 웹툰 언어 자동 번역 방법.
  5. 연재 웹툰(web toon) 데이터 및 웹툰에서 사용빈도가 높은 문장, 어구 및 구어체 언어의 번역 데이터를 기 저장 하는 자동 번역 엔진 서버;
    상기 자동 번역 엔진 서버에 기 저장된 웹툰 데이터와 번역 데이터를 이용하여 특정 웹툰을 번역한 결과를 공유하는 적어도 하나의 웹툰 번역자가 소지하는 스마트 디바이스;
    상기 스마트 디바이스로부터 웹툰 번역 결과를 수집하고, 상기 번역자 별 상기 특정 웹툰을 번역한 결과를 평가하고, 상기 평가 결과가 일정 이상인 번역문을 웹툰에 결합하여 번역 완료된 웹툰을 생성하는 웹툰 번역 평가 서버; 를 포함하는 크라우드 소싱(crowd sourcing)을 이용한 웹툰 번역 시스템.
  6. 제 5항에 있어서, 상기 자동 번역 엔진 서버는
    웹툰에서 사용 빈도가 높은 상용구, 구어체 문장 및 어구의 번역 데이터를 저장하는 웹툰언어 데이터 베이스;
    웹툰언어의 구문 분석을 통해 형태소를 생성하고, 웹툰언어를 대역어로 변환하고, 단문을 연결하여 웹툰어 문어체 생성 이후 웹툰언어를 문장으로 변환하는 웹툰언어 처리모듈;
    크라우드 소싱을 이용한 웹툰언어 번역 결과와 상기 웹툰언어 데이터 베이스를 이용하여 웹툰언어의 패턴을 분석하는 패턴 분석 모듈; 및
    크라우드 소싱을 위한 웹 기반(Web Based)의 번역지원 모듈과 번역 평가 모듈; 을 포함하는 것을 특징으로 하는 크라우드 소싱을 이용한 웹툰 번역 시스템.
  7. 제 5 항에 있어서, 상기 크라우드 소싱을 이용한 웹툰 번역 시스템은
    상기 웹툰언어 처리 모듈에 의한 상기 웹툰언어 데이터 베이스; 를 검색 및 상기 번역자가 소지하는 스마트 디바이스와 통신하여 다른 번역자가 번역한 문장을 참고하여 웹툰어를 번역 하도록 함으로써 번역 문장의 품질을 향상시키는 것을 특징으로 하는 크라우드 소싱을 이용한 웹툰 번역 시스템.
KR1020150099216A 2015-07-13 2015-07-13 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 KR101709693B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150099216A KR101709693B1 (ko) 2015-07-13 2015-07-13 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150099216A KR101709693B1 (ko) 2015-07-13 2015-07-13 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법

Publications (2)

Publication Number Publication Date
KR20170008357A true KR20170008357A (ko) 2017-01-24
KR101709693B1 KR101709693B1 (ko) 2017-02-27

Family

ID=57993204

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150099216A KR101709693B1 (ko) 2015-07-13 2015-07-13 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법

Country Status (1)

Country Link
KR (1) KR101709693B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101854714B1 (ko) * 2017-12-28 2018-05-08 주식회사 트위그팜 번역 문서 관리 시스템 및 방법
KR20180133188A (ko) * 2017-06-05 2018-12-13 주식회사 토리웍스 모바일 웹툰 오픈 자동번역 서비스 제공 방법
KR102041935B1 (ko) * 2018-07-18 2019-12-02 주식회사 토리웍스 웹툰체 사전 서비스 제공 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200115929A (ko) 2019-03-29 2020-10-08 동서대학교 산학협력단 디지털콘텐츠에 적용하는 번역투고 시스템

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060124632A (ko) * 2003-12-15 2006-12-05 유겐가이샤 겐고기쥬츠켄큐쇼 대역 판단 장치, 방법 및 프로그램
JP2009258887A (ja) * 2008-04-15 2009-11-05 Toshiba Corp 機械翻訳装置及び機械翻訳プログラム
KR20150052400A (ko) * 2013-11-04 2015-05-14 주식회사 에버트란 번역 은행 기반의 번역 서비스 제공 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060124632A (ko) * 2003-12-15 2006-12-05 유겐가이샤 겐고기쥬츠켄큐쇼 대역 판단 장치, 방법 및 프로그램
JP2009258887A (ja) * 2008-04-15 2009-11-05 Toshiba Corp 機械翻訳装置及び機械翻訳プログラム
KR20150052400A (ko) * 2013-11-04 2015-05-14 주식회사 에버트란 번역 은행 기반의 번역 서비스 제공 시스템

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180133188A (ko) * 2017-06-05 2018-12-13 주식회사 토리웍스 모바일 웹툰 오픈 자동번역 서비스 제공 방법
KR101854714B1 (ko) * 2017-12-28 2018-05-08 주식회사 트위그팜 번역 문서 관리 시스템 및 방법
KR102041935B1 (ko) * 2018-07-18 2019-12-02 주식회사 토리웍스 웹툰체 사전 서비스 제공 방법

Also Published As

Publication number Publication date
KR101709693B1 (ko) 2017-02-27

Similar Documents

Publication Publication Date Title
US9805718B2 (en) Clarifying natural language input using targeted questions
US10672391B2 (en) Improving automatic speech recognition of multilingual named entities
US11734514B1 (en) Automated translation of subject matter specific documents
JP5901001B1 (ja) 音響言語モデルトレーニングのための方法およびデバイス
US7904291B2 (en) Communication support apparatus and computer program product for supporting communication by performing translation between languages
JP6310150B2 (ja) 意図理解装置、方法およびプログラム
KR101762866B1 (ko) 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법
US20170199867A1 (en) Dialogue control system and dialogue control method
JP5403696B2 (ja) 言語モデル生成装置、その方法及びそのプログラム
JP2006293830A (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2015026057A (ja) インタラクティブキャラクター基盤の外国語学習装置及び方法
JP2015201169A (ja) 多様な意味カテゴリに基づいた翻訳結果提供方法およびシステム
JP2009521718A (ja) 分散収集された知識を用いる自動文法生成
JP2007087397A (ja) 形態素解析プログラム、補正プログラム、形態素解析装置、補正装置、形態素解析方法および補正方法
KR101709693B1 (ko) 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법
US10223349B2 (en) Inducing and applying a subject-targeted context free grammar
US20190138270A1 (en) Training Data Optimization in a Service Computing System for Voice Enablement of Applications
US11907665B2 (en) Method and system for processing user inputs using natural language processing
EP3005152B1 (en) Systems and methods for adaptive proper name entity recognition and understanding
JP2008225963A (ja) 機械翻訳装置、置換辞書生成装置、機械翻訳方法、置換辞書生成方法、及びプログラム
KR101757222B1 (ko) 한글 문장에 대한 의역 문장 생성 방법
KR20120045906A (ko) 코퍼스 오류 교정 장치 및 그 방법
Hahn et al. Optimizing CRFs for SLU tasks in various languages using modified training criteria
JP2006024114A (ja) 機械翻訳装置および機械翻訳コンピュータプログラム
JP2001100788A (ja) 音声処理装置および音声処理方法、並びに記録媒体

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant