KR20230055776A

KR20230055776A - 콘텐츠 번역 시스템

Info

Publication number: KR20230055776A
Application number: KR1020210139555A
Authority: KR
Inventors: 안민준; 곽병곤; 최준영
Original assignee: 안민준; 곽병곤; 최준영
Priority date: 2021-10-19
Filing date: 2021-10-19
Publication date: 2023-04-26

Abstract

본 발명은 콘텐츠 번역 시스템에 관한 것으로, 보다 상세하게는 인터넷에 업로드된 콘텐츠에서 배경 텍스트를 번역하고, 번역된 글자를 콘텐츠에 삽입해서 플랫폼에 게시하는 콘텐츠 번역 시스템에 관한 것이다.

Description

콘텐츠 번역 시스템{CONTENT TRANSLATION SYSTEM}

본 발명 콘텐츠 번역 시스템에 관련된 종래 기술을 예로 들면, 특허문헌 1 웹툰의 다국어 지원 시스템 및 방법은 웹툰 이용자의 사용 언어 정보를 자동으로 획득하여 해당 언어로 번역되고 해당 언어에 최적화된 제책 방으로 변경된 웹툰을 자동으로 서비스한다.

또한, 특허문헌 2 모바일 웹툰 오픈 자동번역 서비스 제공 방법은 인공지능 번역기술을 활용하여 미리 초벌 번역한 자동번역 데이터를 해당 클라이언트에게 제공함으로써 다수의 불특정 번역가들이 완성도 높은 번역데이터의 생성에 주력할 수 있다.

그러나 종래 콘텐츠 번역 시스템은 본 발명과 같이, 콘텐츠에 포함된 텍스트를 원활하게 추출하지 못하고, 번역 품질이 높지 못해 외국에서 자국의 콘텐츠를 본래의 작품 의도대로 감상하지 못하는 문제점이 있다.

공개특허공보 제10-2016-0069281호 웹툰의 다국어 지원 시스템 및 방법 등록특허공보 제10-1986977호 모바일 웹툰 오픈 자동번역 서비스 제공 방법

본 발명은 콘텐츠에 포함된 텍스트를 추출하고, 다른 언어로 번역해서 배포하는 콘텐츠 번역 시스템을 제공하는 것을 목적으로 한다.

또한, 본 발명은 텍스트 추출 성능을 높이고, 번역 품질을 높여 외국에 콘텐츠를 그 나라의 언어로 완성도 있게 배포하는 콘텐츠 번역 시스템을 제공하는 것을 또 다른 목적으로 한다.

본 발명의 바람직한 콘텐츠 번역 시스템은, 원본 웹툰 이미지에서 문자가 있는 부분을 추출하고, 추출된 부분에서 텍스트 형태로 추출하는 OCR(Optical Character Recognition) 인공지능(S12); 상기 OCR 인공지능(S12)에 의해 추출된 텍스트가 번역된 텍스트에 대해 사용자와 작가의 피드백을 통해 데이터셋을 수집하는 웹툰 번역 부분(S13); 플랫폼에 번역된 웹툰을 배포하여 독자에게 서비스하고, 독자의 피드백을 통해 번역 오류를 수정하는 웹툰 배포 부분(S14); 상기 웹툰 번역 부분(S13)과 상기 웹툰 배포 부분(S14)에서 수집된 학습 데이터(S15); 및 상기 수집된 학습 데이터(S15)로 상기 OCR 인공지능(S12)을 재학습시키는 재학습 부분(S16);을 포함하는 것을 특징으로 한다.

또한, 상기 OCR 인공지능(S12)은, 원본 웹툰 이미지에서 마스킹 데이터를 생성하는 세그멘테이션 모델; 상기 원본 웹툰 이미지에서 상기 마스킹 데이터를 삭제하고 주위 데이터를 복원하고, 텍스트 교차 이미지를 생성하는 인페인트 모델; 상기 텍스트 교차 이미지에 상기 원본 웹툰 이미지 픽셀 중 텍스트가 있는 부분의 바운딩 박스를 회귀 분석하여 3차원 텐서 형태로 나타내는 디텍션 모델; 및 상기 바운딩 박스에서 해당하는 텍스트를 추출하여 텍스트 형태로 반환하는 레커그니션 모델;을 포함하는 것을 특징으로 한다.

또한, 상기 웹툰 번역 부분(S13)에서 데이터 수정은, 세그멘테이션 모델/픽셀 비교 후 마스킹 추출(S23)에서 상기 마스킹 데이터에 대해 데이터 수정이 가능하고, 상기 디텍션 모델(S26)에서 상기 바운딩 박스에 대해 데이터 수정이 가능하고, 상기 레커그니션 모델(S27)에서 추출된 텍스트에 대해 데이터 수정이 가능하고, 번역 모델(S28)에서 번역된 텍스트에 대해 데이터 수정이 가능한 것을 특징으로 한다.

또한, 상기 웹툰 배포 부분(S14)에서 콘텐츠 배포는, 사용자가 플랫폼에 업로드된 콘텐츠 중 하나인 웹툰을 이용하도록 서비스하는 웹툰 이용(S41); 사용자가 플랫폼에서 콘텐츠를 이용 중 콘텐츠에 포함된 텍스트의 번역 오류를 발견하면 콘텐츠 번역 시스템에 번역 오류 발견을 알리고, 콘텐츠 번역 시스템은 번역 오류 발견을 감지하는 번역 오류 발견(S42); 콘텐츠 번역 시스템의 수정 모드에서 번역된 텍스트, 추출된 텍스트, 바운딩 박스, 마스킹 데이터에 대해 수정 제안을 입력하도록 인터페이스를 제공하는 사용자 수정 제안(S44); 및 상기 사용자 수정 제안(S44)에서 입력된 수정 제안에 대해 수정 검토 후 콘텐츠에 반영하는 수정 검토 후 반영(S45);을 포함하는 것을 특징으로 한다.

또한, 상기 웹툰 배포 부분(S14)에서 수정 제안은, 콘텐츠 번역 시스템에서 수정 제안이 시작되는 수정 시작(S51); 수정 제안된 마스킹 데이터, 바운딩 박스, 추출된 텍스트, 번역된 텍스트를 확인하는 정보 확인(S52); 상기 정보 확인(S52)된 마스킹 데이터, 바운딩 박스, 추출된 텍스트, 번역된 텍스트에 대해 오류를 수정하는 오류 수정(S53); 상기 오류 수정(S53)된 마스킹 데이터, 바운딩 박스, 추출된 텍스트, 번역된 텍스트를 저장하는 데이터 저장(S54); 상기 데이터 저장(S54)된 번역 수정안에 대해 제안안을 평가하는 제안안 평가(S55); 상기 제안안 평가(S55)에서 전문가 수정을 처리하는 전문가 수정(S561); 상기 제안안 평가(S55)에서 사용자 평가를 처리하는 사용자 평가(S562); 상기 전문가 수정(S561)과 상기 사용자 평가(S562)를 거친 수정안에 대해 적합성을 확인하는 적합성 확인(S57); 상기 적합성 확인(S57)에서 참인 결과에 대해 수정안을 반영하고, 사용자 인센티브(S59)를 부여하는 수정 반영(S581); 및 상기 적합성 확인(S57)에서 거짓인 결과에 대해 수정안을 폐기하는 데이터 폐기(S582);를 포함하는 것을 특징으로 한다.

또한, 상기 재학습 부분(S16)은, 상기 수집된 학습 데이터(S15)에 대해 에러 계산(S61); 상기 에러 계산(S61)에 대한 손실 계산(S62); 상기 손실 계산(S62)에 대한 손실 가중합 계산(S63); 상기 손실 가중합 계산(S63)이 최소화하도록 인공지능 모델을 학습시키는 그라디언트 디센트(S64); 및 상기 그라디언트 디센트(S64) 계산된 인공지능 모델을 배포하는 모델 배포(S65);를 포함하는 것을 특징으로 한다.

또한, 콘텐츠 번역 시스템은, 콘텐츠 번역 시스템(10)의 디스플레이에 표시된 킷값을 입력하고, 사용자 정보와 함께 인증 서버(40)로 전송하고, 킷값과 사용자 정보를 이용하여 컴퓨터(10)에 탑재된 콘텐츠 번역 시스템의 인증을 인증 서버(40)에 요청하는 스마트폰(20); 및 상기 콘텐츠 번역 시스템(10)으로부터 킷값을 수신하고, 상기 스마트폰(20)으로부터 킷값과 사용자 정보를 수신하여 상기 스마트폰(20)의 킷값과 사용자 정보를 비교하고, 사용자 정보를 대응시켜 상기 스마트폰(20)의 콘텐츠 번역 시스템 이용에 대한 인증을 처리하고, 인증 결과를 상기 스마트폰(20)으로 전송하여 콘텐츠 번역 시스템에 대한 사용자의 사용을 허가하는 인증 서버(40);를 더 포함하는 것을 특징으로 한다.

본 발명은 콘텐츠에 포함된 텍스트를 추출하고, 다른 언어로 번역해서 배포함으로써 자국에서 유통되는 콘텐츠를 외국에서도 본래의 작품 의도대로 감상하는 효과를 가질 수 있다.

또한, 본 발명은 텍스트 추출 성능을 높이고, 번역 품질을 높임으로써 외국에 콘텐츠를 그 나라의 언어로 완성도 있게 배포하는 효과를 가질 수 있다.

도 1은 본 발명 콘텐츠 번역 시스템의 개요도이다.
도 2는 도 1의 콘텐츠 번역 시스템의 상세 구성을 보인 예시도이다.
도 3은 도 2의 콘텐츠 번역 시스템의 데이터 수정 구성을 보인 예시도이다.
도 4는 도 1의 콘텐츠 번역 시스템의 콘텐츠 배포 구성을 보인 예시도이다.
도 5는 도 1의 콘텐츠 번역 시스템의 수정 제안 구성을 보인 예시도이다.
도 6은 도 1의 콘텐츠 번역 시스템의 재학습 구성을 보인 예시도이다.
도 7은 도 1의 콘텐츠 번역 시스템의 인증 시스템 구성을 보인 예시도이다.

이하, 도면을 참조하여 본 발명의 바람직한 일실시예에 따른 콘텐츠 번역 시스템에 대하여 상세히 설명하기로 한다. 이하에서 종래 주지된 사항에 대한 설명은 본 발명의 요지를 명확히 하기 위해 생략하거나 간단히 한다. 본 발명의 설명에 포함된 구성은 개별 또는 복합 결합 구성되어 동작한다.

도 1은 본 발명 콘텐츠 번역 시스템의 개요도로서, 도 1을 참조하면, 콘텐츠 번역 시스템은 원본 웹툰 이미지(S11), OCR 인공지능(S12), 웹툰 번역 부분(S13), 웹툰 배포 부분(S14), 수집된 학습 데이터(S15), 재학습 부분(S16)을 포함한다.

콘텐츠 번역 시스템에서 번역하는 콘텐츠는 예를 들어, 웹툰, 스캔된 만화 이미지, 동영상 스틸컷일 수 있다.

원본 웹툰 이미지(S11)는 작가가 그려서 업로드한 한국어 웹툰 이미지(Io)로, 콘텐츠 번역 시스템에서 처리하는 입력 데이터이다.

OCR(Optical Character Recognition) 인공지능(S12)은 이미지에서 문자가 있는 부분을 추출하고, 추출된 부분에서 컴퓨터가 사용할 수 있는 텍스트 형태로 추출할 때 딥러닝 기반의 비전 알고리즘을 사용한다. 딥러닝 기반의 비전 알고리즘은 삭제할 픽셀을 분류해 마스킹 데이터를 반환하는 세그멘테이션(Segmentation); 원본 이미지에서 마스킹 부분을 삭제하고 주위 데이터를 복원하는 인페인트(Inpaint); 이미지에서 텍스트가 있는 부분을 확인하여 바운딩 박스 형태로 반환하는 디텍션(Detection); 바운딩 박스 내부에 적혀 있는 텍스트를 추출하여 반환하는 레커그니션(Recognition);을 포함한다.

웹툰 번역 부분(S13)은 작가가 플랫폼에 업로드한 웹툰 이미지를 수집하고, OCR 인공지능에 의해 추출된 텍스트가 번역된 텍스트에 대해 사용자와 작가의 피드백을 통해 데이터셋을 수집한다.

웹툰 배포 부분(S14)은 플랫폼에 번역된 웹툰을 배포하여 독자에게 서비스하고, 독자의 피드백을 통해 번역 오류를 수정한다.

수집된 학습 데이터(S15)는 웹툰 번역 부분(S13)과 웹툰 배포 부분(S14)에서 수집된 데이터로, 기존 학습에 사용되는 데이터(Do), 새로 수집된 데이터 중 사용자가 수정하지 않은 부분 데이터(Dc), 새로 수집된 데이터 중 사용자가 수정한 부분 데이터(Dw)를 포함한다.

재학습 부분(S16)은 웹툰 번역 부분(S13)과 웹툰 배포 부분(S14)에서 수집된 데이터로 OCR 인공지능(S12)을 다시 학습시킨다. 새로 수집된 데이터는 OCR 인공지능(S12)이 인식하지 못한 부분인지의 여부를 함께 포함하고 있다. OCR 인공지능(S12)이 틀리게 예측한 데이터는 빠르게 예측할 수 있게 되어야 하므로 이 데이터에 대해 가중치를 주어 빠르게 학습할 수 있도록 한다.

도 2는 도 1의 콘텐츠 번역 시스템의 상세 구성을 보인 예시도로서, 도 2를 참조하면, 콘텐츠 번역 시스템은 컷 분할 작업(S21), 텍스트 제거 이미지 업로드(S22), 세그멘테이션 모델/픽셀 비교 후 마스킹 추출(S23), 인페인트 모델/텍스트 제거 이미지 있음(S24), 텍스트 교차 이미지 생성(S25), 디텍션 모델(S26), 레커그니션 모델(S27), 번역 모델(S28), 텍스트 삽입 후 다운로드(S29)를 포함한다.

컷 분할 작업(S21)은 원본 웹툰 이미지(S11)의 컷을 분할한다.

텍스트 제거 이미지 업로드(S22)는 작가가 원본 웹툰 이미지(S11)에 대한 텍스트 제거 이미지를 업로드하거나 업로드하지 않을 수 있다.

세그멘테이션 모델/픽셀 비교 후 마스킹 추출(S23)은 텍스트 제거 이미지가 업로드되지 않으면 세그멘테이션 모델에 의해 마스킹 데이터가 생성되고, 텍스트 제거 이미지가 업로드되면 픽셀 비교 후 마스킹 데이터를 추출한다.

연산자

의 정의로, 수학식 1은 다음과 같다.

텍스트 제거 이미지(Ic)가 업로드되면 원본 웹툰 이미지(Io)의 픽셀 비교 후 마스킹 데이터(Im)를 추출하며, 수학식 2를 이용한다.

텍스트 제거 이미지가 업로드되지 않으면 세그멘테이션 모델에 의해 마스킹 데이터가 생성되며, 수학식 3을 이용한다.

인페인트 모델/텍스트 제거 이미지 있음(S24)는 원본 웹툰 이미지에서 마스킹 데이터 부분을 삭제하고 주위 데이터를 복원한다. 작가 텍스트 제거 이미지를 업로드한 경우 그 이미지를 그대로 삽입하지만, 텍스트 제거 이미지를 업로드 하지 않은 경우 원본 웹툰 이미지에서 마스킹 데이터 부분을 삭제하고, 딥러닝 기반의 인페인트 모델(수학식 4)을 사용하여 해당 픽셀 부분을 글자 제거 이미지에 가깝게 복원한다.

텍스트 교차 이미지 생성(S25)은 원본 웹툰 이미지에서 마스킹 데이터 부분만을 추출하여 인식하기 쉬운 형태로 정리하여 텍스트 교차 이미지(Ip)를 생성한다.

디텍션 모델(S26)은 텍스트 교차 이미지(Ip)에 딥러닝 기반의 디텍션 모델(수학식 5)을 사용하여 원본 웹툰 이미지 픽셀 중 텍스트가 있는 부분의 바운딩 박스(Bboxi)를 회귀 분석하여 3차원 텐서 형태로 나타낸다.

레커그니션 모델(S27)은 바운딩 박스에서 해당하는 텍스트를 추출하여 텍스트 형태로 반환한다. 딥러닝 기반의 레커그니션 모델은 글자 단위로 분류하는 수학식 6을 만들어 해당 부분의 글자를 예측하고, 이를 텍스트로 변환한다. 레커그니션 모델은 한 개의 바운딩 박스에 대해서 (m × n) 크기의 확률 분포 행렬을 생성하며, 이때 m은 바운딩 박스 내부 단어의 글자 수이며, n은 레커그니션 모델이 인식할 수 있는 전체 글자의 종류를 말한다. 계산한 확률 분포 행렬에서 가장 확률이 높은 글자를 예측 결과값으로 사용한다.

번역 모델(S28)은 추출된 텍스트를 문법에 맞게 정리하여 특정 외국어로 번역한다. 번역 모델(S28)은 전문 번역가 또는 번역 API를 사용하여 외국어 번역된 텍스트(transi)를 계산한다.

텍스트 삽입 후 다운로드(S29)는 텍스트 제거 이미지에 번역된 텍스트를 삽입하고, 플랫폼에 업로드하고 사용자가 다운로드할 수 있도록 한다.

도 3은 도 2의 콘텐츠 번역 시스템의 데이터 수정 구성을 보인 예시도로서, 도 3을 참조하면, 콘텐츠 번역 시스템의 데이터 수정은 세그멘테이션 모델/픽셀 비교 후 마스킹 추출(S23)에서 마스킹 데이터에 대해 데이터 수정이 가능하고, 디텍션 모델(S26)에서 바운딩 박스에 대해 데이터 수정이 가능하고, 레커그니션 모델(S27)에서 추출된 텍스트에 대해 데이터 수정이 가능하고, 번역 모델(S28)에서 번역된 텍스트에 대해 데이터 수정이 가능하다.

도 4는 도 1의 콘텐츠 번역 시스템의 콘텐츠 배포 구성을 보인 예시도로서, 도 4를 참조하면 콘텐츠 번역 시스템의 콘텐츠 배포는 웹툰 이용(S41), 번역 오류 발견(S42), 수정 모드 진입(S43), 사용자 수정 제안(S44), 수정 검토 후 반영(S45)를 포함한다.

웹툰 이용(S41)은 사용자가 플랫폼에 업로드된 콘텐츠 중 하나인 웹툰을 이용하도록 서비스한다. 번역 오류 발견(S42)은 사용자가 플랫폼에서 콘텐츠를 이용 중 콘텐츠에 포함된 텍스트의 번역 오류를 발견하면 콘텐츠 번역 시스템에 번역 오류 발견을 알리고, 콘텐츠 번역 시스템은 번역 오류 발견을 감지한다. 수정 모드 진입(S43)은 콘텐츠 번역 시스템이 수정 모드로 진입해서 사용자가 수정 제안을 할 수 있도록 한다. 사용자 수정 제안(S44)은 콘텐츠 번역 시스템의 수정 모드에서 번역된 텍스트, 추출된 텍스트, 바운딩 박스, 마스킹 데이터에 대해 수정 제안을 입력하도록 인터페이스를 제공한다. 수정 검토 후 반영(S45)은 사용자 수정 제안(S44)에서 입력된 수정 제안에 대해 수정 검토 후 콘텐츠에 반영한다.

도 5는 도 1의 콘텐츠 번역 시스템의 수정 제안 구성을 보인 예시도로서, 도 5를 참조하면, 콘텐츠 번역 시스템의 수정 제안은 수정 시작(S51), 정보 확인(S52), 오류 수정(S53), 데이터 저장(S54), 제안안 평가(S55), 전문가 수정(S561), 사용자 평가(S562), 적합성 확인(S57), 수정 반영(S581), 데이터 폐기(S582), 사용자 인센티브(S59)를 포함한다.

수정 시작(S51)은 콘텐츠 번역 시스템에서 수정 제안이 시작된다. 정보 확인(S52)은 수정 제안된 마스킹 데이터, 바운딩 박스, 추출된 텍스트, 번역된 텍스트를 확인한다. 오류 수정(S53)은 정보 확인(S52)된 마스킹 데이터, 바운딩 박스, 추출된 텍스트, 번역된 텍스트에 대해 오류를 수정한다. 데이터 저장(S54)은 오류 수정(S53)된 마스킹 데이터, 바운딩 박스, 추출된 텍스트, 번역된 텍스트를 저장한다. 제안안 평가(S55)는 데이터 저장(S54)된 번역 수정안에 대해 제안안을 평가한다. 전문가 수정(S561)은 제안안 평가(S55)에서 전문가 수정을 처리한다. 사용자 평가(S562)는 제안안 평가(S55)에서 사용자 평가를 처리한다. 적합성 확인(S57)은 전문가 수정(S561)과 사용자 평가(S562)를 거친 수정안에 대해 적합성을 확인한다. 수정 반영(S581)은 적합성 확인(S57)에서 참인 결과에 대해 수정안을 반영하고, 사용자 인센티브(S59)를 부여한다. 데이터 폐기(S582)는 적합성 확인(S57)에서 거짓인 결과에 대해 수정안을 폐기한다.

도 6은 도 1의 콘텐츠 번역 시스템의 재학습 구성을 보인 예시도로서, 도 6을 참조하면, 콘텐츠 번역 시스템의 재학습은 에러 계산(S61), 손실 계산(S62), 손실 가중합 계산(S63), 그라디언트 디센트(S64), 모델 배포(S65)를 포함한다.

에러 계산(S61)은 인공지능 모델이 정확하게 예측했을 때의 정답을 Truth라 하고, 인공지능 모델이 예측한 값을 Pred라고 할 때, 에러는 수학식 7과 같다.

손실 계산(S62)은 에러 제곱의 합과 같다.

여기서, L은 손실이고, no는 기존 학습에 사용되는 데이터의 개수이고, nc는 새로 수집된 데이터 중 사용자가 수정하지 않은 부분 데이터의 개수이고, nw는 새로 수집된 데이터 중 사용자가 수정한 부분 데이터의 개수이다.

손실 가중합 계산(S63)은 최종 인공지능 모델이 사용하는 손실에서 모든 데이터에 대한 손실의 합으로 정의할 수 있다. ,

여기서, Ltotal은 손실 가중합이고, L은 손실이고, Do는 기존 학습에 사용되는 데이터이고, Dc는 새로 수집된 데이터 중 사용자가 수정하지 않은 부분 데이터이고, Dw는 새로 수집된 데이터 중 사용자가 수정한 부분 데이터이다.

그라디언트 디센트(S64)는 학습의 목표로 Ltotal을 최소화하는 것으로 설정하고, 각각의 인공지능 모델을 학습시킨다.

모델 배포(S65)는 학습된 인공지능 모델을 배포한다.

도 7은 도 1의 콘텐츠 번역 시스템의 인증 시스템으로서, 도 4를 참조하면, 콘텐츠 번역 시스템(10)의 인증 구성은 스마트폰(20), 컴퓨터(10), 인증 서버(40)를 포함한다.

스마트폰(20)은 스마트폰(20)의 키값, 생체 정보를 입력받아 인증 서버(40)에 사용자 인증을 요청하고, 컴퓨터(10)는 생성된 킷값을 디스플레이에 표시하고, 인증 서버(40)로 전송한다.

스마트폰(20)은 컴퓨터(10)의 디스플레이에 표시된 킷값을 입력하고, 사용자 정보와 함께 인증 서버(40)로 전송한다. 스마트폰(20)은 킷값과 사용자 정보를 이용하여 컴퓨터(10)에 탑재된 콘텐츠 번역 시스템의 인증을 인증 서버(40)에 요청한다. 컴퓨터(10)의 킷값은 컴퓨터 고유의 정보인 CPU 제조번호, 이더넷 칩의 맥주소로부터 생성될 수 있다. 스마트폰(20)은 카메라를 이용한 얼굴 인식, 마이크를 이용한 음성 인식, 디스플레이를 이용한 필기 인식을 통해 사용자 정보를 획득하고, 인증에 활용할 수 있다.

인증 서버(40)는 컴퓨터(10)로부터 킷값을 수신하고, 스마트폰(20)으로부터 킷값과 사용자 정보를 수신하여 스마트폰(20)의 킷값과 사용자 정보를 비교하고, 사용자 정보를 대응시켜 스마트폰(20)의 콘텐츠 번역 시스템 이용에 대한 인증을 처리한다. 인증 서버(40)는 인증 결과를 스마트폰(20)으로 전송하여 콘텐츠 번역 시스템에 대한 사용자의 사용을 허가한다.

콘텐츠 번역 시스템의 사용을 인증하는 수단인 스마트폰(20)은 콘텐츠 번역 시스템(10)과 직접 연결하지 않고, 인증 서버(40)를 통한 우회 경로를 형성함으로써 인터넷망을 이루는 네트워크가 내부망과 외부망으로 구성되어 아이피 주소 설정 과정이 번거로울 때 스마트폰(20)을 이용한 인증 과정이 원활히 수행되는 장점이 있다. 이때, 컴퓨터(10)에는 콘텐츠 번역 시스템이 탑재되고, 스마트폰(20)은 인증 수단이 된다.

본 발명은 상술한 특정의 바람직한 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 해당 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.

10: 서버
20: 스마트폰
30: 컴퓨터
40: 인증 서버

Claims

원본 웹툰 이미지에서 문자가 있는 부분을 추출하고, 추출된 부분에서 텍스트 형태로 추출하는 OCR(Optical Character Recognition) 인공지능(S12);
상기 OCR 인공지능(S12)에 의해 추출된 텍스트가 번역된 텍스트에 대해 사용자와 작가의 피드백을 통해 데이터셋을 수집하는 웹툰 번역 부분(S13);
플랫폼에 번역된 웹툰을 배포하여 독자에게 서비스하고, 독자의 피드백을 통해 번역 오류를 수정하는 웹툰 배포 부분(S14);
상기 웹툰 번역 부분(S13)과 상기 웹툰 배포 부분(S14)에서 수집된 학습 데이터(S15); 및
상기 수집된 학습 데이터(S15)로 상기 OCR 인공지능(S12)을 재학습시키는 재학습 부분(S16);을 포함하는 것을 특징으로 하는 콘텐츠 번역 시스템.
제1항에 있어서,
상기 OCR 인공지능(S12)은,
원본 웹툰 이미지에서 마스킹 데이터를 생성하는 세그멘테이션 모델;
상기 원본 웹툰 이미지에서 상기 마스킹 데이터를 삭제하고 주위 데이터를 복원하고, 텍스트 교차 이미지를 생성하는 인페인트 모델;
상기 텍스트 교차 이미지에 상기 원본 웹툰 이미지 픽셀 중 텍스트가 있는 부분의 바운딩 박스를 회귀 분석하여 3차원 텐서 형태로 나타내는 디텍션 모델; 및
상기 바운딩 박스에서 해당하는 텍스트를 추출하여 텍스트 형태로 반환하는 레커그니션 모델;을 포함하는 것을 특징으로 하는 콘텐츠 번역 시스템.
제2항에 있어서,
상기 웹툰 번역 부분(S13)에서 데이터 수정은,
세그멘테이션 모델/픽셀 비교 후 마스킹 추출(S23)에서 상기 마스킹 데이터에 대해 데이터 수정이 가능하고,
상기 디텍션 모델(S26)에서 상기 바운딩 박스에 대해 데이터 수정이 가능하고,
상기 레커그니션 모델(S27)에서 추출된 텍스트에 대해 데이터 수정이 가능하고,
번역 모델(S28)에서 번역된 텍스트에 대해 데이터 수정이 가능한 것을 특징으로 하는 콘텐츠 번역 시스템.
제2항에 있어서,
상기 웹툰 배포 부분(S14)에서 콘텐츠 배포는,
사용자가 플랫폼에 업로드된 콘텐츠 중 하나인 웹툰을 이용하도록 서비스하는 웹툰 이용(S41);
사용자가 플랫폼에서 콘텐츠를 이용 중 콘텐츠에 포함된 텍스트의 번역 오류를 발견하면 콘텐츠 번역 시스템에 번역 오류 발견을 알리고, 콘텐츠 번역 시스템은 번역 오류 발견을 감지하는 번역 오류 발견(S42);
콘텐츠 번역 시스템의 수정 모드에서 번역된 텍스트, 추출된 텍스트, 바운딩 박스, 마스킹 데이터에 대해 수정 제안을 입력하도록 인터페이스를 제공하는 사용자 수정 제안(S44); 및
상기 사용자 수정 제안(S44)에서 입력된 수정 제안에 대해 수정 검토 후 콘텐츠에 반영하는 수정 검토 후 반영(S45);을 포함하는 것을 특징으로 하는 콘텐츠 번역 시스템.
제2항에 있어서,
상기 웹툰 배포 부분(S14)에서 수정 제안은,
콘텐츠 번역 시스템에서 수정 제안이 시작되는 수정 시작(S51);
수정 제안된 마스킹 데이터, 바운딩 박스, 추출된 텍스트, 번역된 텍스트를 확인하는 정보 확인(S52);
상기 정보 확인(S52)된 마스킹 데이터, 바운딩 박스, 추출된 텍스트, 번역된 텍스트에 대해 오류를 수정하는 오류 수정(S53);
상기 오류 수정(S53)된 마스킹 데이터, 바운딩 박스, 추출된 텍스트, 번역된 텍스트를 저장하는 데이터 저장(S54);
상기 데이터 저장(S54)된 번역 수정안에 대해 제안안을 평가하는 제안안 평가(S55);
상기 제안안 평가(S55)에서 전문가 수정을 처리하는 전문가 수정(S561);
상기 제안안 평가(S55)에서 사용자 평가를 처리하는 사용자 평가(S562);
상기 전문가 수정(S561)과 상기 사용자 평가(S562)를 거친 수정안에 대해 적합성을 확인하는 적합성 확인(S57);
상기 적합성 확인(S57)에서 참인 결과에 대해 수정안을 반영하고, 사용자 인센티브(S59)를 부여하는 수정 반영(S581); 및
상기 적합성 확인(S57)에서 거짓인 결과에 대해 수정안을 폐기하는 데이터 폐기(S582);를 포함하는 것을 특징으로 하는 콘텐츠 번역 시스템.
제1항에 있어서,
상기 재학습 부분(S16)은,
상기 수집된 학습 데이터(S15)에 대해 에러 계산(S61);
상기 에러 계산(S61)에 대한 손실 계산(S62);
상기 손실 계산(S62)에 대한 손실 가중합 계산(S63);
상기 손실 가중합 계산(S63)이 최소화하도록 인공지능 모델을 학습시키는 그라디언트 디센트(S64); 및
상기 그라디언트 디센트(S64) 계산된 인공지능 모델을 배포하는 모델 배포(S65);를 포함하는 것을 특징으로 하는 콘텐츠 번역 시스템.
제1항에 있어서,
콘텐츠 번역 시스템(10)의 디스플레이에 표시된 킷값을 입력하고, 사용자 정보와 함께 인증 서버(40)로 전송하고, 킷값과 사용자 정보를 이용하여 컴퓨터(10)에 탑재된 콘텐츠 번역 시스템의 인증을 인증 서버(40)에 요청하는 스마트폰(20); 및
상기 콘텐츠 번역 시스템(10)으로부터 킷값을 수신하고, 상기 스마트폰(20)으로부터 킷값과 사용자 정보를 수신하여 상기 스마트폰(20)의 킷값과 사용자 정보를 비교하고, 사용자 정보를 대응시켜 상기 스마트폰(20)의 콘텐츠 번역 시스템 이용에 대한 인증을 처리하고, 인증 결과를 상기 스마트폰(20)으로 전송하여 콘텐츠 번역 시스템에 대한 사용자의 사용을 허가하는 인증 서버(40);를 더 포함하는 것을 특징으로 하는, 콘텐츠 번역 시스템.