KR20210128324A - 자동번역 기능을 탑재한 전자책 서비스 제공 방법 및 장치 - Google Patents

자동번역 기능을 탑재한 전자책 서비스 제공 방법 및 장치 Download PDF

Info

Publication number
KR20210128324A
KR20210128324A KR1020200177077A KR20200177077A KR20210128324A KR 20210128324 A KR20210128324 A KR 20210128324A KR 1020200177077 A KR1020200177077 A KR 1020200177077A KR 20200177077 A KR20200177077 A KR 20200177077A KR 20210128324 A KR20210128324 A KR 20210128324A
Authority
KR
South Korea
Prior art keywords
book
translation
text
image
raster image
Prior art date
Application number
KR1020200177077A
Other languages
English (en)
Inventor
박종한
Original Assignee
주식회사 펍플
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 펍플 filed Critical 주식회사 펍플
Priority to PCT/KR2020/018539 priority Critical patent/WO2021210754A1/ko
Publication of KR20210128324A publication Critical patent/KR20210128324A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

자동번역 기능을 탑재한 전자책 서비스 제공 방법 및 장치를 개시한다.
본 개시의 일 측면에 의하면, 전자책 뷰어장치(e-book viewer device)에 의해 수행되는 전자책 서비스 제공방법으로서, 전자책 파일에 포함된 벡터 이미지(vector image), 래스터 이미지(raster image) 및 메타데이터(metadata)의 전부 또는 일부에 기초하여 전자책 콘텐츠의 원문(original content)을 화면에 표시하는 과정; 상기 벡터 이미지 및 상기 래스터 이미지 중 적어도 하나를 포함하는 대상영역에 대한 입력을 수신하는 과정; 상기 대상영역에 포함된 상기 벡터 이미지 및 상기 래스터 이미지 중 적어도 하나에 대응하는 텍스트를 추출하는 과정; 추출된 텍스트를 기설정된 번역언어로 번역한 번역문을 생성하는 과정; 및 상기 번역문을 화면에 표시하는 과정을 포함하는 것을 특징으로 하는 전자책 서비스 제공방법을 제공한다.

Description

자동번역 기능을 탑재한 전자책 서비스 제공 방법 및 장치{Method and Apparatus for Providing E-book Service having Automatic Translation Function}
본 개시는 자동번역 기능을 탑재한 전자책 서비스 제공 방법 및 장치에 관한 것이다.
이 부분에 기술된 내용은 단순히 본 발명에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.
최근 교육환경 및 정부의 교육 정책이 변경됨에 따라 교육의 패러다임이 변화하고 있으며, 변화된 교육 환경을 지원하기 위한 다양한 시도가 이루어지고 있다. 이 중, 전자책(e-book)은 문자나 화상과 같은 정보를 전자 매체에 기록하여 서적처럼 이용할 수 있는 디지털 도서를 총칭하며, 이러닝 콘텐츠(e-learning content) 개발 및 보급이 활성화됨에 따라 새로운 교육 서비스 모델로서 주목받고 있다.
그러나 전자책 사용자가 자신의 주 언어(native language)가 아닌 다른 언어로 제작된 전자책을 이용하기에는 어려움이 많다. 일반적으로, 전자책 사용자가 번역문을 확인하기 위해서는, 전자책의 원문 내용을 복사한 후 별도의 브라우저(browser) 및/또는 애플리케이션(application)을 구동하고, 복사한 원문의 내용을 붙여 넣는 일련의 과정을 수행해야 한다. 이러한 추가적인 과정들은, 다른 언어로 제작된 전자책 이용의 장애요소로 작용한다.
또한, 기존의 전자책 뷰어 애플리케이션(viewer application)들은 애플리케이션 내에서 자체적으로 번역문을 제공하지 못함에 따라, 사용자가 원문의 내용을 읽는 중간 중간 번역문을 확인하기 위해서는, 전자책 뷰어 애플리케이션 화면과 번역문을 제공하는 별도의 애플리케이션 화면 간 빈번한 화면 전환을 수행해야 한다는 문제점이 있다.
본 개시는, 전자책 뷰어애플리케이션 내에서 화면 전환 없이 번역문을 제공할 수 있는 자동번역 기능을 탑재한 전자책 서비스 제공 방법 및 장치를 제공하는 데 주된 목적이 있다.
본 개시의 일 측면에 의하면, 전자책 뷰어장치(e-book viewer device)에 의해 수행되는 전자책 서비스 제공방법으로서, 전자책 파일에 포함된 벡터 이미지(vector image), 래스터 이미지(raster image) 및 메타데이터(metadata)의 전부 또는 일부에 기초하여 전자책 콘텐츠의 원문(original content)을 화면에 표시하는 과정; 상기 벡터 이미지 및 상기 래스터 이미지 중 적어도 하나를 포함하는 대상영역에 대한 입력을 수신하는 과정; 상기 대상영역에 포함된 상기 벡터 이미지 및 상기 래스터 이미지 중 적어도 하나에 대응하는 텍스트를 추출하는 과정; 추출된 텍스트를 기설정된 번역언어로 번역한 번역문을 생성하는 과정; 및 상기 번역문을 화면에 표시하는 과정을 포함하는 것을 특징으로 하는 전자책 서비스 제공방법을 제공한다.
본 개시의 다른 측면에 의하면, 전자책 콘텐츠 번역 기능을 제공하는 전자책 뷰어장치(e-book viewer device)로서, 전자책 파일에 포함된 벡터 이미지(vector image), 래스터 이미지(raster image) 및 메타데이터(metadata)의 전부 또는 일부에 기초하여 전자책 콘텐츠의 원문(original content)을 화면에 표시하는 원문 출력부; 상기 벡터 이미지 및 상기 래스터 이미지 중 적어도 하나를 포함하는 대상영역에 대한 입력을 수신하는 입력부; 상기 대상영역에 포함된 상기 벡터 이미지 및 상기 래스터 이미지 중 적어도 하나에 대응하는 텍스트를 추출하는 텍스트 추출부;추출된 텍스트를 기설정된 번역언어로 번역한 번역문을 생성하는 번역문 생성부; 및 상기 번역문을 화면에 표시하는 번역문 출력부를 포함하는 것을 특징으로 하는 전자책 뷰어장치를 제공한다.
이상에서 설명한 바와 같이 본 개시의 실시예에 의하면, 전자책 뷰어애플리케이션 내에서 화면 전환 없이 번역문을 제공할 수 있다는 효과가 있다.
도 1은 본 개시의 일 실시예에 따른 전자책 서비스 시스템을 개략적으로 나타낸 블록 구성도이다.
도 2는 본 개시의 일 실시예에 따른 전자책 뷰어장치를 개략적으로 나타낸 블록 구성도이다.
도 3은 본 개시의 일 실시예에 따른 전자책 뷰어장치 상에 디스플레이되는 화면을 나타낸 예시도이다.
도 4는 본 개시의 일 실시예에 따른 전자책 뷰어장치가 자동번역 기능을 제공하는 방법을 나타내는 순서도이다.
이하, 본 개시의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 개시를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 개시의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
또한, 본 개시의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 명세서 전체에서, 어떤 부분이 어떤 구성요소를 '포함', '구비'한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 '…부', '모듈' 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
도 1은 본 개시의 일 실시예에 따른 전자책 서비스 시스템을 개략적으로 나타낸 블록 구성도이다.
도 1에 도시하듯이, 본 개시의 일 실시예에 따른 전자책 서비스 시스템(10)은 전자책 제공장치(100) 및 전자책 뷰어장치(110)를 전부 또는 일부 포함한다. 도 1에 도시된 모든 블록이 필수 구성요소는 아니며, 다른 실시예에서 전자책 서비스 시스템(10)에 포함된 일부 블록이 추가, 변경 또는 삭제될 수 있다.
전자책 제공장치(100)는 전자책 뷰어장치(110)에게 전자책(e-book) 파일을 제공하는 장치이다. 본 개시의 일 실시예에 따른 전자책 제공장치(100)는 하나 이상의 전자책 파일을 저장하고, 전자책 뷰어장치(110)의 요청에 따라, 전자책 파일을 전자책 뷰어장치(110)에게 전송할 수 있다.
본 개시의 일 실시예에 따른 전자책 제공장치(100)는 외부로부터 입력받은 원본 데이터로부터 전자책 파일을 생성할 수 있으나 이러한 예시에 한정되는 것은 아니다. 즉, 본 개시의 다른 실시예에 따른 전자책 제공장치(100)는 별도의 자립형(stand-alone) 장치인 전자책 생성장치(미도시)가 생성한 전자책 파일을 전달받아 데이터베이스(database)화 하고, 전자책 뷰어장치(110)에게 제공할 수 있다.
본 개시의 일 실시예에 따른 전자책 제공장치(100)는 전자책 파일 생성 시, 원본 데이터 내에 포함된 텍스트 정보를 벡터 이미지(vector image) 정보로 변환한다. 벡터 이미지 정보는 점과 선을 사용해 외곽선을 표현하고, 내부에 색상이나 패턴을 채워 만든 이미지로서 확대 및 축소 시에도 원본과 동일한 모습을 얻을 수 있는 이미지 포맷 형식을 의미한다. 이러한, 벡터 이미지 정보는 경계선이 선의 연결로 이루어져 있기 때문에 원본에 대한 확대/축소와 무관하게 항상 선명한 이미지를 제공할 수 있다는 장점이 존재한다.
한편, 일반적으로 텍스트 정보의 형식을 벡터 이미지 형식으로 재구성하는 과정에서 기존의 텍스트 정보에 대한 관련데이터의 손실이 발생하게 된다. 이에 따라, 전자책 뷰어장치(110)가 텍스트 정보와 관련된 기능을 수행하는 경우 텍스트 정보를 정확하게 인지하지 못함에 따라 오류가 발생할 수 있다는 문제점이 존재할 수 있다.
이 점에 기인하여, 본 실시예에 따른 전자책 제공장치(100)는 텍스트 정보에 대한 벡터 이미지화 과정에 앞서, 원본 데이터에 포함된 텍스트 정보 및 이미지 정보에 대한 메타데이터(metadata)들을 추출한다. 이때, 메타데이터로는 텍스트 정보 및 이미지 정보 각각에 대한 위치 좌표값을 포함하는 레이아웃 정보가 수집될 수 있으며, 텍스트 정보에 대응하는 데이터 값(즉, 텍스트 내용)을 포함하는 속성정보(attribute information, 이하, '텍스트 속성정보')가 수집될 수 있다. 실시예에 따라, 텍스트 정보에 대한 폰트 정보, 크기 정보 및 색상 정보 중 하나 이상의 텍스트 스타일정보(style information)가 메타데이터로서 추가로 수집될 수 있다. 이러한, 메타데이터는 텍스트 정보의 이미지화 과정에서 손실되는 텍스트 정보에 대한 관련데이터를 대체하는 대체 데이터로서의 기능을 수행한다.
한편, 도 1에서는 전자책 제공장치(100)가 유무선 네트워크(wired/wireless network)를 통해 전자책 뷰어장치(110)에게 전자책 파일을 제공하는 것으로 예시하였으나 반드시 이에 한정되는 것은 아니다. 예컨대, 전자책 제공장치(100)는 이동식 저장장치와의 연동을 통해 전자책 파일을 전자책 뷰어장치(110)에게 전달할 수도 있다. 즉, 본 개시에서는 전자책 제공장치(100)가 전자책 파일을 전자책 뷰어장치(110)에게 제공하는 방법에 대하여 특정 방법으로 한정하지는 않는다.
전자책 뷰어장치(110)는 전자책 제공장치(100)로부터 전자책 파일을 제공받고, 제공받은 전자책 파일의 내용을 사용자가 볼 수 있도록 출력하는 장치를 의미한다.
본 개시의 일 실시예에 따른 전자책 뷰어장치(110)는 사용자의 키 조작에 따라 네트워크 등을 경유하여 각종 데이터를 송수신할 수 있는 단말기로서, 개인용 컴퓨터(PC: Personal Computer), 태블릿 PC(tablet PC), 랩톱(laptop), 스마트폰(Smart Phone), 개인휴대용 정보단말기(PDA: Personal Digital Assistant) 및 이동통신 단말기(mobile communication terminal) 등 중 어느 하나일 수 있다.
본 개시의 일 실시예에 따른 전자책 뷰어장치(110)는 전자책 뷰어 애플리케이션(e-book viewer application)을 탑재할 수 있다. 전자책 뷰어장치(110)는 사용자의 조작 또는 명령에 의해 전자책 뷰어 애플리케이션을 구동하며, 전자책 뷰어 애플리케이션을 통해 전자책 파일에 대한 뷰어 기능을 제공할 수 있다.
전자책 뷰어 애플리케이션은 전자책 뷰어장치(110) 내에 설치되어, 전자책 뷰어장치(110)가 전자책 뷰어 기능을 제공하도록 하는 일종의 프로그램을 말한다.
한편, 이러한, 전자책 뷰어 애플리케이션은 본 개시의 전자책 뷰어장치(110)가 수행하는 모든 기능을 동일하게 수행할 수 있으며, 이에 대한 자세한 설명은 생략하도록 한다.
전자책 뷰어 애플리케이션은 전자책 뷰어장치(110)가 수행하는 별도의 소프트웨어적 기능 또는 하드웨어적 기능을 구비한 형태로 독립적으로 운용되도록 구현되거나 전자책 뷰어장치(110)가 수행하는 별도의 소프트웨어적 기능 또는 하드웨어적 기능과 연동하는 형태로 구현될 수 있다.
전자책 뷰어 애플리케이션은 전자책 뷰어장치(110)에 탑재되어, 전자책 뷰어장치(110)에 구비된 각종 하드웨어를 이용하여 동작하는 것이 바람직하나 반드시 이에 한정되는 것은 아니며, 별도의 장치로 구현되어 동작될 수도 있다. 또한, 전자책 뷰어 애플리케이션은 전자책 뷰어장치(110) 내의 기설치된 다른 애플리케이션들과 연동하여 동작할 수도 있다.
한편, 도 1에서는 전자책 제공장치(100) 및 전자책 뷰어장치(110)를 별도의 장치로 도시하고 있으나, 전자책 제공장치(100) 및 전자책 뷰어장치(110)가 하나의 장치로 통합되어 구현될 수 있다. 예를 들어, 전자책 제공장치(100) 및 전자책 뷰어장치(110)를 통해 수행되던 각각의 기능이 전자책 뷰어장치(110)에 의해 한꺼번에 수행될 수 있다. 이를 위해, 전자책 뷰어장치(110) 상에는 전자책 제작 애플리케이션 및 전자책 뷰어 애플리케이션이 탑재될 수 있다. 여기서 전자책 제작 애플리케이션은 전자책 제공장치(100)가 수행하는 모든 기능을 동일하게 수행할 수 있으며, 이에 대한 자세한 설명은 생략하도록 한다.
이하, 도 2 및 도 3을 참조하여 본 개시의 일 실시예에 따른 전자책 뷰어장치를 설명한다.
도 2는 본 개시의 일 실시예에 따른 전자책 뷰어장치를 개략적으로 나타낸 블록 구성도이다.
도 3은 본 개시의 일 실시예에 따른 전자책 뷰어장치 상에 디스플레이되는 화면을 나타낸 예시도이다.
도 2에 도시하듯이, 본 개시의 일 실시예에 따른 전자책 뷰어장치(110)는 원문 출력부(200), 입력부(210), 텍스트 추출부(220), 번역문 생성부(230), 번역문 출력부(240)를 전부 또는 일부 포함한다. 도 2에 도시된 모든 블록이 필수 구성요소는 아니며, 다른 실시예에서 전자책 뷰어장치(110)에 포함된 일부 블록이 추가, 변경 또는 삭제될 수 있다. 즉, 도 2의 경우는 본 개시의 일 실시예에 따른 전자책 뷰어장치(110)가 원문의 내용 중 사용자로부터 선택된 영역에 대한 번역문을 생성하여, 원문과 함께 출력하기 위한 구성요소를 예시적으로 도시한 것으로서, 전자책 뷰어장치(110)는 다른 기능의 구현을 위해 도시한 것보다 많거나 적은 구성요소 또는 상이한 구성요소의 구성을 가질 수 있음을 인식하여야 한다.
원문 출력부(200)는 전자책 파일을 파싱(parsing)하여, 전자책 파일에 포함된 데이터들을 기반으로, 전자책의 원문 내용을 전자책 뷰어장치 상에 디스플레이한다.
본 개시의 일 실시예에 따른 원문 출력부(200)는 전자책 파일을 파싱하여 전자책 파일에 포함된 메타데이터(metadata), 벡터 이미지(vector image) 정보 및 래스터 이미지(raster image) 정보를 추출한다.
본 개시의 일 실시예에 따른 원문 출력부(200)는 메타데이터에 포함된 레이아웃 정보를 추출하고, 추출한 레이아웃 정보에 포함된 텍스트 정보의 위치 좌표값에 대응하는 위치에 벡터 이미지 정보를 표시한다. 즉, 원문 출력부(200)는 메타데이터에 포함된 레이아웃 정보를 기반으로, 기존의 텍스트 정보가 표시되는 위치상에 해당 텍스트 정보에 대응하는 벡터 이미지 정보를 표시하여 제공한다.
본 개시의 일 실시예에 따른 원문 출력부(200)는 레이아웃 정보에 포함된 이미지 정보의 위치 좌표값에 대응하는 위치에 래스터 이미지 정보를 표시한다.
입력부(210)는 사용자로부터 번역언어 및 번역을 수행할 대상영역을 입력받는다. 본 개시의 일 실시예에 따른 입력부(210)는 사용자로부터 감지되는 인터랙션 동작에 기초하여 대상영역을 입력받을 수 있다. 여기서, 인터랙션 동작은 클릭(click), 탭(tap), 드래그 앤 드롭(drag and drop), 스와이프(swipe), 핀치 인 앤 아웃(pinch in and out) 및 플릭(flick) 중 적어도 하나를 포함할 수 있다.
예를 들어, 도 3을 참조하면, 사용자는 전자책 뷰어장치의 화면 상에서 특정 영역(300)의 좌측 상단으로부터 우측 하단까지 드래그함으로써 해당영역을 대상영역으로 입력할 수 있다. 또는 사용자는 전자책 뷰어장치의 화면 상에 출력되는 텍스트 및/또는 이미지를 클릭함으로써 해당 텍스트 및/또는 이미지를 포함하는 영역(302 및/또는 304)을 대상영역으로 입력할 수 있다.
본 개시의 입력부(210)는 대상영역에 대한 사용자의 입력이 인식되는 경우, 대상영역의 위치 좌표값을 산출하여 텍스트 추출부(220)에게 제공한다. 이때, 대상영역의 위치 좌표값은 대상영역의 시작 지점 A(예를 들어, 대상영역의 좌측 상단 지점)에 대한 x, y 좌표(이하, 'A 좌표')와 대상영역의 끝 지점 B(예를 들어, 대상영역의 후측 하단 지점)에 대한 x,y 좌표(이하, 'B 좌표')일 수 있다.
텍스트 추출부(220)는 대상영역에 존재하는 벡터 이미지 및/또는 래스터 이미지에 대응되는 텍스트 정보를 추출한다.
본 개시의 일 실시예에 따른 텍스트 추출부(220)는 메타데이터 내 레이아웃 정보를 기반으로 대상영역에 벡터 이미지 및/또는 래스터 이미지가 포함되어 있는지 여부를 확인한다. 즉, 텍스트 추출부(220)는 대상영역의 위치 좌표값과 수집 데이터 내 레이아웃 정보에 포함된 텍스트 정보의 위치 좌표값 및/또는 이미지 정보의 위치 좌표값을 이용하여 대상영역에 벡터 이미지 및/또는 래스터 이미지가 포함되어 있는지 여부를 확인할 수 있다. 예를 들어, 텍스트 추출부(220)는 레이아웃 정보에 포함된 텍스트 정보 및/또는 이미지 정보의 위치 좌표값 중에서, A 좌표와 B 좌표 사이의 값을 가지는 위치 좌표값이 존재하는 경우, 해당 위치 좌표값에 대응하는 벡터 이미지 및/또는 래스터 이미지가 대상영역 내에 존재하는 것으로 판단할 수 있다.
대상영역에 벡터 이미지가 포함되어 있는 경우, 텍스트 추출부(220)는 메타데이터에 포함된 텍스트 속성정보를 기반으로, 대상영역에 포함된 벡터 이미지에 대응하는 텍스트를 추출한다. 예를 들어, 텍스트 추출부(220)는 A 좌표와 B 좌표 사이의 값을 가지는 텍스트 정보의 위치 좌표값에 대응하는 텍스트 속성정보를 추출한다.
대상영역에 래스터 이미지가 포함되어 있는 경우, 텍스트 추출부(220)는 문자인식(character recognition)기술을 이용하여, 래스터 이미지 내의 텍스트 및 해당 텍스트의 위치 좌표값을 추출한다. 여기서, 텍스트 추출부(220)는 문자인식기술로서 OCR(optical character recognition)을 이용할 수 있으나 이러한 예시에 한정되는 것은 아니며, 이 분야의 통상의 기술자라면 누구든지 다른 방법을 채용할 수 있을 것이다.
번역문 생성부(230)는 추출된 텍스트를 사용자가 선택한 번역언어로 번역한 번역문을 생성한다. 본 개시의 일 실시예에 따르면, 번역문 생성부(230)는 규칙기반 자동번역(rule-based machine translation) 및 말뭉치기반 자동번역(corpus-based machine translation) 등의 자동번역 기술(machine translation technology)을 이용하여 번역문을 생성할 수 있으나, 이러한 예시에 한정되는 것은 아니며, 이 분야의 통상의 기술자라면 누구든지 다른 방법을 채용할 수 있을 것이다.
번역문 출력부(240)는 생성된 번역문을 전자책 뷰어장치(110) 상에 디스플레이한다.
본 개시의 일 실시예에 따른 번역문 출력부(240)는 번역문을 대상영역 위에 오버레이(overlay)하거나, 별도의 영역에 자막(subtitle)형태로 오버레이하여 출력한다.
본 개시의 일 실시예에 따른 번역문 출력부(240)는 대상영역의 위치 좌표값, 레이아웃 정보에 포함된 위치 좌표값, 및/또는 래스터 이미지에서 추출된 텍스트의 위치 좌표값에 기초하여, 번역문을 출력할 위치 좌표값을 결정할 수 있다.
예를 들어, 도 3을 참조하면, 번역문 출력부는 대상영역의 위치 좌표값 및 레이아웃 정보에 포함된 텍스트 정보의 위치 좌표값을 기반으로, 벡터 이미지(302)가 표시되는 위치 위에 해당 벡터 이미지에 대응하는 번역문(310)을 출력할 수 있다. 또한, 번역문 출력부는 대상영역의 위치 좌표값, 레이아웃 정보에 포함된 이미지 정보의 위치 좌표값 및 래스터 이미지에서 추출된 텍스트의 위치 좌표값을 기반으로, 래스터 이미지(304)에 포함된 텍스트가 표시되는 위치 위에 해당 텍스트에 대응하는 번역문(320)을 출력할 수 있다.
본 개시의 다른 실시예에 따른 번역문 출력부(240)는 번역문을 팝업(pop-up) 형식으로 오버레이하여 출력할 수 있다. 이때, 번역문을 포함하는 레이어는 기설정된 위치에 팝업될 수 있으며, 사용자의 인터랙션 동작에 기초하여 레이어의 위치가 이동될 수 있다. 이에 따라, 사용자는 원문의 내용 및 번역문의 내용을 함께 확인할 수 있다.
도 4는 본 개시의 일 실시예에 따른 전자책 뷰어장치가 자동번역 기능을 제공하는 방법을 나타내는 순서도이다.
전자책 뷰어장치(110)는 전자책 파일을 파싱하여, 전자책 파일에 포함된 데이터들을 기반으로, 전자책의 원문 내용을 출력한다(S400). 여기서 전자책 파일에 포함된 데이터는, 벡터 이미지, 래스터 이미지 및 메타데이터를 포함할 수 있다. 즉, 본 개시의 일 실시예에 따른 전자책 뷰어장치(110)는 전자책 파일에 포함된 벡터 이미지, 래스터 이미지 및 메타데이터에 기초하여 전자책의 원문을 화면에 표시할 수 있다.
전자책 뷰어장치(110)는 사용자로부터 번역언어 및 번역을 수행할 대상영역을 입력받는다(S410). 전자책 뷰어장치(110)는 대상영역에 대한 사용자의 입력이 인식되는 경우, 대상영역의 위치 좌표값을 산출한다.
전자책 뷰어장치(110)는 대상영역 내에 벡터 이미지 및/또는 래스터 이미지가 존재하는지 확인한다(S420). 전자책 뷰어장치(110)는 메타데이터 내 레이아웃 정보를 기반으로 대상영역에 벡터 이미지 및/또는 래스터 이미지가 포함되어 있는지 여부를 확인할 수 있다.
대상영역 내에 벡터 이미지 및/또는 래스터 이미지가 존재하는 경우, 전자책 뷰어장치(110)는 벡터 이미지 및/또는 래스터 이미지에 대응하는 텍스트를 추출한다(S430). 본 개시의 일 실시예에 따른 전자책 뷰어장치(110)는 메타데이터에 포함된 텍스트 속성정보를 기반으로, 대상영역에 포함된 벡터 이미지에 대응하는 텍스트를 추출한다. 본 개시의 일 실시예에 따른 전자책 뷰어장치(110)는 문자인식(character recognition)기술을 이용하여, 래스터 이미지 내의 텍스트 및 해당 텍스트의 위치 좌표값을 추출한다.
전자책 뷰어장치(110)는 추출된 텍스트를 번역언어로 번역한다(S440). 전자책 뷰어장치(110)는 규칙기반 자동번역(rule-based machine translation) 및 말뭉치기반 자동번역(corpus-based machine translation) 등의 자동번역 기술(machine translation technology)을 이용하여 번역문을 생성할 수 있으나, 이러한 예시에 한정되는 것은 아니다.
전자책 뷰어장치(110)는 번역문을 출력한다(S450). 본 개시의 일 실시예에 따른 전자책 뷰어장치(110)는 번역문을 대상영역 위에 오버레이(overlay)하거나, 별도의 영역에 자막(caption)형태로 오버레이하여 디스플레이에 표시할 수 있다. 본 개시의 다른 실시예에 따른 전자책 뷰어장치(110)는 번역문을 팝업(pop-up)형식으로 오버레이하여 디스플레이에 표시할 수 있다.
도 4에서는 각 과정들을 순차적으로 실행하는 것으로 기재하고 있으나, 이는 본 개시의 일 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것이다. 다시 말해, 본 개시의 일 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 개시의 일 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 도 4에 기재된 순서를 변경하여 실행하거나 각 과정들 중 하나 이상의 과정을 병렬적으로 실행하는 것으로 다양하게 수정 및 변형하여 적용 가능할 것이므로, 도 4는 시계열적인 순서로 한정되는 것은 아니다.
본 명세서에 설명되는 시스템들 및 기법들의 다양한 구현예들은, 디지털 전자 회로, 집적 회로, FPGA(field programmable gate array), ASIC(application specific integrated circuit), 컴퓨터 하드웨어, 펌웨어, 소프트웨어, 및/또는 이들의 조합으로 실현될 수 있다. 이러한 다양한 구현예들은 프로그래밍가능 시스템 상에서 실행가능한 하나 이상의 컴퓨터 프로그램들로 구현되는 것을 포함할 수 있다. 프로그래밍가능 시스템은, 저장 시스템, 적어도 하나의 입력 디바이스, 그리고 적어도 하나의 출력 디바이스로부터 데이터 및 명령들을 수신하고 이들에게 데이터 및 명령들을 전송하도록 결합되는 적어도 하나의 프로그래밍가능 프로세서(이것은 특수 목적 프로세서일 수 있거나 혹은 범용 프로세서일 수 있음)를 포함한다. 컴퓨터 프로그램들(이것은 또한 프로그램들, 소프트웨어, 소프트웨어 애플리케이션들 혹은 코드로서 알려져 있음)은 프로그래밍가능 프로세서에 대한 명령어들을 포함하며 "컴퓨터가 읽을 수 있는 기록매체"에 저장된다.
컴퓨터가 읽을 수 있는 기록매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 이러한 컴퓨터가 읽을 수 있는 기록매체는 ROM, CD-ROM, 자기 테이프, 플로피디스크, 메모리 카드, 하드 디스크, 광자기 디스크, 스토리지 디바이스 등의 비휘발성(non-volatile) 또는 비일시적인(non-transitory) 매체일 수 있으며, 또한 데이터 전송 매체(data transmission medium)와 같은 일시적인(transitory) 매체를 더 포함할 수도 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다.
본 명세서에 설명되는 시스템들 및 기법들의 다양한 구현예들은, 프로그램가능 컴퓨터에 의하여 구현될 수 있다. 여기서, 컴퓨터는 프로그램가능 프로세서, 데이터 저장 시스템(휘발성 메모리, 비휘발성 메모리, 또는 다른 종류의 저장 시스템이거나 이들의 조합을 포함함) 및 적어도 한 개의 커뮤니케이션 인터페이스를 포함한다. 예컨대, 프로그램가능 컴퓨터는 서버, 네트워크 기기, 셋탑 박스, 내장형 장치, 컴퓨터 확장 모듈, 개인용 컴퓨터, 랩탑, PDA(Personal Data Assistant), 클라우드 컴퓨팅 시스템 또는 모바일 장치 중 하나일 수 있다.
이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
10: 전자책 서비스 시스템 100: 전자책 제공장치
110: 전자책 뷰어장치 200: 원문 출력부
210: 입력부 220: 텍스트 추출부
230: 번역문 생성부 240: 번역문 출력부

Claims (10)

  1. 전자책 뷰어장치(e-book viewer device)에 의해 수행되는 전자책 서비스 제공방법으로서,
    전자책 파일에 포함된 벡터 이미지(vector image), 래스터 이미지(raster image) 및 메타데이터(metadata)의 전부 또는 일부에 기초하여 전자책 콘텐츠의 원문(original content)을 화면에 표시하는 과정;
    상기 벡터 이미지 및 상기 래스터 이미지 중 적어도 하나를 포함하는 대상영역에 대한 입력을 수신하는 과정;
    상기 대상영역에 포함된 상기 벡터 이미지 및 상기 래스터 이미지 중 적어도 하나에 대응하는 텍스트를 추출하는 과정;
    추출된 텍스트를 기설정된 번역언어로 번역한 번역문을 생성하는 과정; 및
    상기 번역문을 화면에 표시하는 과정
    을 포함하는 것을 특징으로 하는 전자책 서비스 제공방법.
  2. 제1항에 있어서,
    상기 대상영역을 입력받는 과정 이후에,
    상기 대상영역의 위치 좌표값을 산출하는 과정
    을 추가로 포함하는 것을 특징으로 하는 전자책 서비스 제공방법.
  3. 제2항에 있어서,
    상기 텍스트를 추출하는 과정은,
    상기 대상영역의 위치 좌표값 및 상기 메타데이터 내 레이아웃 정보에 포함된 위치 좌표값에 기초하여, 상기 벡터 이미지 및 상기 래스터 이미지 중 적어도 하나에 대응하는 텍스트를 추출하는 것을 특징으로 하는 전자책 서비스 제공방법.
  4. 제3항에 있어서,
    상기 텍스트를 추출하는 과정은,
    문자인식기술을 이용하여 상기 래스터 이미지에 포함된 텍스트 및 상기 래스터 이미지에 포함된 텍스트의 위치 좌표값을 추출하는 것을 특징으로 하는 전자책 서비스 제공방법.
  5. 제1항에 있어서,
    상기 번역문을 화면에 표시하는 과정은,
    상기 번역문을 상기 대상영역 위에 오버레이(overlay)하는 것을 특징으로 하는 전자책 서비스 제공방법.
  6. 제2항에 있어서,
    상기 번역문을 화면에 표시하는 과정은,
    상기 대상영역의 위치 좌표값 및 상기 메타데이터 내 레이아웃 정보에 포함된 텍스트 정보의 위치 좌표값을 기반으로, 상기 벡터 이미지가 표시되는 위치 위에 상기 벡터 이미지에 대응하는 번역문을 출력하는 것을 특징으로 하는 전자책 서비스 제공방법.
  7. 제4항에 있어서,
    상기 번역문을 화면에 표시하는 과정은,
    상기 대상영역의 위치 좌표값, 상기 메타데이터 내 레이아웃 정보에 포함된 이미지 정보의 위치 좌표값 및 상기 래스터 이미지에 포함된 텍스트의 위치 좌표값을 기반으로, 상기 래스터 이미지에 포함된 텍스트가 표시되는 위치 위에 상기 래스터 이미지에 포함된 텍스트에 대응하는 번역문을 출력하는 것을 특징으로 하는 전자책 서비스 제공방법.
  8. 제1항에 있어서,
    상기 번역문을 화면에 표시하는 과정은,
    상기 번역문을 기설정된 영역 위에 오버레이(overlay)하는 것을 특징으로 하는 전자책 서비스 제공방법.
  9. 전자책 콘텐츠 번역 기능을 제공하는 전자책 뷰어장치(e-book viewer device)로서,
    전자책 파일에 포함된 벡터 이미지(vector image), 래스터 이미지(raster image) 및 메타데이터(metadata)의 전부 또는 일부에 기초하여 전자책 콘텐츠의 원문(original content)을 화면에 표시하는 원문 출력부;
    상기 벡터 이미지 및 상기 래스터 이미지 중 적어도 하나를 포함하는 대상영역에 대한 입력을 수신하는 입력부;
    상기 대상영역에 포함된 상기 벡터 이미지 및 상기 래스터 이미지 중 적어도 하나에 대응하는 텍스트를 추출하는 텍스트 추출부;
    추출된 텍스트를 기설정된 번역언어로 번역한 번역문을 생성하는 번역문 생성부; 및
    상기 번역문을 화면에 표시하는 번역문 출력부
    를 포함하는 것을 특징으로 하는 전자책 뷰어장치.
  10. 제1항 내지 제8항 중 어느 한 항에 따른 전자책 서비스 제공방법이 포함하는 각 과정을 실행시키기 위하여 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터프로그램.
KR1020200177077A 2020-04-16 2020-12-17 자동번역 기능을 탑재한 전자책 서비스 제공 방법 및 장치 KR20210128324A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/KR2020/018539 WO2021210754A1 (ko) 2020-04-16 2020-12-17 자동번역 기능을 탑재한 전자책 서비스 제공 방법 및 장치

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020200045818 2020-04-16
KR20200045818 2020-04-16

Publications (1)

Publication Number Publication Date
KR20210128324A true KR20210128324A (ko) 2021-10-26

Family

ID=78268646

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200177077A KR20210128324A (ko) 2020-04-16 2020-12-17 자동번역 기능을 탑재한 전자책 서비스 제공 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20210128324A (ko)

Similar Documents

Publication Publication Date Title
US10521500B2 (en) Image processing device and image processing method for creating a PDF file including stroke data in a text format
KR101890831B1 (ko) 전자책 서비스 제공방법 및 그를 위한 컴퓨터 프로그램
JP5733907B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
US8555186B2 (en) Interactive thumbnails for transferring content among electronic documents
WO2017040652A1 (en) Method and system for annotation and connection of electronic documents
US20130191728A1 (en) Systems, methods, and media for generating electronic books
CN103999116A (zh) 用于电子阅读器工具的可扩展框架
JP2012018576A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
TW201606622A (zh) 透過觸覺互動的內容屬性可及性偵測
CN111695518B (zh) 结构化文档信息标注的方法、装置及电子设备
JP2014197341A (ja) 電子書籍制作装置、電子書籍システム、電子書籍制作方法及びプログラム
US11243670B2 (en) Information processing system, information processing apparatus, information processing method and non-transitory computer readable medium
CN113935294A (zh) 版式文档批注方法及装置
KR101371406B1 (ko) Pdf 문서의 소스분석을 통한 전자책 제작방법 및 시스템
CN103493042A (zh) 浏览系统、终端机、图像服务器、程序、记录有程序的电脑可读取记录媒体及方法
US10261987B1 (en) Pre-processing E-book in scanned format
CN109445900B (zh) 用于图片显示的翻译方法和装置
KR20210128324A (ko) 자동번역 기능을 탑재한 전자책 서비스 제공 방법 및 장치
US9905030B2 (en) Image processing device, image processing method, information storage medium, and program
JP2013152564A (ja) 文書処理装置及び文書処理方法
WO2021210754A1 (ko) 자동번역 기능을 탑재한 전자책 서비스 제공 방법 및 장치
JP2017027319A (ja) 帳票文書データの表示・編集・保存方法、装置、処理プログラム
JP2015215637A (ja) 画像形成装置、画像処理装置およびプログラム
US10755034B2 (en) Information processing apparatus
CN104850316A (zh) 电子图书字体调整方法及装置

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application