KR20130031895A - 기계 번역 시스템, 기계 번역 방법 및 기록 매체 - Google Patents

기계 번역 시스템, 기계 번역 방법 및 기록 매체 Download PDF

Info

Publication number
KR20130031895A
KR20130031895A KR1020137001443A KR20137001443A KR20130031895A KR 20130031895 A KR20130031895 A KR 20130031895A KR 1020137001443 A KR1020137001443 A KR 1020137001443A KR 20137001443 A KR20137001443 A KR 20137001443A KR 20130031895 A KR20130031895 A KR 20130031895A
Authority
KR
South Korea
Prior art keywords
translation
data
image
text
html data
Prior art date
Application number
KR1020137001443A
Other languages
English (en)
Other versions
KR101388394B1 (ko
Inventor
소 마스꼬
Original Assignee
라쿠텐 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 라쿠텐 인코포레이티드 filed Critical 라쿠텐 인코포레이티드
Publication of KR20130031895A publication Critical patent/KR20130031895A/ko
Application granted granted Critical
Publication of KR101388394B1 publication Critical patent/KR101388394B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Transfer Between Computers (AREA)
  • Processing Or Creating Images (AREA)
  • Machine Translation (AREA)

Abstract

문자를 포함해 가시화되어 있는 화상의 참조 데이터(URL)와, 해당 화상에 겹치는 영역에 표시 위치가 설정되고, 문자를 포함하지 않고 불가시화되어 있는 배경 화상의 참조 데이터(URL)와 해당 배경 화상에 겹치는 영역에 표시 위치가 설정되고, 또한 불가시화되어 있는 텍스트 데이터를 적어도 1세트 포함하는 HTML 데이터를 WebDB에 기억해 놓고, 번역 처리에 있어서 해당 불가시화되어 있는 배경 화상 데이터 및 텍스트 데이터를 가시화함과 함께, 해당 가시화되어 있는 화상 데이터를 불가시화한다.

Description

기계 번역 시스템 및 기계 번역 방법{MACHINE TRANSLATION SYSTEM AND METHOD OF MACHINE TRANSLATION}
본 발명은, 문서를 기계적으로 번역하는 구조에 관한 것으로, 특히, Web 페이지 내에 표시되는 텍스트를 리얼타임으로 번역하는 시스템 등에 관한 것이다.
Web 페이지 중의 텍스트를 기계적으로 번역하는 장치로서, 화상 내의 문자 부분을 번역하는 것이 알려져 있다(예를 들면, 특허 문헌 1 참조). 특허 문헌 1에 기재된 장치는, 화상과 문자가 혼재하는 화상 데이터의 문자 부분만을 번역한 화상을 이하의 순서으로 작성한다. 우선, 화상과 문자가 혼재하는 화상 데이터 중 문자 데이터가 존재하는 부분(문자 영역)을 특정한다. 다음으로, 문자 영역으로부터 문자 데이터를 추출하고, 추출한 문자 데이터를 텍스트 데이터로 변환한다. 그리고, 텍스트 데이터를 번역하고, 번역 데이터를 조정해서 문자 영역에 붙인다. 마지막으로, 번역 데이터가 붙여진 문자 영역을 원래의 화상 데이터와 합성한다(동 문헌의 도 2의 플로우 차트, 도 3~도 10의 설명도 등 참조).
일본 특허 출원 공개 제 2003-122751호 공보
이용자에 있어서는, 인터넷상의 서비스가 제공될 때에, 해당 이용자의 사용 언어로 Web 페이지가 표시되면 편리하다. 그러나, 모든 Web 페이지에 대해서 각국의 언어 패턴을 미리 준비해 두는 것은, 번거로워 현실적이지 않다.
이에 대하여, 사전에 Web 페이지를 소정의 언어로 작성해, 예를 들면, 기계 번역 가능한 장치를 이용해, Web 페이지 중의 텍스트를 이용자의 사용 언어로 리얼타임으로 번역해서 제공하는 것이 생각된다.
그러나, 서비스를 제공하는 Web 페이지에는 화상이 배치되는 일이 많고, 해당 화상에는 종종 문자가 포함되어 있다(도 1(a)의 110a, 여기서는 일본어). 이 때문에, 단순히 텍스트 데이터만을 기계 번역하는 것만으로는, 화상 중의 문자가 번역되지 않는다(도 1(b)의 110b, 여기서는 영역). 이 경우, 예를 들면, 특허 문헌 1에 기재된 장치를 이용함으로써, 화상 내의 문자도 번역되기 때문에, Web 페이지의 외관의 아름다움 및 레이아웃을 손상시키지 않고, 기계 번역하는 것이 가능하게 된다.
그러나, 특허 문헌 1에 기재된 장치에 있어서는, 화상 내의 문자를 적절히 추출해 번역하기 위해서, 처리에 시간이 걸린다. 따라서, 리얼타임 처리를 전제로 하는 번역 서비스에는, 특허 문헌 1에 기재된 장치를 채용할 수 없다.
본 발명은, 상기 과제의 해결 때문에 이루어진 것으로, 번역 처리 전후에 있어서 번역 대상 페이지의 시각적인 외관을 유지할 수 있음과 함께, 화상 내에 포함되는 문자의 번역 처리의 고속화를 도모하는 것이 가능한 기계 번역 시스템, 기계 번역 방법, 기계 번역 프로그램 및 해당 기계 번역 프로그램을 기록한 기록 매체를 제공하는 것을 목적으로 한다.
즉, 본 발명에 따른 기계 번역 시스템은, 소정의 언어로 표현된 번역 대상의 Web 페이지를 다른 언어로 번역하고, 번역된 상기 Web 페이지를 제공하는 기계 번역 시스템이며, 번역 대상의 상기 Web 페이지의 구조가 기술된 HTML 데이터 및 그 HTML 데이터에 의해 참조되는 화상 데이터를 기억하는 Web 데이터 기억 수단과, 텍스트의 번역 처리에 이용되는 사전 데이터를 기억하는 번역 데이터 기억 수단에 접속 가능하고, 상기 HTML 데이터는, 문자를 포함해 가시화된 화상에 관한 기술, 그 화상의 표시 위치와 대응하는 소정 위치에 표시 위치가 설정되고, 문자를 포함하지 않고 불가시화된 배경 화상에 관한 기술 및 그 배경 화상에 겹치는 소정 위치의 전면에 표시 위치가 설정되고, 불가시화된 소정 언어의 텍스트에 관한 기술을 세트로서 포함하고, 번역 대상의 상기 Web 페이지에 대응하는 URL 및 번역처의 언어를 지정하는 지정 데이터를 포함하는 번역 요구를, 상기 Web 페이지를 열람하는 유저의 단말기로부터 수신하는 번역 요구 수신 수단과, 상기 번역 요구에 포함되는 상기 URL에 대응하는 상기 Web 페이지의 구조가 기술된 상기 HTML 데이터를 상기 Web 데이터 기억 수단으로부터 취득하는 HTML 데이터 취득 수단과, 상기 번역 데이터 기억 수단에 의해 기억된 상기 사전 데이터를 참조하고, 상기 HTML 데이터 취득 수단에 의해 취득된 상기 HTML 데이터에 포함되는 텍스트를 상기 번역 요구에 포함되는 상기 지정 데이터에 대응하는 번역처의 언어로 번역하는 번역 수단과, 상기 HTML 데이터 취득 수단에 의해 취득된 상기 HTML 데이터에 포함되는 불가시화된 텍스트 및 상기 배경 화상을 가시화함과 함께, 그 HTML 데이터에 포함되는 가시화된 상기 화상을 불가시화하는 가시화 요소 전환 수단과, 상기 번역 수단에 의해 번역된 텍스트를 이용해서 상기 HTML 데이터 취득 수단에 의해 취득된 상기 HTML 데이터를 재구성해, 상기 단말기에 송신하는 번역이 끝난 HTML 데이터 송신 수단과, 상기 단말기로부터의 상기 화상 데이터를 지정한 송신 요구에 따라서, 지정된 상기 화상 데이터를 상기 Web 데이터 기억 수단으로부터 읽어내서 그 단말기에 송신하는 화상 데이터 송신 수단을 구비하는 것을 특징으로 해서 구성된다.
상기 가시화 요소 전환 수단은, 텍스트의 문자색 속성을 투명으로서 유색으로 변경하고, 텍스트를 포함하는 영역의 표시 속성을 비표시에서 표시로 변경하거나 또는 텍스트를 포함하는 영역의 태그를 삽입하는 코멘트 태그를 삭제하는 것에 의해 불가시화된 텍스트를 가시화하면 좋다.
상기 가시화 요소 전환 수단은, 상기 배경 화상의 표시 속성을 비표시에서 표시로 변경하고, 상기 배경 화상을 포함하는 영역의 표시 속성을 비표시에서 표시로 변경하고, 상기 배경 화상에 대응하는 태그를 삽입하는 코멘트 태그를 삭제하는 것에 의해 불가시화된 상기 배경 화상을 가시화하면 좋다.
상기 가시화 요소 전환 수단은, 상기 화상의 표시 속성을 표시에서 비표시로 변경하고, 상기 화상에 대응하는 태그를 삭제하고, 상기 화상에 대응하는 태그를 코멘트 태그로 삽입하고, 상기 화상을 포함하는 영역의 표시 속성을 표시에서 비표시로 변경하거나 또는 상기 화상을 포함하는 영역에 대응하는 태그를 코멘트 태그로 삽입하는 것에 의해 가시화된 상기 화상을 불가시화하면 좋다.
상기 번역이 끝난 HTML 데이터 송신 수단은, 상기 HTML 데이터 취득 수단에 의해 취득된 상기 HTML 데이터의 기준 URL을, 상기 번역 요구에 포함되는 번역 대상의 상기 Web 페이지의 상기 URL로 변경해도 좋다.
상기 번역이 끝난 HTML 데이터 송신 수단은, 상기 번역 수단에 의해 번역된 텍스트의 길이가 상기 HTML 데이터 취득 수단에 의해 취득된 상기 HTML 데이터에 포함되는 소정의 텍스트의 길이와 비교해 일정값 이상 길 경우에는, 상기 번역 수단에 의해 번역된 텍스트의 길이를 짧게 보정해도 좋다.
또한, 본 발명에 따른 기계 번역 방법은, 소정의 언어로 표현된 번역 대상의 Web 페이지의 텍스트를 다른 언어로 번역하고, 번역된 상기 Web 페이지를 제공하는 기계 번역 시스템에 의한 기계 번역 방법으로서, 상기 기계 번역 시스템은, 번역 대상의 상기 Web 페이지의 구조가 기술된 HTML 데이터 및 그 HTML 데이터에 의해 참조되는 화상 데이터를 기억하는 Web 데이터 기억 수단과, 텍스트의 번역 처리에 이용되는 사전 데이터를 기억하는 번역 데이터 기억 수단에 접속가능하고, 상기 HTML 데이터는, 문자를 포함해 가시화된 화상에 관한 기술, 그 화상의 표시 위치와 대응하는 소정 위치에 표시 위치가 설정되고, 문자를 포함하지 않고 불가시화된 배경 화상에 관한 기술 및 그 배경 화상에 겹치는 소정 위치의 전면에 표시 위치가 설정되고, 불가시화된 소정 언어의 텍스트에 관한 기술을 세트로서 포함하고, 상기 기계 번역 시스템이, 번역 대상의 상기 Web 페이지에 대응하는 URL 및 번역처의 언어를 지정하는 지정 데이터를 포함하는 번역 요구를, 상기 Web 페이지를 열람하는 유저의 단말기로부터 수신하는 번역 요구 수신 스텝과, 상기 번역 요구에 포함되는 상기 URL에 대응하는 상기 Web 페이지의 구조가 기술된 상기 HTML 데이터를 상기 Web 데이터 기억 수단으로부터 취득하는 HTML 데이터 취득 스텝과, 상기 번역 데이터 기억 수단에 의해 기억된 상기 사전 데이터를 참조하고, 상기 HTML 데이터 취득 스텝에 의해 취득된 상기 HTML 데이터에 포함되는 텍스트를 상기 번역 요구에 포함되는 상기 지정 데이터에 대응하는 번역처의 언어로 번역하는 번역 스텝과, 상기 HTML 데이터 취득 스텝에 의해 취득된 상기 HTML 데이터에 포함되는 불가시화된 텍스트 및 상기 배경 화상을 가시화함과 함께, 그 HTML 데이터에 포함되는 가시화된 상기 화상을 불가시화하는 가시화 요소 전환 스텝과, 상기 번역 스텝에 의해 번역된 텍스트를 이용해서 상기 HTML 데이터 취득 스텝에 의해 취득된 상기 HTML 데이터를 재구성해, 상기 단말기에 송신하는 번역이 끝난 HTML 데이터 송신 스텝과, 상기 단말기로부터의 상기 화상 데이터를 지정한 송신 요구에 따라서, 지정된 상기 화상 데이터를 상기 Web 데이터 기억 수단으로부터 읽어내서 그 단말기에 송신하는 화상 데이터 송신 스텝을 실행하는 것을 특징으로 해서 구성된다.
또한, 본 발명에 따른 기계 번역 프로그램은, 상기 어느 하나의 기계 번역 시스템이 구비하는 각 수단을 1 또는 복수의 컴퓨터에 기능으로서 실현시키기 위한 프로그램으로서 구성된다.
또한, 본 발명에 따른 기록 매체는, 컴퓨터에 의해 판독 가능한 기록 매체이며, 상기 어느 하나의 기계 번역 시스템이 구비하는 각 수단을 1 또는 복수의 컴퓨터에 기능으로서 실현시키기 위한 프로그램을 기록한 기록 매체로서 구성된다.
본 발명의 기계 번역 시스템은, 문자를 포함해 가시화되어 있는 화상의 참조 데이터(URL)와, 해당 화상의 표시 위치에 대응하는 영역에 표시 위치가 설정되고, 또한 문자를 포함하지 않고 불가시화되어 있는 배경 화상의 참조 데이터(URL) 및 텍스트 데이터를 적어도 1세트 포함하는 HTML 데이터를 Web 데이터 기억 수단에 기억해 놓고, 번역 처리에 있어서 해당 불가시화되어 있는 배경 화상의 화상 데이터 및 텍스트 데이터를, 텍스트 데이터의 표시 위치가 배경 화상의 표시 위치보다도 앞에 위치하도록 하여 가시화함과 함께, 해당 가시화되어 있었던 화상의 화상 데이터를 불가시화한다.
이와 같이, Web 페이지를 부분적으로 3층 구성(가시화되어 문자를 포함하는 화상의 레이어, 불가시화되어 문자를 포함하지 않는 화상의 레이어 및 불가시화된 텍스트의 레이어)으로 해 둠으로써, 번역 전에 있어서는 문자를 포함하는 화상을 표시할 수 있으므로, 외관도 아름다운데다가 표시 속도가 빠르다. 또한, 번역 처리에 있어서 표시되는 요소를 전환하는 것에 의해, 해당 Web 페이지(HTML 데이터)를 기계 번역에 걸었을 때, 문자를 포함하는 화상이 표시되어 있었던 영역에 배경 화상 및 번역 후의 텍스트가 표시되게 된다. 따라서, 화상 내의 문자가 번역되지 않고 그대로 표시되는 현상을 해소할 수 있음과 아울러, 번역 처리 전후에 있어서 번역 대상 페이지의 시각적인 외관을 유지하는 것이 가능하게 된다.
도 1의 (종래예)(a)는 번역 전의 Web 페이지의 일부, (b)는 번역 후의 Web 페이지의 일부를 나타내는 도이다.
도 2는 실시 형태에 따른 시스템의 구성 예를 도시하는 도이다.
도 3의 (a-1)은 번역 전의 Web 페이지의 일부, (a-2)는 번역 전의 Web 페이지가 갖는 불가시화된 화상 데이터, (a-3)은 번역 전의 Web 페이지가 갖는 불가시화된 텍스트 데이터, (b)는 번역 후의 Web 페이지의 일부를 나타내는 도이다.
도 4는 도 2에 나타내는 시스템의 기계 번역 순서을 나타내는 시퀀스 차트이다.
도 5는 번역 요구의 주요 항목을 나타내는 도이다.
도 6의 (a)는 번역 전의 HTML 소스의 일부, (b)는 번역 후의 HTML 소스의 일부를 나타내는 도이다.
도 7은 번역 처리의 흐름을 설명하는 흐름도이다.
도 8의 (변형예 1)(a)는 번역 전의 Web 페이지의 일부, (b)는 번역 후의 Web 페이지의 일부를 나타내는 도이다.
도 9의 (변형예 2)(a -1)은 번역 전의 Web 페이지의 일부, (a-2)는 번역 전의 Web 페이지가 갖는 불가시화된 데이터, (b)는 번역 후의 Web 페이지의 일부를 나타내는 도이다.
도 10의 (변형예 1)(a)는 번역 전의 HTML 소스의 일부, (b)는 번역 후의 HTML 소스의 일부를 나타내는 도이다.
도 11의 (변형예 1)은 번역 처리의 흐름을 설명하는 흐름도이다.
도 12의 (변형예 2)(a)는 번역 전의 HTML 소스의 일부, (b)는 번역 후의 HTML 소스의 일부를 나타내는 도이다.
도 13의 (변형예 2)는 번역 처리의 흐름을 설명하는 흐름도이다.
도 14의 (다른 실시 형태)는 시스템 구성의 변형예를 도시하는 도이다.
도 15의 (다른 실시 형태)는 시스템 구성의 변형예를 도시하는 도이다.
도 16의 (다른 실시 형태)는 HTML 데이터의 소스의 기재예이다.
도 17의 (다른 실시 형태)는 스타일 시트의 소스의 기재예이다.
도 18의 (다른 실시 형태)는 일본어의 Web 페이지의 표시예이다.
도 19의 (다른 실시 형태)는 불가시화된 배경 화상의 일례이다.
도 20의 (다른 실시 형태)는 불가시화된 일본어의 텍스트의 일례이다.
도 21의 (다른 실시 형태)는 영어의 Web 페이지의 표시예이다.
도 22의 (다른 실시 형태)는 중국어의 Web 페이지의 표시예이다.
도 23의 (다른 실시 형태)는 한국어의 Web 페이지의 표시예이다.
<정의>
이하의 설명 중에서 사용되는 용어의 의의는, 각각 다음 정의대로라고 한다.
·기계 번역…컴퓨터 등을 이용해 남의 손을 거치지 않고 자동적으로 행하는 번역.
·가시화…유저가 시인할 수 있도록 하는 처리를 포함하는 개념.
·불가시화…유저가 시인할 수 없도록 하는 처리를 포함하는 개념. 예를 들면, 비표시로 설정한다, 투명으로 설정한다, 요소를 삭제한다, 요소를 코멘트 아웃 하는 등의 처리 형태가 생각된다.
<실시 형태>
[1. 실시 형태의 개요]
본 실시 형태의 개요를, 도 2~ 도 7를 참조하여 설명한다. 본 실시 형태의 시스템은, Web 페이지를 열람하는 유저에 대하여, Web 페이지 내에 제 1 언어(소정의 언어)로 표시되어 있는 부분을, 각 유저가 지정(선택)한 제 2 언어(다른 언어)로 번역하는 서비스(기계 번역 서비스)를 제공하는 시스템이다. 또한, 이하의 설명에서는, Web 페이지 내의 일본어 부분을 영어로 번역하는 예를 사용하고 있다.
[1-1. 시스템의 구성]
도 2에 도시한 바와 같이, 본 실시 형태의 시스템은, 전체로서, Web 페이지를 제공하는 Web 서버(11), 번역 처리를 행하는 번역 서버(12) 및 Web 브라우저를 갖는 유저 단말기(20)에 의해 구성된다. Web 서버(11)는, Web 페이지의 구조를 기술하는 HTML 데이터 및 해당 HTML 데이터가 참조하는 데이터(예를 들면, 화상 데이터)를 적어도 기억하는 WebDB(Web 데이터 기억 수단, 13)에 접속가능하다. 한편, 번역 서버(12)는, Web 페이지의 기계 번역 처리에 있어서 참조하는 사전 데이터를 적어도 기억하는 번역 DB(번역 데이터 기억 수단, 14)에 접속가능하다.
Web 서버(11) 및 번역 서버(12)는, CPU, ROM, RAM, 하드디스크 및 통신 장치 등을 구비하는 일반적인 컴퓨터로서 구성되고, 유저 단말기(20)는, 상기 구성 요소 이외에 유저로부터의 조작을 접수하는 조작부 및 Web 페이지를 표시 가능한 표시부를 구비해서 구성된다.
또한, 번역 DB(14)에 기억하는 사전 데이터는, 어휘나 문법을 정의한 데이터나, 통계적 학습 방법에 의해 구축한 모델을 포함하고 있는 것으로 한다. 또한, 특정 어구에 대한 특정 역어를 정한 데이터를 기억하고 있어도 좋다. 본 실시 형태에서는, WebDB(13), 번역 DB(14)를 Web 서버(11), 번역 서버(12)에 각각 접속된 외부의 기억 장치에 구축하고 있지만, 기억하고 있는 정보의 판독이 가능하면 Web 서버(11) 또는 번역 서버(12)에 내장된 기억 장치에 구축해도 좋다.
Web 서버(11)와 번역 서버(12)는, 통신 네트워크(본 실시 형태에서는 LAN 등의 프라이빗 네트워크)에 의해 서로 접속해, 기계 번역 시스템(10)을 형성하고 있다. 또한, 유저 단말기(20)는, 통신 네트워크(본 실시 형태에서는 인터넷(30))를 통해서 Web 서버(11) 및 번역 서버(12)와 각각 접속가능하다. 또한, Web 서버(11), 번역 서버(12), 유저 단말기(20) 사이의 통신은, 라우터(40)에 의해 제어된다.
[1-2. 실시 형태의 주요 특징]
실시 형태의 주요 특징은, 문자를 포함해 가시화되어 있는 화상의 참조 데이터(URL)와, 해당 화상의 표시 위치에 대응하는 영역에 표시 위치가 설정되고, 또한 문자를 포함하지 않고 불가시화되어 있는 화상(배경 화상) 및 텍스트 데이터를 적어도 1세트 포함하는 HTML 데이터를 WebDB(13)에 기억해 놓고, 번역 처리에 있어서 해당 불가시화되어 있었던 배경 화상 데이터 및 텍스트 데이터를, 텍스트 데이터의 표시 위치가 배경 화상의 표시 위치보다도 앞에 위치하도록 하여 가시화함과 함께, 해당 가시화되어 있었던 화상 데이터를 불가시화한다는 점에 있다.
이와 같이, Web 페이지를 부분적으로 3층 구성(가시화되어 문자를 포함하는 화상의 레이어, 불가시화되어 문자를 포함하지 않는 배경 화상의 레이어 및 불가시화된 텍스트의 레이어)으로 해 둠으로써, 번역 전에 있어서는 문자를 포함하는 화상을 표시할 수 있으므로, 외관도 아름다운데다가 표시 속도가 빠르다. 또한, 번역 처리에 있어서 표시되는 요소를 전환하는 것에 의해, 해당 Web 페이지(HTML 데이터)를 기계 번역에 걸었을 때, 문자를 포함하는 화상이 표시되어 있었던 영역에 배경 화상 및 번역 후의 텍스트가 표시되게 된다. 따라서, 화상 내의 문자가 번역되지 않고 그대로 표시되는 현상을 해소할 수 있음과 아울러, 번역 처리 전후에 있어서 번역 대상 페이지의 시각적인 외관을 유지하는 것이 가능하게 된다.
도 3에, 실시 형태에 있어서의 번역 전후의 Web 페이지의 일부를 나타낸다. 번역 전의 Web 페이지에는, 통상적인 텍스트(510a)와, 일본어 문자를 포함하는 화상(520)이 표시된다(도 3(a-1)). 또한, 번역 전의 Web 페이지는, 화상(520)의 표시 위치와 대응하는 영역(또는 화상(520)과 겹치는 영역)에 표시 위치가 설정되고, 또한 문자를 포함하지 않고 불가시화된 화상(540)을 갖고 있다(도 3(a-2)). 또한, 화상(540)에 겹치는 영역에 표시 위치가 설정되고, 또한 불가시화된 일본어 텍스트 데이터(530a)를 갖고 있다(도 3(a-3)).
한편, 번역 후의 Web 페이지에는, 텍스트(510a)가 영어로 번역된 텍스트(510b)와, 화상(540)과, 텍스트(530a)가 영어로 번역된 텍스트(530b)가 표시된다(도 3(b)). 또한, 화상(520)은 불가시화되어 있기 때문에, 번역 후의 Web 페이지 내에서는 시인할 수 없다.
[2. 기계 번역의 순서]
[2-1. 기계 번역 순서의 개요]
본 실시 형태의 시스템에 의한 기계 번역 처리의 흐름 및 데이터의 흐름을, 도 4의 시퀀스 차트를 참조해서 간단히 설명한다. 도 4에 도시한 바와 같이, 기계 번역 시스템(10)을 구성하는 Web 서버(11) 및 번역 서버(12)는, 하기 〔순서 1〕~ 〔순서 4〕에 의해 유저 단말기(20)에 번역 후의 Web 페이지를 표시시킨다. 또한, 도 4의 시퀀스 차트에는, 참조하는 다른 도면의 번호가 부기되어 있다. 또한, 순서 1 실행 전에, Web 서버(11)에 의해, Web 페이지의 구조를 기술하는 HTML 데이터 및 해당 HTML 데이터에 의해 참조되는 데이터가 WebDB(13)에 기억되고, 번역 서버(12)에 의해, Web 페이지의 기계 번역 처리에 있어서 참조되는 사전 데이터가 번역 DB(14)에 기억되어 있는 것으로 한다.
〔순서 1〕
전제로서, 유저 단말기(20)는, Web 서버(11)로부터 제공된 Web 페이지를 표시하고 있는 것으로 하고(S505a), 해당 Web 페이지를 번역 대상의 Web 페이지로 한다(도 3(a-1)). 또한, 번역 대상의 Web 페이지에는, 번역 후의 언어를 선택해 번역을 요구하기 위한 요소(예를 들면, 풀다운, 라디오 버튼, 풀다운 또는 라디오 버튼과 버튼 또는 화상 또는 링크와의 세트)가 표시되어 있는 것으로 한다. 번역 대상의 Web 페이지에 있어서 유저가 번역 후의 언어를 지정(선택)하고, 번역을 요구하는 소정의 조작을 행하면, 유저 단말기(20)는, 번역 서버(12)에 Web 페이지의 번역을 요구한다(S510a).
도 5에, 번역 요구의 주요 항목을 예시한다. 번역 요구에는, 「번역 처리 프로그램의 URL」, 「번역 대상 Web 페이지의 URL」, 「제 1 언어(번역 대상 Web 페이지의 언어)의 지정 데이터」, 「제 2 언어(번역처의 언어)의 지정 데이터」 및 「텍스트 데이터의 문자 코드」가 포함된다. 본 실시 형태에서는, 「번역 대상 Web 페이지의 URL」이하를 URL 파라미터라고 하는 HTTP 리퀘스트를 번역 요구로 하고 있다. 또한, 도 5에 나타내는 각 항을 다른 형식으로 송신해도 좋다.
〔순서 2〕
번역 서버(12)는, 유저 단말기(20)로부터 번역 요구를 수신하면(S510b, 번역 요구 수신 스텝), 수신한 「번역 대상 Web 페이지의 URL」에 대응하는 HTML 데이터의 송신을 Web 서버(11)에 요구한다(S515b). Web 서버(11)는, 번역 서버(12)로부터 HTML 데이터의 송신 요구를 수신하면(S515c), 수신한 「번역 대상 Web 페이지의 URL」에 대응하는 HTML 데이터(번역 전의 HTML 데이터)를 WebDB(13)에서 읽어내거나 또는 생성해, 번역 서버(12)에 송신한다(S520c, HTML 데이터 취득 스텝).
〔순서 3〕
번역 서버(12)는, Web 서버(11)로부터 번역 전의 HTML 데이터를 수신하면(S520b), 수신한 번역 전의 HTML 데이터를 대상으로 해서 기계 번역 처리를 실행하고, 번역 후의 HTML 데이터 즉 재구성된 HTML 데이터를 유저 단말기(20)에 송신한다(S525b, 번역이 끝난 HTML 데이터 송신 스텝). 또한, 기계 번역 처리의 흐름 및 번역 전후의 HTML 데이터에 대해서는, 따로 항목을 설치해서 상세하게 설명한다(후술하는 도 6, 7 참조).
〔순서 4〕
유저 단말기(20)는, 번역 서버(12)로부터 번역 후의 HTML 데이터를 수신하면(S525a), 수신한 HTML 데이터를 해석해서 화상 없음의 Web 페이지를 표시함(S530a)과 동시에, 해당 HTML 데이터가 참조하고 있는 화상 데이터의 송신을 Web 서버(11)에 요구한다(S535a). Web 서버(11)는, 화상 데이터의 송신 요구를 수신하면(S535c), 지정된 화상 데이터를 WebDB(13)로부터 읽어내고, 유저 단말기(20)에 송신한다(S540c, 화상 데이터 송신 스텝). 유저 단말기(20)는, Web 서버(11)로부터 화상 데이터를 수신하면(S540a), 이미 표시되어 있는 Web 페이지 내의 소정의 위치에 화상을 추가 표시한다(S545a). 표시 완료 후의 Web 페이지는, 전술한 대로이다(도 3(b)).
이상과 같이, 본 실시 형태에서는, 번역 서버(12)가, 번역 요구 수신 수단 및 번역이 끝난 HTML 데이터 송신 수단으로서 기능하고, Web 서버(11)가, HTML 데이터 취득 수단 및 화상 데이터 송신 수단으로서 기능한다.
[2-2. 실시 형태의 기계 번역 처리 순서 등]
[(a) 번역 전의 HTML 데이터]
도 6(a)에, 실시 형태에 있어서의 번역 전의 HTML 데이터의 일부를 예시한다. 번역 전의 HTML 데이터에는, 일본어 텍스트 데이터(915a) 이외에, 화상의 참조 데이터(925a, 955a)와, 일본어 텍스트 데이터(935a)가 포함되어 있다. 또한, 몇개의 태그에는, 스타일 시트(CSS형식)에 의해 스타일이 설정되어 있다. 텍스트 데이터(915a), 화상의 참조 데이터(925a)는, 각각 번역 전의 Web 페이지(도 3(a-1))의 텍스트(510a), 화상(520)에 대응한다. 또한, 화상의 참조 데이터(955a), 텍스트 데이터(935a)는, 번역 전의 Web 페이지가 갖는 불가시화된 화상 데이터(540)(도 3(a-2)), 텍스트 데이터(530a)(도 3(a-3))에 대응한다.
화상의 참조 데이터(925a)가 참조하는 화상은, 소정 영역(폭 840픽셀, 높이 120픽셀)의 위로부터 0픽셀, 좌측으로부터 0픽셀의 위치에 좌측 위의 정점을 맞추어, 폭 840픽셀, 높이 120픽셀로 표시되도록 설정되어 있다.
한편, 화상의 참조 데이터(955a)가 참조하는 화상은, 상기 소정 영역(폭 840픽셀, 높이 120픽셀)의 위로부터 0픽셀, 좌측으로부터 0픽셀의 위치에 좌측 위의 정점을 맞추어, 폭 840픽셀, 높이 120픽셀로 표시되도록 설정되어 있다. 즉, 해당 화상의 표시 위치는, 참조 데이터(925a)가 참조하는 화상과 동일한 위치로 설정되어 있다. 단, 참조 데이터(955a)에 대응하는 화상은 불가시화되어 있기(표시 속성의 값이 비표시(hidden)로 설정되어 있다) 때문에, Web 브라우저의 윈도우 내에서는 시인할 수 없다. 그리고, 텍스트 데이터(935a)에 대응하는 텍스트는, 상기 소정 영역(폭 840픽셀, 높이 120픽셀)의 위로부터 30픽셀의 위치에 표시되도록 설정되어 있다(여기에서는, 센터링 등). 즉, 해당 텍스트의 표시 위치는, 참조 데이터(955a)가 참조하는 화상과 동일한 위치로 설정되어 있다. 단, 텍스트 데이터(935a)에 대응하는 텍스트는 불가시화되어 있기(문자색 속성의 값이 투명(transparent)으로 설정되어 있다) 때문에, Web 브라우저의 윈도우 내에서는 시인할 수 없다.
또한, Web 페이지 내의 요소는 HTML의 기술순으로 겹치기(뒤에 기술된 요소가 전면에 표시된다) 때문에, 도 6(a)의 예에서는 특별히 설정하고 있지 않지만, 중첩의 순서를 명시적으로 설정해도 좋다. 중첩 순서는, 예를 들면 「z-index」속성의 값(수치)의 대소에 의해 설정할 수 있다.
[(b) 번역 처리]
실시 형태에 있어서의 번역 처리의 흐름을, 도 7의 흐름도를 참조해서 상세하게 설명한다. 도 7에 도시한 바와 같이, 번역 서버(12)는, 하기 〔순서 31〕~ 〔순서 34〕에 의해 HTML 데이터를 번역한다.
〔순서 31〕
HTML 데이터의 기준 URL을 변경 한다(S810). 구체적으로는, 상대 URL 형식으로 기술된 참조 데이터 등(예를 들면, 참조 데이터(925a, 955a)(도 6(a)) 중의 src 속성의 값)의 URL이 기준으로 하는 URL을, <base> 태그의 href 속성의 값으로서 절대 URL 형식으로 기술한다. 여기에서는, 유저 단말기(20)로부터 수신한 검색 요구(도 5)에 포함되는 「번역 대상 Web 페이지의 URL」을 기준 URL로 한다. 또한, HTML 데이터 내의 URL이 모두 절대 URL 형식으로 기술되어 있다고 하는 전제이면, 기준 URL을 변경하는 처리를 생략해도 좋다. 또한, 상대 URL 형식으로 기술된 모든 URL을 개별로 절대 URL 형식으로 재기입해도 동일한 효과를 얻을 수 있다.
〔순서 32〕
HTML 데이터 내에서 요소(엘리먼트)의 내용(콘텐츠)으로 되어 있는 텍스트 데이터를 1개 추출하고(S820), 추출한 텍스트 데이터(원문)를「제 1 언어」에서 「제 2 언어」로 번역해 번역문을 생성한다(S830, 번역 스텝). 또한, 번역 서버(12)는, 텍스트의 번역에 있어서 번역 DB(14)에 기억하고 있는 사전 데이터를 참조한다.
〔순서 33〕
필요에 따라서 번역문의 사이즈를 보정하고(S840), 추출한 텍스트 데이터를 번역문으로 치환한다(S850). 예를 들면, 번역 전후의 문자열 길이를 비교한 다음에 번역문의 길이를 보정하면 좋다. 구체적으로는, 번역 전후의 문자열 길이의 차분이 소정 값 이상(일정값 이상)인 경우에는, 차분에 따라서 번역문의 길이를 짧게 보정한다. 또한, 소정의 조건을 충족시키는 어구를 번역문 중에서 추출해, 소정 방법에 의해 생성한 생략어로 치환해도 좋다. 이 경우, 생략어의 정의를 게재한 Web 페이지를 별도로 생성한 다음에, 번역 후의 Web 페이지에는 생략어의 정의를 게재한 Web 페이지로의 링크를 표시하면 좋다. 또한, 생략어에 포인터를 맞췄을 때에 생략 대상 어구가 팝업 표시 되도록 구성해도 좋다.
〔순서 34〕
번역한 텍스트 데이터가, HTML 데이터 내에서 요소의 내용으로 되어 있는 마지막 텍스트 데이터인지 아닌지를 판정한다(S860). 구체적으로는, HTML 데이터 내에서 요소의 내용으로 되어 있는 다음 텍스트 데이터를 검색하고, 다음 텍스트 데이터가 검출되지 않을 때에, 직전에 번역한 텍스트 데이터가 마지막 텍스트 데이터 라고 판정한다. 마지막 텍스트 데이터가 아닐 때(S860에서 No), 상기 〔순서 32〕로 되돌아가고, 다음 텍스트 데이터에 대해서 추출~치환 처리(〔순서 32〕~ 〔순서 33〕)를 반복한다. 한편, 마지막 텍스트 데이터일 때(S860에서 Yes), 루프를 뺀다.
〔순서 35〕
불가시화되어 있는 모든 번역문을 가시화함(S1070, 가시화 요소 전환 스텝)과 동시에, 불가시화되어 있는 모든 화상을 가시화한다(S1075, 가시화 요소 전환 스텝). 예를 들면, 도 6(a)의 예에서는, class 속성의 값이 「class_11」인 「<div>」 태그의 class 속성을 삭제한다. 이에 의해, 텍스트 데이터(935a)에 대응하는 텍스트(명시적으로 불가시화되어 있었던 텍스트)는, 영어로 번역된 상태에서 친요소의 속성을 계승해서 가시화된다(문자색 속성이 투명에서 유색으로 변경된다). 또한, class 속성의 값이 「class_22」인 「<img>」 태그의 class 속성의 값을 「class_21」로 변경한다. 이에 의해, 화상의 참조 데이터(955a)에 대응하는 화상(명시적으로 불가시화되어 있었던 배경 화상)은, 명시적으로 가시화된다(표시 속성이 비표시에서 표시로 변경된다). 그리고, S1070, S1075 처리에서 가시화된 번역문 또는 도면과 겹치는 모든 화상을 불가시화한다(S1085, 가시화 요소 전환 스텝). 예를 들면, 도 6(a)의 예에서는, class 속성의 값이 「class_21」인 「<img>」 태그의 class 속성의 값을 「class_22」로 변경한다. 이에 의해, 화상의 참조 데이터(925a)에 대응하는 화상(명시적으로 가시화되어 있었던 화상)은, 명시적으로 불가시화된다(표시 속성이 표시에서 비표시로 변경된다). 또한, 번역문의 가시화 및/또는 화상의 불가시화는, 상기한 바와 같이 클래스 속성을 일괄 적용해 행해도 좋고, 해당하는 태그마다 개별로 행해도 된다.
[(c) 번역 후의 HTML 데이터]
도 6(b)에, 실시 형태에 있어서의 번역 후의 HTML 데이터의 일부를 예시한다. 도 6(b)는, 도 6(a)의 HTML 데이터를 도 7의 흐름도에 나타내는 처리에 의해 번역한 후의 HTML 데이터이다.
번역 후의 HTML 데이터에는, 텍스트 데이터(915a)가 영어로 번역된 텍스트 데이터(915b), 참조 데이터(925a)가 불가시화된 참조 데이터(925b), 참조 데이터(955a)가 가시화된 참조 데이터(955b), 텍스트 데이터(935a)가 영어로 번역되어 가시화된 텍스트 데이터(935b)가 포함되어 있다. 또한, 기준 URL을 명시하는 태그(945b)가 추가되어 있다. 텍스트 데이터(915b), 텍스트 데이터(935b)는, 각각 번역 후의 Web 페이지(도 3(b))의 텍스트(510b), 텍스트(530b)에 대응한다. 또한, 텍스트 데이터(915b)의 문자 사이즈는, 상기 〔순서 33〕의 보정 처리(도 7의 S840)에 의해 통상의 90%로 보정되어 있다. 그 밖의 데이터 설정에는, 특별히 명시한 것을 제외하고 변경이 없다.
이상과 같이, 본 실시 형태에서는, 번역 서버(12)가, 번역 수단 및 가시화 요소 전환 수단으로서 기능한다.
[3. 변형예 등]
[3-1. 변형예의 개요]
이하, 2개의 변형예를 설명한다. 또한, 변형예 1,2의 시스템은, 실시 형태의 시스템과 마찬가지로 구성되고 있고, 기계 번역 처리의 흐름 및 번역 전후의 HTML 데이터만이 상이하다. 따라서, 이하에서는 설명 이해의 용이성을 고려해서 상이점을 중심으로 설명한다.
[(a) 변형예 1의 주요 특징]
변형예 1의 주요 특징은, 문자를 포함하지 않는 화상의 참조 데이터(URL)와, 해당 화상에 겹치는 영역의 전면에 표시 위치가 설정된 텍스트 데이터의 세트를 적어도 1세트 포함하는 HTML 데이터를 WebDB(13)에 기억해 두는 점에 있다. 이렇게, Web 페이지를 부분적으로 2층 구성(문자를 포함하지 않는 화상의 레이어 및 텍스트의 레이어)으로 해 두는 것에 의해, 해당 Web 페이지(HTML 데이터)를 기계 번역에 걸었을 때, 문자를 포함하지 않는 화상에 겹치는 영역의 전면에 번역 후의 텍스트가 표시되게 된다. 이 점에 있어서, 화상 내의 문자가 번역되지 않고 그대로 표시되는 현상이 해소된다.
도 8에, 변형예 1에 있어서의 번역 전후의 Web 페이지의 일부를 나타낸다. 번역 전의 Web 페이지에는, 일본어의 통상적인 텍스트(310a) 이외에, 문자를 포함하지 않는 화상(320)과, 화상(320)에 겹치는 영역의 전면에 표시 위치가 설정된 일본어 텍스트(330a)가 표시된다(도 8(a)). 한편, 번역 후의 Web 페이지에는, 텍스트(310a)가 영어로 번역된 텍스트(310b)와, 번역 전후에 있어서 변화하지 않는 화상(320)과, 텍스트(330a)가 영어로 번역된 텍스트(330b)가 표시된다(도 8(b)).
[(b) 변형예 2의 주요 특징]
변형예 2의 주요 특징은, 문자를 포함해 가시화되어 있는 화상의 참조 데이터(URL)와, 해당 화상에 겹치는 영역에 표시 위치가 설정되고, 또한 불가시화되어 있는 텍스트 데이터를 적어도 1세트 포함하는 HTML 데이터를 WebDB(13)에 기억해 놓고, 번역 처리에 있어서 해당 불가시화되어 있는 텍스트 데이터를 가시화함과 동시에, 해당 가시화되어 있는 화상 데이터를 불가시화한다는 점에 있다. 이렇게, Web 페이지를 부분적으로 2층 구성(문자를 포함하는 화상의 레이어 및 불가시화된 텍스트의 레이어)으로 해 놓고, 번역 처리에 있어서 표시되는 레이어를 전환하는 것에 의해, 해당 Web 페이지(HTML 데이터)를 기계 번역에 걸었을 때, 문자를 포함하는 화상이 표시되어 있었던 영역에 번역 후의 텍스트가 표시되게 된다. 이 점에 있어서, 화상 내의 문자가 번역되지 않고 그대로 표시되는 현상이 해소된다.
도 9에, 변형예 2에 있어서의 번역 전후의 Web 페이지의 일부를 나타낸다. 번역 전의 Web 페이지에는, 일본어의 통상적인 텍스트(410a)와, 문자를 포함하는 화상(420)이 표시된다(도 9(a-1)). 또한, 번역 전의 Web 페이지는, 화상(420)에 겹치는 영역에 표시 위치가 설정되고, 또한 불가시화된 일본어 텍스트 데이터(430a)를 갖고 있다(도 9(a-2)). 한편, 번역 후의 Web 페이지에는, 텍스트(410a)가 영어로 번역된 텍스트(410b)와, 텍스트(430a)가 영어로 번역된 텍스트(430b)가 표시된다(도 9(b)). 또한, 화상(420)은 불가시화되어 있기 때문에, 번역 후의 Web 페이지 내에서는 시인할 수 없다.
[(c) 변형예의 기계 번역 순서 등]
변형예의 시스템에 의한 기계 번역 처리의 흐름 및 데이터의 흐름은, 실시 형태의 시스템에 의한 기계 번역 처리의 흐름 및 데이터의 흐름과 마찬가지이다(도 4). 또한, 번역 요구의 주요 항목에 대해서도 마찬가지이다(도 5).
[3-2. 변형예 1의 번역 처리 등]
[(a) 번역 전의 HTML 데이터]
도 10(a)에, 변형예 1에 있어서의 번역 전의 HTML 데이터의 일부를 예시한다. 번역 전의 HTML 데이터에는, 일본어 텍스트 데이터(710a) 이외에, 화상의 참조 데이터(720)와, 일본어 텍스트 데이터(730a)가 포함되어 있다. 또한, 몇개의 태그에는, 스타일 시트(CSS형식)에 의해 스타일이 설정되어 있다. 텍스트 데이터(710a), 화상의 참조 데이터(720), 텍스트 데이터(730a)는, 각각 번역 전의 Web 페이지(도 8(a))의 텍스트(310a), 화상(320), 텍스트(330a)에 대응한다.
화상의 참조 데이터(720)가 참조하는 화상은, 소정 영역(폭 840픽셀, 높이 120픽셀)의 위로부터 0픽셀, 좌측으로부터 0픽셀의 위치에 좌측 위의 정점을 맞추어, 폭 840픽셀, 높이 120픽셀로 표시되도록 설정되어 있다. 한편, 텍스트 데이터(730a)에 대응하는 텍스트는, 상기 소정 영역(폭 840픽셀, 높이 120픽셀)의 위로부터 30픽셀의 위치에 통상대로 표시되도록 설정되어 있다(여기에서는, 센터링 등). 따라서, 상기 소정 영역에 있어서, 화상과 텍스트는 겹쳐져서 표시된다. 또한, Web 페이지 내의 요소는 HTML의 기술순으로 겹치기(뒤에 기술된 요소가 전면에 표시된다) 때문에, 도 10(a)의 예에서는 특별히 설정하고 있지 않지만, 중첩의 순서를 명시적으로 설정해도 좋다. 중첩 순서는, 예를 들면 「z-index」속성의 값(수치)의 대소에 의해 설정할 수 있다.
[(b) 번역 처리]
변형예 1에 있어서의 번역 처리의 흐름을, 도 11의 흐름도로 나타낸다. 또한, 도 11의 흐름도에 있어서, 도 7의 흐름도에 나타낸 처리와 동일한 부호가 부여되어 있는 처리는, 동일한 처리를 나타낸다. 도 11에 도시한 바와 같이, 번역 서버(12)는, 상기 〔순서 31〕~ 〔순서 34〕(실시 형태와 동일)에 의해 HTML 데이터를 번역한다.
[(c) 번역 후의 HTML 데이터]
도 10(b)에, 변형예 1에 있어서의 번역 후의 HTML 데이터의 일부를 예시한다. 도 10(b)는, 도 10(a)의 HTML 데이터를 도 11의 흐름도에 나타내는 처리에 의해 번역 한 후의 HTML 데이터이다.
번역 후의 HTML 데이터에는, 텍스트 데이터(710a)가 영어로 번역된 텍스트 데이터(710b), 번역 전후에 있어서 변화하지 않는 화상의 참조 데이터(720), 텍스트 데이터(730a)가 영어로 번역된 텍스트 데이터(730b)가 포함되어 있다. 또한, 기준 URL을 명시하는 태그(740b)가 추가되어 있다. 텍스트 데이터(710b), 화상의 참조 데이터(720), 텍스트 데이터(730b)는, 각각 번역 후의 Web 페이지(도 8(b))의 텍스트(310b), 화상(320), 텍스트(330b)에 대응한다. 또한, 텍스트 데이터(710b)의 문자 사이즈는, 상기 〔순서 33〕의 보정 처리(도 11의 S840)에 의해 통상의 90%로 보정되어 있다. 그 밖의 데이터의 설정에는 특별히 변경이 없다.
[3-3. 변형예 2의 번역 처리 등]
[(a) 번역 전의 HTML 데이터]
도 12(a)에, 변형예 2에 있어서의 번역 전의 HTML 데이터의 일부를 예시한다. 번역 전의 HTML 데이터에는, 일본어 텍스트 데이터(910a) 이외에, 화상의 참조 데이터(920a)와, 일본어 텍스트 데이터(930a)가 포함되어 있다. 또한, 몇개의 태그에는, 스타일 시트(CSS형식)에 의해 스타일이 설정되어 있다. 텍스트 데이터(910a), 화상의 참조 데이터(920a)는, 각각 번역 전의 Web 페이지(도9 (a-1))의 텍스트(410a), 화상(420)에 대응한다. 또한, 텍스트 데이터(930a)는, 번역 전의 Web 페이지가 갖는 불가시화된 텍스트 데이터(430a)(도 9(a-2))에 대응한다.
화상의 참조 데이터(920a)가 참조하는 화상은, 소정 영역(폭 840픽셀, 높이 120픽셀)의 위로부터 0픽셀, 좌측으로부터 0픽셀의 위치에 좌측 위의 정점을 맞추어, 폭 840픽셀, 높이 120픽셀로 표시되도록 설정되어 있다. 한편, 텍스트 데이터(930a)에 대응하는 텍스트는, 상기 소정 영역(폭 840픽셀, 높이 120픽셀)의 위로부터 30픽셀의 위치에 통상대로 표시되도록 설정되어 있다(여기에서는, 센터링 등). 단, 텍스트 데이터(930a)에 대응하는 텍스트는 불가시화되어 있기(문자색 속성의 값이 투명(transparent)으로 설정되어 있다) 때문에, Web 브라우저의 윈도우 내에서는 시인할 수 없다.
[(b) 번역 처리]
변형예 2에 있어서의 번역 처리의 흐름을, 도 13의 흐름도를 참조하여 설명한다. 도 13에 도시한 바와 같이, 번역 서버(12)는, 상기 〔순서 31〕~ 〔순서 34〕(실시 형태 및 변형예 1과 동일)에 더해, 하기 〔순서 36〕에 의해 HTML 데이터를 번역한다. 또한, 도 13의 흐름도에 있어서, 도 7의 흐름도에 나타낸 처리와 동일 부호가 부여되어 있는 처리는, 동일 처리를 나타낸다.
〔순서 36〕
불가시화되어 있는 모든 번역문을 가시화 함(S1070)과 동시에, 가시화한 번역문과 겹치는 모든 화상을 불가시화한다(S1080). 예를 들면, 도 12(a)의 예에서는, class 속성의 값이 「class_11」인 「<div>」 태그의 class 속성을 삭제한다. 이에 의해, 텍스트 데이터(930a)에 대응하는 텍스트(명시적으로 불가시화되어 있었던 텍스트)는, 친요소의 속성을 계승해서 가시화된다(문자색 속성이 투명에서 유색으로 변경된다). 또한, class 속성의 값이 「class_21」인 「<img>」 태그의 class 속성의 값을 「class_22」로 변경한다. 이에 의해, 화상의 참조 데이터(920a)에 대응하는 화상(명시적으로 가시화되어 있었던 화상)은, 명시적으로 불가시화된다(표시 속성이 표시에서 비표시로 변경된다). 또한, 번역문의 가시화 및/또는 화상의 불가시화는, 상기한 바와 같이 클래스 속성을 일괄 적용해 행해도 좋고, 해당하는 태그마다 개별로 행해도 된다.
[(c) 번역 후의 HTML 데이터]
도 12(b)에, 변형예 2에 있어서의 번역 후의 HTML 데이터의 일부를 예시한다. 도 12(b)는, 도 12(a)의 HTML 데이터를 도 13의 흐름도에 나타내는 처리에 의해 번역한 후의 HTML 데이터이다.
번역 후의 HTML 데이터에는, 텍스트 데이터(910a)가 영어로 번역된 텍스트 데이터(910b), 참조 데이터(920a)가 불가시화된 참조 데이터(920b), 텍스트 데이터(930a)가 영어로 번역되어 가시화된 텍스트 데이터(930b)가 포함되어 있다. 또한, 기준 URL을 명시하는 태그(940b)가 추가되어 있다. 텍스트 데이터(910b), 텍스트 데이터(930b)는, 각각 번역 후의 Web 페이지(도 9(b))의 텍스트(410b), 텍스트(430b)에 대응한다. 또한, 텍스트 데이터(910b)의 문자 사이즈는, 상기 〔순서 33〕의 보정 처리(도 13의 S840)에 의해 통상의 90%으로 보정되어 있다. 그 밖의 데이터의 설정에는, 특별히 명시한 것을 제외하고 변경이 없다.
[3-4. 시스템 구성의 변형예]
[(a) 번역 서버가 원격지에 있는 구성]
전술한 실시 형태 및 변형예에서는, Web 서버(11)와 번역 서버(12)를 LAN 등의 프라이빗 네트워크를 통해서 접속하고 있다(도 2). 이는, 양쪽 서버가 동일한 사업자의 관리 하에 있는 것을 상정한 구성이다. 이에 대하여, 도 14에 도시한 바와 같이, Web 서버(11)와 번역 서버(12)를 인터넷(30) 등의 퍼블릭 네트워크를 통해서 접속해도 좋다. 이는, Web 서버(11) 또는 번역 서버(12)가 원격지(예를 들면, 다른 사업소, 원격지의 데이터 센터, 다른 사업자의 관리 하 등)에 있는 것을 상정한 구성이다.
[(b) Web 서버가 번역 처리 기능을 구비한 구성]
전술한 실시 형태 및 변형예에서는, Web 서버(11)와 번역 서버(12)에 의해 기계 번역 시스템(10)을 구성하고 있다(도 2). 이는, 하드웨어마다 특정 처리 기능으로 특화하고, 부하 분산을 도모한 구성이다. 이에 대하여, 기계 번역 처리의 모든 스텝을 Web 서버(11)가 실행하도록 구성해도 좋다. 이 경우, 도 15에 도시한 바와 같이, Web 서버(11)는 WebDB(13)와 번역 DB(14)를 갖는다. 또한, 유저 단말기(20)로부터 번역 요구를 수신하고, 번역 대상의 HTML 데이터를 취득하고, 번역 처리를 실행해, 번역 후의 HTML 데이터 및 필요한 화상 데이터를 송신하는 처리의 주체는, 모두 Web 서버(11)가 된다.
[3-5. 처리 분담의 변형예]
전술한 실시 형태 및 변형예에서는, Web 서버(11)는 HTML 데이터 또는 화상 데이터를 송신하는 처리로 특화되어 있다. 마찬가지로, 번역 서버(12)는 유저 단말기(20)로부터 번역 요구를 수신해서 번역 후의 HTML 데이터를 생성하고, 유저 단말기(20)에 송신하는 처리로 특화되어 있다(도 4). 이에 대하여, 유저 단말기(20)로부터 번역 요구를 수신하는 처리 및 번역 후의 HTML 데이터를 유저 단말기(20)에 송신하는 처리를 Web 서버(11)가 담당하는 것으로 하고, 번역 서버(12)는 Web 페이지의 번역 처리(도 7, 도 11, 도 13의 S810~S860)만으로 특화하도록 구성해도 좋다.
[3-6. 기계 번역 프로그램]
전술한 실시 형태 및 변형예에서는, 기계 번역 시스템 또는 기계 번역 방법에 대해서 설명했지만, 본 발명은, 상기 기계 번역 시스템이 구비하는 각 수단을 1 또는 복수의 컴퓨터에 기능으로서 실현시키기 위한 기계 번역 프로그램으로서 제공되어도 좋다. 이 기계 번역 프로그램은, 예를 들면, 메인 모듈 이외에, 각 수단에 각각 대응하는 모듈을 구비해서 구성된다. 또한, 기계 번역 프로그램은, ROM 등의 기록 매체 또는 반도체 메모리 등에 의해 제공된다. 또한, 기계 번역 프로그램은, 데이터 신호로서 네트워크를 통해서 제공되어도 좋다.
[3-7.스타일 설정의 변형예]
[(a) 불가시화되어 있는 텍스트의 가시화의 변형예]
불가시화되어 있는 텍스트를 가시화하는 처리에서는, 다른 설정 항목과의 정합성을 고려한 다음, 예를 들면, 다음 방법을 채용해도 좋다.
·<div> 요소의 visibility 속성(표시 속성)을 「hidden」에서 「visible」(디폴트)로 변경한다.
·텍스트 데이터 그 자체 또는 그 텍스트 데이터를 내용으로 하는 요소 전체를 삽입하고 있는 코멘트 태그를 삭제한다.
[(b) 불가시화되어 있는 화상의 가시화의 변형예]
불가시화되어 있는 화상을 가시화하는 처리에서는, 다른 설정 항목과의 정합성을 고려한 다음, 예를 들면, 다음 방법을 채용해도 좋다.
·<div> 요소의 visibility 속성(표시 속성)을 「visible」(디폴트)에서 「hidden」으로 변경한다.
·화상 데이터 그 자체 또는 그 화상 데이터를 내용으로 하는 요소 전체를 삽입하고 있는 코멘트 태그를 삭제한다.
·<div> 요소 또는 <img> 태그의 display 속성(표시 형식)을 「none」에서 「block」으로 변경한다.
[(c) 가시화되어 있는 화상의 불가시화의 변형예]
가시화되어 있는 화상을 불가시화하는 처리에서는, 다른 설정 항목과의 정합성을 고려한 다음, 예를 들면, 다음 방법을 채용해도 좋다.
·<div> 요소 전체 또는 <img> 태그를 코멘트 태그로 삽입한다(코멘트 아웃 한다).
·<div> 요소 전체 또는 <img> 태그를 삭제한다.
·<div> 요소의 visibility 속성(표시 속성)을 「visible」(디폴트)에서 「hidden」으로 변경한다.
·<div> 요소 또는 <img> 태그의 display 속성(표시 형식)을 「none」으로 변경한다.
[(d) 불가시화의 개념]
전술한 실시 형태 및 변형예 2에서는, 불가시화라는 용어를, 「전혀 시인할 수 없음」으로 하는 처리를 포함하는 개념으로서 이용하고 있다. 이에 대하여, 반투명으로 설정한다, 투과성을 높인다, 그레이 아웃한다, 매우 연한 색으로 설정한다(RGB의 각 값을 모두 대략 200 이상으로 설정한다) 등, 유저가 「거의 시인할 수 없음」으로 하는 처리에 의해도, 「불가시화」와 동일한 효과를 발휘할 경우가 있다. 따라서, 이들 처리도 「불가시화」와 실질적으로 등가이다.
[3-8. 스타일 설정의 변형예]
전술한 변형예 1에서는, HTML의 태그에 개별로 스타일을 설정하고 있다(도 10). 또한, 전술한 실시 형태 및 변형예 2에서는, HTML 소스 내에서 정의한 스타일을 특정한 클래스 명이 붙여진 모든 태그에 적용하도록 하고 있다(도 6, 도 12). 이에 대하여, 소정의 스타일 시트 언어(예를 들면, CSS(Cascading Style Sheets))로 기술한 외부 파일을 참조하는 것에 의해 스타일을 적용해도 좋다. 또한, 스타일을 모두 HTML 태그의 속성에 의해 설정해도 좋다.
[4. 소소 코드의 기재 예, Web 페이지의 표시예]
이하에서는 일본어의 Web 페이지를 다른 언어(영어, 중국어 또는 한국어)로 번역하는 경우를 일례로서 설명한다. 도 16에 기계 번역 전에 있어서의 HTML의 소스의 예를 나타낸다. 도 16에 예시하는 HTML의 소스에서는, 도 17에 예시하는 스타일 시트의 소스(파일명 「test.css」)가 관련지어져 있다. HTML 데이터 중의 텍스트의 표시 위치는, 도 19에 예시하는 배경 화상(파일명 「test.gif 」)에 맞추고, 도 20에 예시하는 바와 같이 각각 설정되어 있다. 또한, 도 20은, 최상부의 백색 문자가 명확하게 되도록 배경을 회색으로 해서 나타냈다.
도 18에, 도 16에 예시하는 HTML의 소스를 Web 브라우저로 읽어들인 Web 페이지 표시예를 나타낸다. 번역 전의 Web 페이지에서는, 일본어를 포함하는 화상(파일명 「first.gif」)이 가시화됨과 동시에, 도 19에 예시하는 배경 화상 및 도 20에 예시하는 텍스트는 불가시화된다. 이렇게, 화상, 배경 화상 및 문자 부분을 분리해서 3층 구성(화상의 레이어, 배경 화상의 레이어, 텍스트의 레이어)으로 함으로써, 번역 전의 Web 페이지는 문자를 포함하는 화상만으로 표시할 수 있으므로, 외관도 아름다운데다가 표시 속도가 빠르다.
번역 처리시에서는, 화상의 레이어에서 배경 화상의 레이어 및 텍스트의 레이어로 전환하고, 텍스트의 레이어를 이용해서 번역한다. 이에 의해, 문자 부분만을 기계 번역의 대상으로 할 수 있다. 도 21~23에 번역 후의 표시예를 나타낸다. 도 21은 영어로 번역된 표시예, 도 22은 중국어로 번역된 표시예, 도 23은 한국어로 번역된 표시예이다. 도 21~23에 나타내는 표시예는, 문자와 일체화된 화상(도 18)과 비교해도, 충분한 표현성을 구비하고 있어, 번역 전후에 있어서 시각적인 외관이 유지되고 있다.
10 기계 번역 시스템
11 Web 서버
12 번역 서버
13 WebDB
14 번역 DB
20 유저 단말기
30 인터넷
40 라우터

Claims (9)

  1. 소정의 언어로 표현된 번역 대상의 Web 페이지를 다른 언어로 번역하고, 번역된 상기 Web 페이지를 제공하는 기계 번역 시스템으로서,
    번역 대상의 상기 Web 페이지의 구조가 기술된 HTML 데이터 및 그 HTML 데이터에 의해 참조되는 화상 데이터를 기억하는 Web 데이터 기억 수단과,
    텍스트의 번역 처리에 이용되는 사전 데이터를 기억하는 번역 데이터 기억 수단
    에 접속가능하고,
    상기 HTML 데이터는, 문자를 포함해 가시화된 화상에 관한 기술, 그 화상의 표시 위치와 대응하는 소정 위치에 표시 위치가 설정되고, 문자를 포함하지 않고 불가시화된 배경 화상에 관한 기술 및 그 배경 화상에 겹치는 소정 위치의 전면에 표시 위치가 설정되고, 불가시화된 소정 언어의 텍스트에 관한 기술을 세트로서 포함하고,
    번역 대상의 상기 Web 페이지에 대응하는 URL 및 번역처의 언어를 지정하는 지정 데이터를 포함하는 번역 요구를, 상기 Web 페이지를 열람하는 유저의 단말기로부터 수신하는 번역 요구 수신 수단과,
    상기 번역 요구에 포함되는 상기 URL에 대응하는 상기 Web 페이지의 구조가 기술된 상기 HTML 데이터를 상기 Web 데이터 기억 수단으로부터 취득하는 HTML 데이터 취득 수단과,
    상기 번역 데이터 기억 수단에 의해 기억된 상기 사전 데이터를 참조하고, 상기 HTML 데이터 취득 수단에 의해 취득된 상기 HTML 데이터에 포함되는 텍스트를 상기 번역 요구에 포함되는 상기 지정 데이터에 대응하는 번역처의 언어로 번역하는 번역 수단과,
    상기 HTML 데이터 취득 수단에 의해 취득된 상기 HTML 데이터에 포함되는 불가시화된 텍스트 및 상기 배경 화상을 가시화함과 함께, 그 HTML 데이터에 포함되는 가시화된 상기 화상을 불가시화하는 가시화 요소 전환 수단과,
    상기 번역 수단에 의해 번역된 텍스트를 이용해서 상기 HTML 데이터 취득 수단에 의해 취득된 상기 HTML 데이터를 재구성하여, 상기 단말기에 송신하는 번역이 끝난 HTML 데이터 송신 수단과,
    상기 단말기로부터의 상기 화상 데이터를 지정한 송신 요구에 따라서, 지정된 상기 화상 데이터를 상기 Web 데이터 기억 수단으로부터 읽어내서 그 단말기에 송신하는 화상 데이터 송신 수단
    을 구비하는 것을 특징으로 하는 기계 번역 시스템.
  2. 제1항에 있어서,
    상기 가시화 요소 전환 수단은, 텍스트의 문자색 속성을 투명에서 유색으로 변경하고, 텍스트를 포함하는 영역의 표시 속성을 비표시에서 표시로 변경하거나 또는 텍스트를 포함하는 영역의 태그를 삽입하는 코멘트 태그를 삭제하는 것에 의해 불가시화된 텍스트를 가시화하는 기계 번역 시스템.
  3. 제1항 또는 제2항에 있어서,
    상기 가시화 요소 전환 수단은, 상기 배경 화상의 표시 속성을 비표시에서 표시로 변경하고, 상기 배경 화상을 포함하는 영역의 표시 속성을 비표시에서 표시로 변경하고, 상기 배경 화상에 대응하는 태그를 삽입하는 코멘트 태그를 삭제하는 것에 의해 불가시화된 상기 배경 화상을 가시화하는 기계 번역 시스템.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 가시화 요소 전환 수단은, 상기 화상의 표시 속성을 표시에서 비표시로 변경하고, 상기 화상에 대응하는 태그를 삭제하고, 상기 화상에 대응하는 태그를 코멘트 태그로 삽입하고, 상기 화상을 포함하는 영역의 표시 속성을 표시에서 비표시로 변경하거나 또는 상기 화상을 포함하는 영역에 대응하는 태그를 코멘트 태그로 삽입하는 것에 의해 가시화된 상기 화상을 불가시화하는 기계 번역 시스템.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 번역이 끝난 HTML 데이터 송신 수단은, 상기 HTML 데이터 취득 수단에 의해 취득된 상기 HTML 데이터의 기준 URL을, 상기 번역 요구에 포함되는 번역 대상의 상기 Web 페이지의 상기 URL로 변경하는 기계 번역 시스템.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    상기 번역이 끝난 HTML 데이터 송신 수단은, 상기 번역 수단에 의해 번역된 텍스트의 길이가 상기 HTML 데이터 취득 수단에 의해 취득된 상기 HTML 데이터에 포함되는 소정의 텍스트의 길이와 비교해서 일정값 이상 길 경우에는, 상기 번역 수단에 의해 번역된 텍스트의 길이를 짧게 보정하는 기계 번역 시스템.
  7. 소정의 언어로 표현된 번역 대상의 Web 페이지의 텍스트를 다른 언어로 번역하고, 번역된 상기 Web 페이지를 제공하는 기계 번역 시스템에 의한 기계 번역 방법으로서,
    상기 기계 번역 시스템은, 번역 대상의 상기 Web 페이지의 구조가 기술된 HTML 데이터 및 그 HTML 데이터에 의해 참조되는 화상 데이터를 기억하는 Web 데이터 기억 수단과,
    텍스트의 번역 처리에 이용되는 사전 데이터를 기억하는 번역 데이터 기억 수단
    에 접속가능하고,
    상기 HTML 데이터는, 문자를 포함해 가시화된 화상에 관한 기술, 그 화상의 표시 위치와 대응하는 소정 위치에 표시 위치가 설정되고, 문자를 포함하지 않고 불가시화된 배경 화상에 관한 기술 및 그 배경 화상에 겹치는 소정 위치의 전면에 표시 위치가 설정되고, 불가시화된 소정 언어의 텍스트에 관한 기술을 세트로서 포함하고,
    상기 기계 번역 시스템이,
    번역 대상의 상기 Web 페이지에 대응하는 URL 및 번역처의 언어를 지정하는 지정 데이터를 포함하는 번역 요구를, 상기 Web 페이지를 열람하는 유저의 단말기로부터 수신하는 번역 요구 수신 스텝과,
    상기 번역 요구에 포함되는 상기 URL에 대응하는 상기 Web 페이지의 구조가 기술된 상기 HTML 데이터를 상기 Web 데이터 기억 수단으로부터 취득하는 HTML 데이터 취득 스텝과,
    상기 번역 데이터 기억 수단에 의해 기억된 상기 사전 데이터를 참조하고, 상기 HTML 데이터 취득 스텝에 의해 취득된 상기 HTML 데이터에 포함되는 텍스트를 상기 번역 요구에 포함되는 상기 지정 데이터에 대응하는 번역처의 언어로 번역하는 번역 스텝과,
    상기 HTML 데이터 취득 스텝에 의해 취득된 상기 HTML 데이터에 포함되는 불가시화된 텍스트 및 상기 배경 화상을 가시화함과 함께, 그 HTML 데이터에 포함되는 가시화된 상기 화상을 불가시화하는 가시화 요소 전환 스텝과,
    상기 번역 스텝에 의해 번역된 텍스트를 이용해서 상기 HTML 데이터 취득 스텝에 의해 취득된 상기 HTML 데이터를 재구성하여, 상기 단말기에 송신하는 번역이 끝난 HTML 데이터 송신 스텝과,
    상기 단말기로부터의 상기 화상 데이터를 지정한 송신 요구에 따라서, 지정된 상기 화상 데이터를 상기 Web 데이터 기억 수단으로부터 읽어내서 그 단말기에 송신하는 화상 데이터 송신 스텝
    을 실행하는 것을 특징으로 하는 기계 번역 방법.
  8. 제1항 내지 제6항 중 어느 한 항에 기재된 기계 번역 시스템이 구비하는 각 수단을 하나 또는 복수의 컴퓨터에 기능으로서 실현시키기 위한 기계 번역 프로그램.
  9. 컴퓨터에 의해 판독 가능한 기록 매체로서,
    제1항 내지 제6항 중 어느 한 항에 기재된 기계 번역 시스템이 구비하는 각 수단을 하나 또는 복수의 컴퓨터에 기능으로서 실현시키기 위한 기계 번역 프로그램을 기록한 기록 매체.
KR1020137001443A 2010-06-25 2010-06-25 기계 번역 시스템, 기계 번역 방법 및 기록 매체 KR101388394B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2010/060882 WO2011161825A1 (ja) 2010-06-25 2010-06-25 機械翻訳システム及び機械翻訳方法

Publications (2)

Publication Number Publication Date
KR20130031895A true KR20130031895A (ko) 2013-03-29
KR101388394B1 KR101388394B1 (ko) 2014-04-22

Family

ID=43952786

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137001443A KR101388394B1 (ko) 2010-06-25 2010-06-25 기계 번역 시스템, 기계 번역 방법 및 기록 매체

Country Status (8)

Country Link
US (1) US9053077B2 (ko)
EP (1) EP2587388A4 (ko)
JP (1) JP4658236B1 (ko)
KR (1) KR101388394B1 (ko)
CN (1) CN102959537B (ko)
CA (1) CA2803861C (ko)
TW (1) TWI421710B (ko)
WO (1) WO2011161825A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102654947B1 (ko) * 2023-07-17 2024-04-05 주식회사 페이브 다국어 웹사이트 콘텐츠를 생성하는 방법 및 전자 장치

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9864809B2 (en) * 2010-07-13 2018-01-09 Motionpoint Corporation Dynamic language translation of web site content
CN103493042B (zh) 2011-04-28 2016-04-06 乐天株式会社 浏览系统、图像服务器、及图像服务器执行的方法
JP5606385B2 (ja) * 2011-04-28 2014-10-15 楽天株式会社 サーバ装置、サーバ装置の制御方法、及び、プログラム
JP5708419B2 (ja) * 2011-09-29 2015-04-30 フリュー株式会社 画像表示システム、学習システム、画像表示方法、および制御プログラム
US9690783B2 (en) * 2013-03-29 2017-06-27 Rakuten, Inc. Image conversion and method for converting text in an image into a targeted language
US9977684B2 (en) 2013-06-12 2018-05-22 Sap Se Self-learning localization service
JP2015069365A (ja) * 2013-09-27 2015-04-13 シャープ株式会社 情報処理装置、および制御プログラム
EP3761182A4 (en) * 2018-02-26 2021-10-13 Loveland Co., Ltd. WEB PAGE TRANSLATION SYSTEM, WEB PAGE TRANSLATION DEVICE, WEB PAGE PROVIDING DEVICE AND WEB PAGE TRANSLATION PROCESS
CN110047488B (zh) * 2019-03-01 2022-04-12 北京彩云环太平洋科技有限公司 语音翻译方法、装置、设备及控制设备
US11347381B2 (en) * 2019-06-13 2022-05-31 International Business Machines Corporation Dynamic synchronized image text localization
US11443122B2 (en) * 2020-03-03 2022-09-13 Dell Products L.P. Image analysis-based adaptation techniques for localization of content presentation
US11494567B2 (en) * 2020-03-03 2022-11-08 Dell Products L.P. Content adaptation techniques for localization of content presentation
US11687626B2 (en) 2020-06-17 2023-06-27 Capital One Services, Llc System and method for securing a browser against font usage fingerprinting
CN111783482A (zh) * 2020-07-06 2020-10-16 南京百家云科技有限公司 一种文本翻译方法、装置、计算机设备及存储介质
TWI807467B (zh) * 2021-11-02 2023-07-01 中國信託商業銀行股份有限公司 要項偵測模型建立方法、業務導向要項鍵值辨識系統及方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040205671A1 (en) * 2000-09-13 2004-10-14 Tatsuya Sukehiro Natural-language processing system
JP2003122751A (ja) 2001-10-12 2003-04-25 Alps Electric Co Ltd 翻訳装置
JP2003157272A (ja) * 2001-11-21 2003-05-30 Kyodo Printing Co Ltd 翻訳出版物提供システム及びその方法
US20040111272A1 (en) * 2002-12-10 2004-06-10 International Business Machines Corporation Multimodal speech-to-speech language translation and display
WO2005086021A2 (en) * 2004-03-02 2005-09-15 Melingo, Ltd. Embedded translation document method and system
CN1333361C (zh) * 2004-06-30 2007-08-22 高庆狮 提高文字、语音识别的准确率的方法和装置及自动翻译系统
JP4473702B2 (ja) * 2004-11-02 2010-06-02 株式会社東芝 機械翻訳システム、機械翻訳方法及びプログラム
JP4263181B2 (ja) * 2005-03-28 2009-05-13 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP2007026398A (ja) * 2005-07-11 2007-02-01 Kodensha Co Ltd 画像情報または音声情報を含む文書データ翻訳システム
JP2008084286A (ja) 2006-09-01 2008-04-10 Toshiba Corp 電子漫画配信サーバ、および翻訳電子漫画作成装置
TW200933393A (en) 2008-01-25 2009-08-01 Inventec Corp Translating system and method of dynamic web page
JP5235135B2 (ja) * 2008-12-26 2013-07-10 楽天株式会社 機械翻訳システム及び機械翻訳方法
JP5483526B2 (ja) * 2008-12-26 2014-05-07 楽天株式会社 機械翻訳システム及び機械翻訳方法
BRPI0924401B1 (pt) * 2009-03-18 2020-05-19 Google Inc métodos, sistemas e meios não-transitórios de armazenamento para tradução de web com substituição de exibição

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102654947B1 (ko) * 2023-07-17 2024-04-05 주식회사 페이브 다국어 웹사이트 콘텐츠를 생성하는 방법 및 전자 장치

Also Published As

Publication number Publication date
JPWO2011161825A1 (ja) 2013-08-19
CN102959537A (zh) 2013-03-06
TWI421710B (zh) 2014-01-01
TW201142620A (en) 2011-12-01
EP2587388A1 (en) 2013-05-01
JP4658236B1 (ja) 2011-03-23
CA2803861C (en) 2016-01-12
KR101388394B1 (ko) 2014-04-22
CA2803861A1 (en) 2011-12-29
US9053077B2 (en) 2015-06-09
CN102959537B (zh) 2015-07-22
WO2011161825A1 (ja) 2011-12-29
EP2587388A4 (en) 2018-01-03
US20130132825A1 (en) 2013-05-23

Similar Documents

Publication Publication Date Title
KR101388394B1 (ko) 기계 번역 시스템, 기계 번역 방법 및 기록 매체
US7176931B2 (en) Modifying hyperlink display characteristics
JP2014006913A (ja) 翻訳情報セグメント
KR20150091132A (ko) 페이지 렌더링 방법 및 장치
KR20150006456A (ko) 브라우저에서 맞춤식 어드레스 바 또는 검색 결과들을 디스플레이하는 방법
TW200821867A (en) Program, character input editing method, and apparatus
JP5235135B2 (ja) 機械翻訳システム及び機械翻訳方法
US10013403B2 (en) Browsing system, terminal, image server, program, computer-readable recording medium storing program, and method
US8724147B2 (en) Image processing program
Ghose et al. Architecture of a web browser for visually handicapped people
JP5483526B2 (ja) 機械翻訳システム及び機械翻訳方法
US9697182B2 (en) Method and system for navigating a hard copy of a web page
CN101539914A (zh) 对网页进行可读化定制转换的技术方案
US7987421B1 (en) Method and apparatus to dynamically provide web content resources in a portal
JP7338328B2 (ja) データ構造、コンピュータプログラム及び画像処理装置
JP4448724B2 (ja) ウェブブラウザのアクセシビリティ検査プログラム
JP7098897B2 (ja) 画像処理装置、プログラム及び画像データ
WO2011065369A1 (ja) バナー生成システム、バナー生成装置、バナー生成方法、バナー生成プログラム、コンピュータ読み取り可能な記録媒体、情報提供システム、情報提供方法及び情報提供プログラム
JPH09265469A (ja) ハイパーテキスト型文書の翻訳方法およびhtml文書の翻訳装置
JPH11305983A (ja) 音声制御画像スクリーン表示システム
Winkler et al. Accessibility add-on box enabling barrier-free tourism information systems (TIS)
KR20230090622A (ko) 문장 1개를 &#39;인터넷 문장&#39;으로 변환시키는 방법
JP2019050026A (ja) 情報多言語変換システム、情報多言語変換方法、及びプログラム
JP2001042984A (ja) 情報提示装置、情報提示方法およびプログラム記録媒体、ならびに音声認識装置、音声認識方法およびプログラム記録媒体
JP2008204183A (ja) 文章データ管理サーバ、文章データ管理システム、文章データ管理方法及び文章データ管理プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170407

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180410

Year of fee payment: 5