KR20070049606A - 언어 판별 장치, 번역 장치, 번역 서버, 언어 판별 방법 및번역 처리 방법 - Google Patents

언어 판별 장치, 번역 장치, 번역 서버, 언어 판별 방법 및번역 처리 방법 Download PDF

Info

Publication number
KR20070049606A
KR20070049606A KR1020067027921A KR20067027921A KR20070049606A KR 20070049606 A KR20070049606 A KR 20070049606A KR 1020067027921 A KR1020067027921 A KR 1020067027921A KR 20067027921 A KR20067027921 A KR 20067027921A KR 20070049606 A KR20070049606 A KR 20070049606A
Authority
KR
South Korea
Prior art keywords
language
character
character code
undefined
translation
Prior art date
Application number
KR1020067027921A
Other languages
English (en)
Inventor
다카마사 스즈키
Original Assignee
가부시키가이샤 임펄스 재팬
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시키가이샤 임펄스 재팬 filed Critical 가부시키가이샤 임펄스 재팬
Publication of KR20070049606A publication Critical patent/KR20070049606A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Abstract

복수의 언어에 대해, 각 언어의 문자 코드표에서 문자가 할당되지 않은 미정의의 문자 코드 리스트를 기억하는 기억 수단(32)과, 언어 판별 대상의 문자열에 포함되는 각 문자의 문자 코드와, 상기 기억 수단에 기억되어 있는 각 언어의 미정의의 문자 코드 리스트를 조회하는 조회 수단(34)과, 조회 수단에 의한 조회 결과, 상기 복수의 언어 중 미정의의 문자 코드에 해당하는 문자가 상기 문자열에 포함되어 있지 않은 언어를 그 문자열의 언어로 판별하는 판별 수단(34)을 구비하고 있다.

Description

언어 판별 장치, 번역 장치, 번역 서버, 언어 판별 방법 및 번역 처리 방법{LANGUAGE IDENTIFICATION EQUIPMENT, TRANSLATION EQUIPMENT, TRANSLATION SERVER, LANGUAGE IDENTIFICATION METHOD, AND TRANSLATION PROCESSING METHOD}
본 발명은, 예를 들면 사용자가 인터넷에 의해 접속한 웹(WEB: World Wide Web) 페이지의 언어를 자동 판별하여, 사용자의 사용 언어로 번역하는 데에 사용되는 언어 판별 장치, 번역 장치, 번역 서버, 언어 판별 방법 및 번역 처리 방법에 관한 것이다.
최근, 인터넷은 널리 인지되어 정보 수집 방법의 하나로서 일반에게 이용되게 되었다.
하지만, 사용자가 인터넷에 의해 접속한 웹페이지가 사용자의 사용 언어와는 다른 언어로 표시되어 있는 경우에는, 사용자는 그 내용을 이해할 수는 없다.
그래서, 사용자의 사용 언어와는 다른 언어로 표시되어 있는 웹페이지를 번역 엔진으로 번역하고, 번역 결과를 웹페이지에 반영하여 사용자의 단말 장치에 표시되도록 하는 것이 행해지고 있다.
그리고, 이 경우, 웹페이지의 사용 언어를 자동적으로 판별하는 것이 행해지고 있다(예를 들면, 특개2000-330992호 공보 참조).
이러한 언어의 자동 판별은 홈페이지(웹페이지)에 기재되어 있는 문자의 인코드를 참조함으로써 행해지고 있었다.
하지만, 유럽에서는 영어나 다른 언어도 동일한 인코드를 이용하고 있기 때문에, 지역에 따라서는 판별할 수가 없었다. 게다가, 인코드는 공통화되는 방향에 있으며, 이 때문에 인코드를 참조함에 따른 언어 판별에는 한계가 있어, 언어 판별을 확실하게 행할 수 있는 방책이 요구되고 있다.
본 발명은 이러한 문제를 해결하기 위해 이루어진 것으로, 언어 판별을 자동으로 확실하게 행할 수 있는 언어 판별 장치 및 언어 판별 방법을 제공하며, 이들을 이용한 번역 장치, 번역 서버, 번역 처리 방법을 제공하는 것을 목적으로 한다.
상기 과제를 해결하기 위해서, 본 발명은 이하의 수단을 제공한다.
(1)복수의 언어에 대해, 각 언어의 문자 코드표에서 문자가 할당되지 않은 미정의의(未定義)의 문자 코드 리스트를 기억하는 기억 수단과, 언어 판별 대상의 문자열에 포함되는 각 문자의 문자 코드와, 상기 기억 수단에 기억되어 있는 각 언어의 미정의의 문자 코드 리스트를 조회하는 조회 수단과, 조회 수단에 의한 조회 결과, 상기 복수의 언어 중에서 미정의의 문자 코드에 해당하는 문자가 상기 문자열에 포함되지 않은 언어를 그 문자열의 언어로 판별하는 판별 수단을 구비하는 것을 특징으로 하는 언어 판별 장치.
본 발명에 의하면, 언어 판별 대상의 문자열에 포함되는 각 문자의 문자 코드와, 기억 수단에 기억되어 있는 각 언어의 미정의의 문자 코드 리스트를 조회하고, 조회 결과, 상기 복수의 언어 중에서 미정의의 문자 코드에 해당하는 문자가 상기 문자열에 포함되지 않은 언어를 그 문자열의 언어로 판별하는 것이다. 즉, 각 언어에 특유의 미정의의 문자 코드를 이용하여 판별을 행하므로, 홈페이지(웹페이지)에 기재되어 있는 문자의 인코드를 참조하는 경우처럼, 공통의 인코드 때문에 언어 판별이 어려워질 염려도 없으며, 확실하면서도 자동적으로 언어 판별을 행할 수 있다.
(2)상기 조회 수단은 상기 문자열에 포함되는 각 문자마다, 그 문자 코드와 각 언어의 미정의의 문자 코드 리스트를 조회해 가는 청구항 1에 기재된 언어 판별 장치.
본 발명에 의하면, 조회 수단은 상기 문자열에 포함되는 각 문자마다, 그 문자 코드와 각 언어의 미정의의 문자 코드 리스트를 조회해 가기 때문에, 조회 처리 및 언어의 압축을 신속하면서도 확실하게 행할 수 있다.
(3)복수의 언어에 대해, 각 언어의 문자 코드표에서 문자가 할당되지 않은 미정의의 문자 코드 리스트를 기억하는 기억 수단과, 언어 판별 대상의 문자열에 포함되는 각 문자의 문자 코드와, 상기 기억 수단에 기억되어 있는 각 언어의 미정의의 문자 코드 리스트를 조회하는 조회 수단과, 조회 수단에 의한 조회 결과, 상기 복수의 언어 중에서 미정의의 문자 코드에 해당하는 문자가 상기 문자열에 포함되지 않은 언어를 그 문자열의 언어로 판별하는 판별 수단과, 상기 판별 수단에 의해 언어 판별된 문자열을 다른 언어로 번역하는 번역 수단을 구비하는 것을 특징으로 하는 번역 장치.
본 발명에 의하면, 언어 판별을 행한 후에 언어 판별된 문자열을 다른 언어로 번역하므로, 확실한 언어 판별에 의해 적정한 언어로 번역할 수 있다.
(4)상기 조회 수단은 상기 문자열에 포함되는 각 문자마다, 그 문자 코드와 각 언어의 미정의의 문자 코드 리스트를 조회해 가는 청구항 3에 기재된 번역 장치.
본 발명에 의하면, 상기 문자열에 포함되는 각 문자마다, 그 문자 코드와 각 언어의 미정의의 문자 코드 리스트를 조회해 가기 때문에, 조회 처리 및 언어의 압축을 신속하면서도 확실하게 행할 수 있으며, 또한 적정한 번역을 신속하게 행할 수 있다.
(5)복수의 언어에 대해, 각 언어의 문자 코드표에서 문자가 할당되지 않은 미정의의 문자 코드 리스트를 기억하는 기억 수단과, 단말 장치를 통해 사용자가 접속한 웹페이지에 표시되어 있는 문자열에 포함되는 각 문자의 문자 코드와, 상기 기억 수단에 기억되어 있는 각 언어의 미정의의 문자 코드 리스트를 조회하는 조회 수단과, 조회 수단에 의한 조회 결과, 상기 복수의 언어 중에서 미정의의 문자 코드에 해당하는 문자가 상기 문자열에 포함되지 않은 언어를 그 문자열의 언어로 판별하는 판별 수단과, 상기 판별 수단에 의해 언어 판별된 상기 웹페이지의 문자열을 다른 언어로 번역하는 번역 수단과, 번역 결과를 반영시킨 웹페이지를 상기 사용자 단말에 표시시키는 표시 제어 수단을 구비하는 것을 특징으로 하는 번역 서버.
본 발명에 의하면, 사용자가 웹페이지의 언어를 자동적으로 판별하여, 사용자 단말에 번역 결과를 반영시킨 웹페이지를 표시시키기 때문에, 사용자는 웹페이지의 표시 언어의 차이를 의식하지 않고 계속해서 인터넷 서핑을 즐길 수 있다.
(6)상기 조회 수단은 상기 문자열에 포함되는 각 문자마다, 그 문자 코드와 각 언어의 미정의의 문자 코드 리스트를 조회해 가는 청구항 5에 기재된 번역 장치.
본 발명에 의하면, 조회 처리 및 언어의 압축을 신속하면서도 확실하게 행할 수 있으며, 또한 적정한 번역을 신속하게 행할 수 있으므로, 번역 결과를 반영한 웹페이지를 신속하게 표시시킬 수 있다.
(7)언어 판별 대상의 문자열에 포함되는 각 문자의 문자 코드와, 복수의 언어에 대한 각 언어의 문자 코드표에서 문자가 할당되지 않은 미정의의 문자 코드 리스트를 조회하는 단계와, 조회 결과, 상기 복수의 언어 중에서 미정의의 문자 코드에 해당하는 문자가 상기 문자열에 포함되지 않은 언어를 그 문자열의 언어로 판별하는 단계를 포함하는 것을 특징으로 하는 언어 판별 방법.
본 발명에 의하면, 각 언어에 특유의 미정의의 문자 코드를 이용하여 판별을 행하기 때문에, 홈페이지(웹페이지)에 기재되어 있는 문자의 인코드를 참조하는 경우처럼, 공통의 인코드 때문에 언어 판별이 어려워질 염려도 없어, 확실하면서도 자동적으로 언어 판별을 행할 수 있다.
(8)언어 판별 대상의 문자열에 포함되는 각 문자의 문자 코드와, 복수의 언어에 대한 각 언어의 문자 코드표에서 문자가 할당되지 않은 미정의의 문자 코드 리스트를 조회하는 단계와, 조회 결과, 상기 복수의 언어 중에서 미정의의 문자 코드에 해당하는 문자가 상기 문자열에 포함되지 않은 언어를 그 문자열의 언어로 판별하는 단계와, 언어 판별된 문자열을 다른 언어로 번역하는 단계를 포함하는 것을 특징으로 하는 번역 처리 방법.
본 발명에 의하면, 언어 판별을 행한 후에 언어 판별된 문자열을 다른 언어로 번역하기 때문에, 확실한 언어 판별에 의해 적정한 언어로 번역할 수 있다.
(9)단말 장치를 통해 사용자가 접속한 웹페이지에 표시되어 있는 문자열에 포함되는 각 문자의 문자 코드와, 복수의 언어에 대한 각 언어의 문자 코드표에서 문자가 할당되지 않은 미정의의 문자 코드 리스트를 조회하는 단계와, 조회 결과, 상기 복수의 언어 중에서 미정의의 문자 코드에 해당하는 문자가 상기 문자열에 포함되지 않은 언어를 그 문자열의 언어로 판별하는 단계와, 언어 판별된 상기 웹페이지의 문자열을 다른 언어로 번역하는 단계와, 번역 결과를 반영시킨 웹페이지를 상기 사용자 단말에 표시시키는 표시 제어 단계를 포함하는 것을 특징으로 하는 번역 처리 방법.
본 발명에 의하면, 사용자가 접속한 웹페이지의 언어를 자동적으로 판별하여 사용자 단말에 번역 결과를 반영시킨 웹페이지를 표시시키므로, 사용자는 웹페이지의 표시 언어의 차이를 의식하지 않고 계속해서 인터넷 서핑을 즐길 수 있다.
도 1은 본 발명의 일실시형태에 따른 웹페이지 번역 시스템의 개략적인 구성을 나타내는 블록도이고,
도 2는 도 1의 웹페이지 번역 시스템에 이용되고 있는 번역 서버의 동작을 나타내는 흐름도이고,
도 3은 도 2의 흐름도에서의 S4의 언어 판별 처리 내용을 나타내는 흐름도이고,
도 4(a) 및 도 4(b)는 기본적인 생각을 설명하기 위한 문자 코드표의 일례를 나타내는 도면이다.
이하, 본 발명의 일실시형태를 설명하기로 한다.
도 1은 본 발명의 일실시형태에 따른 웹페이지 번역 시스템의 개략적인 구성을 나타내는 블록도이다.
도 1에서, 1은 PC(퍼스널 컴퓨터) 등으로 이루어진 사용자 단말이고, 이 사용자 단말(1)은 웹브라우저(11)에 의해 인터넷(2)을 통해 번역 서버(3)에 접속할 수 있도록 되어 있다.
상기 번역 서버(3)는 인터넷 인터페이스부(31)와, 미정의의 문자 코드 리스트 기억부(32)와, 웹페이지 기억부(33)와, 언어 판별부(34)와, 번역부(35)와, 번역 파일 저장부(36)와, 웹페이지 재구축부(37)와, 제어부(38)를 구비하고 있다.
상기 인터넷 인터페이스부(31)는 인터넷(2)과 번역 서버(3)를 접속하는 입출력부로서 기능한다.
상기 미정의의 문자 코드 리스트 기억부(32)에는 복수의 언어에 대한 각 언어마다, 문자 코드표에서의 문자가 할당되지 않은 미정의의 문자 코드의 리스트가 미리 기억되어 있다. 예를 들면, 도 4(a)에 도시하는 A라는 언어에 대해는, 문자 코드표에서의 미정의의 A1∼A16의 문자 코드가 미정의의 문자 코드 리스트로서 기억되어 있다. 또 도 4(b)에 도시하는 B라는 언어에 대해는, 문자 코드표에서의 미정의의 B1∼B6의 문자 코드가 미정의의 문자 코드 리스트로서 기억되어 있다. 또한, 다른 언어에 대해도 마찬가지로, 미정의의 문자 코드 리스트가 미리 기억되어 있다. 이상적으로는, 인터넷상에서 사용되는 모든 언어에 대한 미정의의 문자 코드 리스트가 기억되어 있는 것이 가장 바람직하나, 적어도 주요 언어에 대해 기억되어 있으면 된다. 단, 본 발명은 이것에 한정되지는 않으며, 복수의 언어에 대한 미정의의 문자 코드 리스트가 기억되어 있을 수도 있다.
상기 웹페이지 기억부(33)는 사용자가 사용자 단말(1)에 URL(Uniform Resource Locator)에 의해 지정한 주소를 가진 웹페이지의 내용을 기억하는 것이다.
상기 언어 판별부(34)는 상기 웹페이지 기억부(33)에 기억된 웹페이지에 표시된 문자열의 언어를 자동 판별하는 것이다. 판별 처리의 구체적인 내용은 후술하기로 한다.
상기 번역부(35)는 각 언어에 대응되는 복수의 번역 엔진을 구비하고, 상기 언어 판별부(34)에서 언어 판별된 웹페이지의 문자열을 사용자의 사용 언어로 번역하는 것이다. 예를 들면, 일본어 사용자가 접속한 웹페이지가 영어 사이트의 페이지로 판별된 경우에는, 그 웹페이지의 내용을 일본어로 번역하고, 중국어의 웹페이지에 대해는 중국어를 일본어로 번역한다.
상기 번역 파일 저장부(36)는 번역부(35)에 의한 번역 결과를 저장하고, 상기 웹페이지 재구축부(37)는 번역 결과를 반영한 웹페이지를 재구축한다.
상기 제어부(38)는 번역 서버(3) 전체를 통괄적으로 제어하는 것이다. 예를 들면, 사용자가 지정한 URL의 웹페이지를 다운로드하여 웹페이지 기억부(33)에 기억시키거나, 언어 판별이나 번역을 시키거나, 번역 후의 번역 파일을 번역 파일 저장부(36)에 저장시키거나, 웹페이지 재구축부(37)에 번역 결과를 반영시킨 웹페이지를 재구축시키거나, 재구축시킨 웹페이지를 사용자 단말(1)로 송신하여 표시시키거나 한다.
다음에, 도 1에 도시한 웹페이지 번역 시스템에 있어서 번역 서버(3)의 동작을 설명하기로 한다.
사용자는 사용자 단말(1)로부터 번역 서버(3)에 접속한 후, URL을 지정한다. 번역 서버(3)의 제어부(38)는 URL의 지정이 있었는지의 여부를 판단하고, 없으면(S1의 판단이 NO) 처리를 종료한다. URL의 지정이 있으면(S1의 판단이 YES), S2에서 제어부(38)는 URL에 지정된 웹페이지의 내용을 인터넷 및 인터넷 인터페이스부(31)를 통해 얻은 후, S3에서 얻은 웹페이지의 내용을 웹페이지 기억부(33)에 기억한다.
다음에, S4에서 언어 판별부(34)는 상기 웹페이지 기억부(33)에 기억된 웹페이지에 표시되어 있는 문자열의 언어를 판별한다. 이 언어 판별 처리에 대해는 후술하기로 한다.
언어 판별이 행해지면, S5에서 번역부(35)는 판별된 언어의 번역 엔진을 이 용하여, 그 웹페이지의 문자열을 사용자의 사용 언어(예를 들면, 일본어)로 번역한 후, S6에서 번역 파일을 번역 파일 저장부(36)에 저장한다.
이어서, S7에서 웹페이지 재구축부(37)는 웹페이지 기억부(33)에 기억되어 있는 웹페이지의 내용과 번역 파일 저장부(36)에 저장되어 있는 번역 파일로부터 웹페이지를, 그 문자열을 번역한 내용으로 재구축한다. 그리고, S8에서 제어부(38)는 재구축된 웹페이지의 내용을, 인터넷 인터페이스부(31)를 통해 사용자 단말(1)로 송신하여, 번역 서버(3) 측 처리를 종료한다.
사용자 단말(1)로 송신된 번역 후의 웹페이지는, 사용자 단말(1)의 표시 장치(미도시)에 표시되고, 이로써 사용자는 접속한 웹페이지를 사용자의 언어로 볼 수 있다.
사용자가, 표시된 웹페이지에서 링크할 곳을 지정하면, 이번에는 그 링크된 웹페이지에 대해 도 2에 도시한 것과 동일한 처리가 행해지고, 사용자의 언어로 자동적으로 번역된 링크된 웹페이지를 사용자는 볼 수 있다.
이러한 처리에 의해, 사용자는 웹페이지의 표시 언어의 차이를 의식하지 않고 계속해서 인터넷 서핑을 즐길 수 있다.
도 3은 도 2의 흐름도에서의 S4의 언어 판별 처리 내용을 나타내는 흐름도이다.
S41에서, 언어 판별부(34)는 번역 대상의 웹페이지에서 사용되고 있는 문자열을 추출한 후, 그 문자열의 첫번째 문자에 대해, 그 문자 코드가 미정의의 문자 코드 리스트 기억부(32)에 기억되어 있는 하나의 언어, 예를 들면 도 4(a)에 도시 한 A언어의 미정의의 문자 코드(도 4(a)에서는 A1∼A16)에 해당하는지의 여부를 판단한다.
해당하지 않으면(S42의 판단이 NO) S44로 이동한다. 해당하면(S42의 판단이 YES), A언어의 미정의의 문자 코드에 문자가 정의되어 있게 되고, 따라서 그 문자의 언어는 A가 아닌 것이 된다. 이 때문에, S43에서 A언어가 아니라고 판별한 후, S44로 이동한다.
S44에서는, 상기 문자열의 첫번째 문자가 다른 언어, 예를 들면 도 4(b)에 도시한 B언어의 미정의의 문자 코드(도 4(b)에서는 B1∼B6)에 해당하는지의 여부를 판단한다.
해당하지 않으면(S44의 판단이 NO), 다음 언어에 대해 조회한다. 해당하면(S44의 판단이 YES), B언어의 미정의의 문자 코드에 문자가 정의되어 있게 되고, 따라서 그 문자의 언어는 B가 아닌 것이 된다. 이 때문에, S45에서 B언어가 아니라고 판별한다.
이와 같이 하여, 상기 문자열의 첫번째 문자에 대해, 미정의의 문자 코드 리스트 기억부(32)에 기억되어 있는 모든 언어에 대한 미정의의 문자 코드 리스트와의 조회를 실행한다.
그리고 S46에서, 첫번째 문자에 대해 모든 언어와의 조회를 종료했는지의 여부를 판단한다. 종료하지 않았다면(S46의 판단이 NO), S42로 리턴하여 모든 언어와의 조회가 종료될 때까지 조회를 계속한다. 첫번째 문자에 대해 모든 언어와의 조회가 종료되었다면(S46의 판단이 YES), S47에서 언어의 후보가 하나로 압축되었는지의 여부를 판단한다.
하나의 후보로 압축되지 않았다면(S47의 판단이 NO), S42로 리턴하여, 이번에는 문자열의 제2 문자에 대해, S42∼S46의 조회 처리에 의한 언어 후보의 압축을 실행한다. 언어의 후보가 하나로 압축될 때까지, 문자열의 세번째 문자, 네번째 문자, …에 대해 조회 처리를 실행한다.
이와 같이 문자열의 하나의 문자마다 각 언어의 미정의의 문자 코드와의 조회를 행하므로, 조회 처리 및 언어의 압축을 신속하면서도 확실하게 행할 수 있다.
S47에서, 언어의 후보가 하나로 압축되면(S47의 판단이 YES), S48에서 그 언어를 그 문자열의 언어라고 판별한다.
또한, 도 3의 판별 처리에서는, 언어 후보가 하나로 압축된 단계에서 그 언어 후보를 웹페이지의 사용 언어로 판별했으나, 문자열의 모든 문자에 대해, 모든 언어의 미정의의 문자 코드 리스트와의 조회를 행한 후에 언어를 판별할 수도 있다.
이상, 본 발명의 일실시형태를 설명했으나, 본 발명은 상기 실시형태에만 한정되는 것은 아니다. 예를 들면, 웹페이지 번역 시스템에 있어서 웹페이지의 언어를 판별하는 경우를 설명했으나, 웹페이지의 언어 판별에만 한정되는 것은 아니며, 자동 언어 판별을 행하는 모든 경우에 있어서 본 발명에 따른 언어 판별 장치 및 언어 판별 방법을 적용할 수 있다.
본원은 2004년 5월 31일자로 출원된 일본 특허 출원 특원2004-161801호의 우 선권 주장을 수반하는 것으로, 그 개시 내용은 그대로 본원의 일부를 구성하는 것이다.
여기서 사용된 용어 및 표현은 설명의 편의를 위해서 사용된 것으로서, 한정적으로 해석하기 위해서 사용된 것은 아니며, 여기에 도시 및 설명된 특징 사항의 어떠한 균등물도 배제하는 것은 아니며, 본 발명의 특허청구범위 내에서의 각종 변형도 허용하는 것으로 인식되어야 한다.

Claims (9)

  1. 복수의 언어에 대해, 각 언어의 문자 코드표에서 문자가 할당되지 않은 미정의의 문자 코드 리스트를 기억하는 기억 수단과,
    언어 판별 대상의 문자열에 포함되는 각 문자의 문자 코드와, 상기 기억 수단에 기억되어 있는 각 언어의 미정의의 문자 코드 리스트를 조회하는 조회 수단과,
    조회 수단에 의한 조회 결과, 상기 복수의 언어 중에서 미정의의 문자 코드에 해당하는 문자가 상기 문자열에 포함되지 않은 언어를 그 문자열의 언어로 판별하는 판별 수단을 구비하는 것을 특징으로 하는 언어 판별 장치.
  2. 청구항 1에 있어서, 상기 조회 수단은 상기 문자열에 포함되는 각 문자마다, 그 문자 코드와 각 언어의 미정의의 문자 코드 리스트를 조회해 가는, 언어 판별 장치.
  3. 복수의 언어에 대해, 각 언어의 문자 코드표에서 문자가 할당되지 않은 미정의의 문자 코드 리스트를 기억하는 기억 수단과,
    언어 판별 대상의 문자열에 포함되는 각 문자의 문자 코드와, 상기 기억 수단에 기억되어 있는 각 언어의 미정의의 문자 코드 리스트를 조회하는 조회 수단과,
    조회 수단에 의한 조회 결과, 상기 복수의 언어 중에서 미정의의 문자 코드에 해당하는 문자가 상기 문자열에 포함되지 않은 언어를 그 문자열의 언어로 판별하는 판별 수단과,
    상기 판별 수단에 의해 언어 판별된 문자열을 다른 언어로 번역하는 번역 수단을 구비하는 것을 특징으로 하는 번역 장치.
  4. 청구항 3에 있어서, 상기 조회 수단은 상기 문자열에 포함되는 각 문자마다, 그 문자 코드와 각 언어의 미정의의 문자 코드 리스트를 조회해 가는, 번역 장치.
  5. 복수의 언어에 대해, 각 언어의 문자 코드표에서 문자가 할당되지 않은 미정의의 문자 코드 리스트를 기억하는 기억 수단과,
    단말 장치를 통해 사용자가 접속한 웹페이지에 표시되어 있는 문자열에 포함되는 각 문자의 문자 코드와, 상기 기억 수단에 기억되어 있는 각 언어의 미정의의 문자 코드 리스트를 조회하는 조회 수단과,
    조회 수단에 의한 조회 결과, 상기 복수의 언어 중에서 미정의의 문자 코드에 해당하는 문자가 상기 문자열에 포함되지 않은 언어를 그 문자열의 언어로 판별하는 판별 수단과,
    상기 판별 수단에 의해 언어 판별된 상기 웹페이지의 문자열을 다른 언어로 번역하는 번역 수단과,
    번역 결과를 반영시킨 웹페이지를, 상기 사용자 단말에 표시시키는 표시 제 어 수단을 구비하는 것을 특징으로 하는 번역 서버.
  6. 청구항 5에 있어서, 상기 조회 수단은 상기 문자열에 포함되는 각 문자마다, 그 문자 코드와 각 언어의 미정의의 문자 코드 리스트를 조회해 가는, 번역 장치.
  7. 언어 판별 대상의 문자열에 포함되는 각 문자의 문자 코드와, 복수의 언어에 대한 각 언어의 문자 코드표에서 문자가 할당되지 않은 미정의의 문자 코드 리스트를 조회하는 단계와,
    조회 결과, 상기 복수의 언어 중에서 미정의의 문자 코드에 해당하는 문자가 상기 문자열에 포함되지 않은 언어를 그 문자열의 언어로 판별하는 단계를 포함하는 것을 특징으로 하는 언어 판별 방법.
  8. 언어 판별 대상의 문자열에 포함되는 각 문자의 문자 코드와, 복수의 언어에 대한 각 언어의 문자 코드표에서 문자가 할당되지 않은 미정의의 문자 코드 리스트를 조회하는 단계와,
    조회 결과, 상기 복수의 언어 중에서 미정의의 문자 코드에 해당하는 문자가 상기 문자열에 포함되지 않은 언어를 그 문자열의 언어로 판별하는 단계와,
    언어 판별된 문자열을 다른 언어로 번역하는 단계를 포함하는 것을 특징으로 하는 번역 처리 방법.
  9. 단말 장치를 통해 사용자가 접속한 웹페이지에 표시되어 있는 문자열에 포함되는 각 문자의 문자 코드와, 복수의 언어에 대한 각 언어의 문자 코드표에서 문자가 할당되지 않은 미정의의 문자 코드 리스트를 조회하는 단계와,
    조회 결과, 상기 복수의 언어 중에서 미정의의 문자 코드에 해당하는 문자가 상기 문자열에 포함되지 않은 언어를 그 문자열의 언어로 판별하는 단계와,
    언어 판별된 상기 웹페이지의 문자열을 다른 언어로 번역하는 단계와,
    번역 결과를 반영시킨 웹페이지를 상기 사용자 단말에 표시시키는 표시 제어 단계를 포함하는 것을 특징으로 하는 번역 처리 방법.
KR1020067027921A 2004-05-31 2005-05-30 언어 판별 장치, 번역 장치, 번역 서버, 언어 판별 방법 및번역 처리 방법 KR20070049606A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2004-00161801 2004-05-31
JP2004161801A JP4384939B2 (ja) 2004-05-31 2004-05-31 言語判別装置、翻訳装置、翻訳サーバ、言語判別方法並びに翻訳処理方法

Publications (1)

Publication Number Publication Date
KR20070049606A true KR20070049606A (ko) 2007-05-11

Family

ID=35451530

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067027921A KR20070049606A (ko) 2004-05-31 2005-05-30 언어 판별 장치, 번역 장치, 번역 서버, 언어 판별 방법 및번역 처리 방법

Country Status (7)

Country Link
US (1) US20080281577A1 (ko)
EP (1) EP1760608A2 (ko)
JP (1) JP4384939B2 (ko)
KR (1) KR20070049606A (ko)
CN (1) CN101027665A (ko)
TW (1) TW200606664A (ko)
WO (1) WO2005116865A2 (ko)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4812421B2 (ja) * 2005-12-22 2011-11-09 オリンパスイメージング株式会社 文字処理装置、文字処理プログラム、文字処理方法
US7849144B2 (en) * 2006-01-13 2010-12-07 Cisco Technology, Inc. Server-initiated language translation of an instant message based on identifying language attributes of sending and receiving users
US20090287471A1 (en) * 2008-05-16 2009-11-19 Bennett James D Support for international search terms - translate as you search
US8374873B2 (en) * 2008-08-12 2013-02-12 Morphism, Llc Training and applying prosody models
US8548797B2 (en) * 2008-10-30 2013-10-01 Yahoo! Inc. Short text language detection using geographic information
EP2680162A1 (en) 2010-07-13 2014-01-01 Motionpoint Corporation Localisation of website content
US8635061B2 (en) * 2010-10-14 2014-01-21 Microsoft Corporation Language identification in multilingual text
US9164988B2 (en) * 2011-01-14 2015-10-20 Lionbridge Technologies, Inc. Methods and systems for the dynamic creation of a translated website
US20120215520A1 (en) * 2011-02-23 2012-08-23 Davis Janel R Translation System
US8942974B1 (en) * 2011-03-04 2015-01-27 Amazon Technologies, Inc. Method and system for determining device settings at device initialization
US9031829B2 (en) 2013-02-08 2015-05-12 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8996355B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for reviewing histories of text messages from multi-user multi-lingual communications
US9600473B2 (en) 2013-02-08 2017-03-21 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9298703B2 (en) 2013-02-08 2016-03-29 Machine Zone, Inc. Systems and methods for incentivizing user feedback for translation processing
US8990068B2 (en) 2013-02-08 2015-03-24 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8996352B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US9231898B2 (en) 2013-02-08 2016-01-05 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8996353B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US10650103B2 (en) 2013-02-08 2020-05-12 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
US9280537B2 (en) * 2013-10-30 2016-03-08 Google Inc. Techniques for automatically selecting a natural language for configuring an input method editor at a computing device
US9128930B2 (en) * 2013-10-31 2015-09-08 Tencent Technology (Shenzhen) Company Limited Method, device and system for providing language service
US10162811B2 (en) 2014-10-17 2018-12-25 Mz Ip Holdings, Llc Systems and methods for language detection
US9372848B2 (en) 2014-10-17 2016-06-21 Machine Zone, Inc. Systems and methods for language detection
CN104794625A (zh) * 2015-04-28 2015-07-22 酷悠悠科技(深圳)有限公司 一种跨境电子商务网站运行的方法及系统
US10765956B2 (en) 2016-01-07 2020-09-08 Machine Zone Inc. Named entity recognition on chat data
WO2019060353A1 (en) 2017-09-21 2019-03-28 Mz Ip Holdings, Llc SYSTEM AND METHOD FOR TRANSLATION OF KEYBOARD MESSAGES
CN111274458B (zh) * 2020-01-17 2023-12-01 中国工商银行股份有限公司 一种应用软件的多语言核对方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020002452A1 (en) * 2000-03-28 2002-01-03 Christy Samuel T. Network-based text composition, translation, and document searching
US20030115040A1 (en) * 2001-02-09 2003-06-19 Yue Xing International (multiple language/non-english) domain name and email user account ID services system
US7013289B2 (en) * 2001-02-21 2006-03-14 Michel Horn Global electronic commerce system
FI20010792A (fi) * 2001-04-17 2002-10-18 Nokia Corp Käyttäjäriippumattoman puheentunnistuksen järjestäminen
US7225222B1 (en) * 2002-01-18 2007-05-29 Novell, Inc. Methods, data structures, and systems to access data in cross-languages from cross-computing environments

Also Published As

Publication number Publication date
WO2005116865A2 (ja) 2005-12-08
JP2005346166A (ja) 2005-12-15
CN101027665A (zh) 2007-08-29
JP4384939B2 (ja) 2009-12-16
EP1760608A2 (en) 2007-03-07
TW200606664A (en) 2006-02-16
US20080281577A1 (en) 2008-11-13

Similar Documents

Publication Publication Date Title
KR20070049606A (ko) 언어 판별 장치, 번역 장치, 번역 서버, 언어 판별 방법 및번역 처리 방법
US6647364B1 (en) Hypertext markup language document translating machine
RU2295150C2 (ru) Сегмент данных о переводе
US8516155B1 (en) Dynamic content conversion
CN1494695B (zh) 无疏漏翻译系统
US8260964B2 (en) Dynamic content conversion
US20110137943A1 (en) Apparatus for deciding word-related keywords, and method and program for controlling operation of same
EP2035950A1 (en) A method of managing web services using integrated document
JP2007128367A (ja) 情報検索ノウハウ管理システム
CN105787032B (zh) 网页快照的生成方法及装置
KR100946922B1 (ko) 블록 북마크를 이용한 동적 컨텐츠 제공 방법 및 시스템
JP2006155275A (ja) 情報抽出方法及び情報抽出装置
CN104504070B (zh) 一种搜索的方法和装置
JP4448724B2 (ja) ウェブブラウザのアクセシビリティ検査プログラム
US11256776B2 (en) System and method for on-the-fly conversion of non-accessible online documents to accessible documents
JP4756764B2 (ja) プログラム及び情報処理装置並びに情報処理方法
KR100953627B1 (ko) 웹 페이지에 포함되는 이미지 상의 텍스트를 판독하고 이에대한 번역 서비스를 제공하기 위한 방법, 장치 및 컴퓨터판독 가능한 기록 매체
US10789245B2 (en) Semiconductor parts search method using last alphabet deletion algorithm
JP7346891B2 (ja) ウェブページ多言語化装置、方法、プログラム、およびシステム
KR100565789B1 (ko) 하이퍼 링크된 웹 페이지를 인쇄할 수 있는 화상형성장치및 그의 화상형성방법
WO2007000679A2 (en) Presentation of hyperlinks in a document
JP5276903B2 (ja) 閲覧システム、プラグインプログラム、ならびに、紹介プログラム
KR20080000034A (ko) 자국어 키워드 안내 시스템 및 방법
JPH11259477A (ja) 文書処理システムおよび記録媒体
JPH09265469A (ja) ハイパーテキスト型文書の翻訳方法およびhtml文書の翻訳装置

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid