KR101076858B1 - 언어 번역 서비스를 사용자에게 제공하는 방법, 언어 번역 서비스를 제공하기 위해 서버를 동작시키는 방법, 및 이를 구현하는 장치 - Google Patents

언어 번역 서비스를 사용자에게 제공하는 방법, 언어 번역 서비스를 제공하기 위해 서버를 동작시키는 방법, 및 이를 구현하는 장치 Download PDF

Info

Publication number
KR101076858B1
KR101076858B1 KR1020040011839A KR20040011839A KR101076858B1 KR 101076858 B1 KR101076858 B1 KR 101076858B1 KR 1020040011839 A KR1020040011839 A KR 1020040011839A KR 20040011839 A KR20040011839 A KR 20040011839A KR 101076858 B1 KR101076858 B1 KR 101076858B1
Authority
KR
South Korea
Prior art keywords
language
translation
user
database
input
Prior art date
Application number
KR1020040011839A
Other languages
English (en)
Other versions
KR20040076213A (ko
Inventor
조우밍
가오지안펭
Original Assignee
마이크로소프트 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마이크로소프트 코포레이션 filed Critical 마이크로소프트 코포레이션
Publication of KR20040076213A publication Critical patent/KR20040076213A/ko
Application granted granted Critical
Publication of KR101076858B1 publication Critical patent/KR101076858B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

서버로부터 정보의 선택적인 다운로딩을 통해 무선 모바일 디바이스에 제공되는 번역 서비스가 개시된다. 다운로딩된 정보는 언어 독립 번역 엔진과, 적어도 하나의 언어 종속 번역 데이터베이스를 구비한 번역 아키텍쳐를 포함한다. 언어 종속 번역 데이터베이스는 번역 템플레이트 및 번역 디렉토리를 포함한다. 전세계에서 선택된 도시 또는 도시들에 대한 특정한 데이터베이스가 또한 다운로딩될 수 있다. 언어들간의 번역은 언어 종속 번역 데이터베이스 및 선택적으로 도시 특정 번역 데이터베이스를 번역 엔진에 적용함에 의해 실현된다. 번역 엔진은 번역 프로세스를 간략화하기 위해 사용자 구동 용어 대체 스킴을 구현한다.
Figure R1020040011839
언어 번역, 컴퓨팅 디바이스, 클라이언트, 서버, 언어 데이터베이스

Description

언어 번역 서비스를 사용자에게 제공하는 방법, 언어 번역 서비스를 제공하기 위해 서버를 동작시키는 방법, 및 이를 구현하는 장치{METHODS AND SYSTEMS FOR LANGUAGE TRANSLATION}
도 1은 예시적인 컴퓨팅 디바이스의 블럭도이다.
도 2는 예시적인 컴퓨팅 디바이스의 블럭도이다.
도 3은 예시적인 컴퓨팅 시스템 환경의 블럭도이다.
도 4는 입력에서 번역까지의 플로우 프로세스를 예시하는 일반적인 플로우도이다.
도 5는 입력에서 번역까지의 전반적인 플로우 프로세스를 예시하는 보다 상세한 플로우도이다.
〈도면의 주요 부분에 대한 부호의 설명〉
100: 컴퓨팅 시스템
110: 컴퓨터
120: 프로세싱 유닛
121: 시스템 버스
130: 시스템 메모리
131: ROM
132: RAM
133: BIOS
134: 오퍼레이팅 시스템
135: 어플리케이션 프로그램
136: 다른 프로그램 모듈
137: 프로그램 데이터
141: 하드 디스크 드라이브
151: 자기 디스크 드라이브
155: 광 디스크 드라이브
본 발명은 언어 번역에 관한 것이다. 특히, 본 발명은 네트워크를 통해 디바이스에 제공되는 번역 서비스에 관한 것이다.
상호교류가 증가하고 있는 현대 세계에서, 언어 장벽으로 인해 대화에 어려움이 있는 특정 경우가 점점 더 자주 일어나게 되었다. 전형적인 시나리오는 자신에게 일어나는, 국가와 연관된 자연어를 이해할 수 없는 외국 여행자이다. 이런 여행자는 원주민과 가장 간단한 문장으로도 대화하기 어렵다. 예컨대, 방문하고 있는 국가에 연관된 언어의 지식이 없는 외국 여행자는 간단한 일을 수행하기 위해서 지역 사람들과 일상의 대화를 하는데 어려움이 있다. 이런 일이란, 호텔 체크-인 및 체크-아웃과, 택시 타기, 화장실 찾기, 또는 환전 -단지 예로서 몇가지만 들 었다 -을 포함한다.
무선 모바일 디바이스(즉, 개인용 휴대 단말기, 포켓 PC's, 팜 컴퓨터, 휴대용 컴퓨터, 스마트 폰, 지능형 모바일 폰 등)의 인기가 장차 계속 증가할 것으로 예상된다. 이런 인기의 증가는 무선 및 3G 통신 서비스의 비용 감소와 동시에 일어날 것으로 예상된다.
따라서, 시간이 갈수록, 모바일 디바이스용의 효율적이고 효과적인 범용 언어 번역 시스템을 개발할 필요성이 점점 증가될 것이다. 이런 시스템을 구현한 디바이스는 언어 장벽에 의한 난제를 극복하길 원하는 외국 여행자와 같은 개인들을 보조할 것이다. 그러나, 기술적 제한으로, 자유문(free text)(즉, 실질적으로 무제한의 텍스트)에 대한 고품질 번역을 제공하는데 어려움이 있다. 이들 제한은 진정으로 효율적이고 효과적인 모바일 번역 시스템을 가능하게 하기 위해 극복 또는 회피되야만 한다.
본 발명의 실시예는 일반적으로 다른 언어들을 말하는 개인들간에 대화를 용이하게 하는 모바일 언어 번역기에 관한 것이다. 몇가지 특정 실시예들은 서버로부터 정보의 선택적인 다운로딩을 통해 무선 모바일 디바이스에 제공되는 번역 서비스에 관한 것이다. 다운로드된 정보는 언어 독립 번역 엔진(language independent translation engine) 및 적어도 하나의 언어 종속 번역 데이터베이스를 구비한 번역 아키텍쳐(architecture)를 포함한다. 언어 종속 번역 데이터베이스는 번역 템플레이트(template) 및 번역 사전을 포함한다. 전세계에서 선택된 도 시 또는 도시들에 대한 특정 데이터베이스가 또한 다운로드될 수 있다. 언어들간의 번역은 언어 종속 번역 데이터베이스와 선택적인 도시 특정 번역 데이터베이스를 번역 엔진에 적용함에 의해 실현된다. 번역 엔진은 번역 프로세스를 간략화하기 위한 사용자 구동 용어 교체 스킴(term replacement scheme)으로 구현된다.
Ⅰ. 예시적인 적당한 컴퓨팅 디바이스
도 1은 본 발명의 실시예가 구현되는 적당한 컴퓨팅 시스템(100)의 예를 도시한다. 컴퓨팅 시스템(100)은 적당한 컴퓨팅 시스템의 단지 일예이지, 본 발명의 사용 또는 기능의 범위에 대한 어떠한 제한을 제한하고자 하는 것이 아니다. 또한, 컴퓨팅 시스템(100)은 예시된 구성요소들중 어느 하나 또는 그 조합에 관련되는 어떠한 종속성 또는 요건을 갖는 것으로 해석되서는 안된다.
도 1을 참조하면, 본 발명에 적당한 예시적인 디바이스는 컴퓨터(110)의 형태에서 범용 컴퓨팅 디바이스를 포함한다. 컴퓨터(110)의 구성요소는 제한적이지 않은 것으로서, 프로세싱 유닛(120), 시스템 메모리(130), 및 시스템 메모리를 포함하는 여러 시스템 구성요소를 프로세싱 유닛(120)에 연결시키는 시스템 버스(121)를 포함한다. 시스템 버스(121)는 메모리 버스 또는 메모리 제어기, 주변 버스, 및 여러 버스 아키텍쳐들중 어느 하나를 이용하는 로컬 버스를 포함하는 버스 구조의 여러 타입들중의 어느 하나일 수 있다. 예로서 제한되지 않는 이런 아키텍쳐는 ISA(Industry Standard Architecture) 버스, MCA(Micro Channel Architecture) 버스, EISA(Enhanced ISA) 버스, VESA(Video Electronics Standards Association) 로컬 버스, 및 PCI(Peripheral Component Interconnect) 버스(또한 Mezzanine 버스로 알려짐)를 포함한다.
컴퓨터(110)는 여러 컴퓨터 판독가능한 매체를 전형적으로 포함한다. 컴퓨터 판독가능한 매체는 컴퓨터(110)에 의해 액세스될 수 있는 소정의 이용가능한 매체일 수 있으며, 휘발성 및 비휘발성 매체 모두와, 제거가능한 그리고 제거가능하지 않는 매체를 포함한다. 예로서 제한되지 않는 컴퓨터 판독가능한 매체는 저장 매체 및 통신 매체를 포함한다. 컴퓨터 저장 매체는 예컨대 컴퓨터 판독가능한 지시, 데이터 구조, 프로그램 모듈 또는 다른 데이터와 같은 정보 저장용의 임의의 방법 또는 기술에서 구현되는 휘발성 및 비휘발성 모두와, 제거가능한 그리고 제거가능하지 않는 매체를 포함한다. 컴퓨터 저장 매체는 제한적이지 않는 RAM, ROM, EEPROM, 플레시 메모리 또는 다른 메모리 기술, CD-ROM, DVD(digital versatile disks) 또는 다른 광 디스크 저장, 자기 카세트, 자기 테이프, 자기 디스크 저장 또는 다른 자기 저장 디바이스들, 또는 소정의 정보를 저장하는데 사용될 수 있으며 컴퓨터(110)에 의해 액세스될 수 있는 임의의 다른 매체를 포함한다.
통신 매체는 전형적으로 컴퓨터 판독가능한 지시, 데이터 구조, 프로그램 모듈, 또는 캐리어 파 또는 다른 운송 메카니즘과 같은 변조된 데이터 신호에서의 다른 데이터를 구현하며, 임의의 정보 전달 매체를 포함한다. 하나 이상의 특징을 갖는 "변조된 데이터 신호"는 신호에서 정보를 인코딩하는 것과 같은 방식으로 세트 또는 변경된다. 예로서 제한되지 않는 통신 매체는 유선 네트워크 또는 다이렉트-유선 연결과 같은 유선 매체와, 음향, RF, 적외선 및 다른 무선 매체와 같은 무 선 매체를 포함한다. 상술한 것들이 조합은 컴퓨터 판독가능한 매체의 범위내에서 또한 포함되야만 한다.
시스템 메모리(130)는 ROM(131) 및 RAM(132)과 같은 휘발성 및/또는 비휘발성 메모리의 형태로 컴퓨터 저장 매체에 포함된다. 예컨대, 기동 동안 컴퓨터(110)내의 구성요소들간에 정보를 전달하는데 도움이 되는 기본 루틴을 포함하는 기본 입출력 시스템(133)(BIOS)은 ROM(131)에 전형적으로 저장된다. RAM(132)은 프로세싱 유닛(120)에 의해 즉시 액세스될 수 있으며 및/또는 현재 동작하는 데이터 및/또는 프로그램 모듈을 전형적으로 포함한다. 예로서 제한적이지 않게, 도 1은 오퍼레이팅 시스템(134), 어플리케이션 프로그램(135), 다른 프로그램 모듈(136), 및 프로그램 데이터(137)를 예시한다.
컴퓨터(110)는 다른 제거가능한/제거가능하지 않은 휘발성/비휘발성 컴퓨터 저장 매체를 또한 포함한다. 단지 예로서, 도 1은 제거가능하지 않은 비휘발성 자기 매체로부터 판독 또는 이에 기록하는 하드 디스크 드라이브(141), 제거가능한 비휘발성 자기 디스크(152)로부터 판독 또는 이에 기록하는 하드 디스크 드라이브(151), 및 제거가능한 비휘발성 광 디스크(156), 예컨대 CD-ROM 또는 다른 광 매체로부터 판독 또는 이에 기록하는 광 디스크 드라이브(155)를 예시한다. 예시적인 오퍼레이팅 환경에서 사용될 수 있는 다른 제거가능한/제거가능하지 않은 휘발성/비휘발성 컴퓨터 저장 매체는 제한적이지 않게 자기 테이프 카세트, 플레시 메모리 카드, DVD, 디지털 비디오 테이프, 고체 상태 RAM, 고체 상태 ROM 등을 포함한다. 하드 디스크 드라이브(141)는 인터페이스(140)와 같은 제거가능하지 않은 메모리 인터페이스를 통해 시스템 버스(121)에 전형적으로 연결되며, 자기 디스크 드리이브(151) 및 광 디스크 드라이브(155)는 인터페이스(150)와 같은 제거가능한 메모리 인터페이스에 의해 시스템 버스(121)에 전형적으로 연결된다.
도 1에서 예시하는 드라이브 및 그 연관된 컴퓨터 저장 매체는 컴퓨터 판독가능한 지시, 데이터 구조, 프로그램 모듈 및 컴퓨터(110)용의 다른 데이터의 저장을 제공한다. 도 1에서, 예컨대, 하드 디스크 드라이브(141)는 오퍼레이팅 시스템(144), 어플리케이션 프로그램(145), 다른 프로그램 모듈(146) 및 프로그램 데이터(147)를 저장하는 것으로 도시된다. 이들 구성요소들이 오퍼레이팅 시스템(134), 어플리케이션 프로그램(135), 다른 프로그램 모듈(136) 및 프로그램 데이터(137)과 동일 또는 다를 수 있음에 유의해야 한다. 오퍼레이팅 시스템(144), 어플리케이션 프로그램(145), 다른 프로그램 모듈(146) 및 프로그램 데이터(147)는 최소한 이들이 다른 사본들임을 예시하기 위해 다른 번호로 주어졌다.
사용자는 커맨드 및 정보를 입력 장치, 예컨대 키보드(162), 마이크로폰(163), 및 마우스, 트랙볼 또는 터치 패드와 같은 포인팅 디바이스(161)를 통해 기입(enter)된다. 다른 입력 디바이스(도시 안됨)는 조이스틱, 게임 패드, 접시 위성, 스캐너 등을 포함한다. 이들 및 다른 입력 디바이스들은 시스템 버스에 연결되는 사용자 입력 인터페이스(160)를 통해 프로세싱 유닛(120)에 종종 연결되나, 다른 인터페이스와, 병렬 포트, 게임 포트 또는 USB(Universal Serial Bus)와 같은 버스 구조에 의해 연결될 수 있다. 모니터(191) 또는 다른 타입의 디 스플레이 디바이스는 비디오 인터페이스(190)와 같은 인터페이스를 통해 시스템 버스(121)에 또한 연결된다. 모니터외에 컴퓨터는 다른 주변 출력 디바이스들, 예컨대 출력 주변 인터페이스(195)를 통해 연결되는 스피커(197) 및 프린터(196)를 또한 포함한다.
컴퓨터(110)는 하나 이상의 원격 컴퓨터들, 예컨대 원격 컴퓨터(180)와의 논리 접속을 이용하는 네트워킹된 환경에서 동작한다. 원격 컴퓨터(180)는 개인용 컴퓨터, 휴대용 디바이스, 서버, 라우터, 네트워크 PC, 피어 디바이스 또는 다른 공통 네트워크 노드일 수 있으며, 컴퓨터(110)와 관련된 상술한 요소들 모두 또는 그들중 많은 수를 전형적으로 포함한다. 도 1에 도시된 이런 논리 접속은 LAN(Local Area Network)(171) 및 WAN(Wide Area Network)(173)을 포함하나, 다른 네트워크를 또한 포함할 수 있다. 이런 네트워킹 환경은 사무실, 기업체 컴퓨터 네트워크, 인트라넷 및 인터넷에서 통용되고 있다.
LAN 네트워킹 환경에서 사용될 때, 컴퓨터(110)는 네트워크 인터페이스 또는 어뎁터(170)를 통해 LAN(171)에 접속된다. WAN 네트워킹 환경에서 사용될 때, 컴퓨터(110)는 모뎀(172)과, 인터넷과 같은 WAN(173)을 통한 통신을 구축하는 다른 수단을 전형적으로 포함한다. 내부 또는 외부에 있는 모뎀(172)은 사용자 입력 인터페이스(160)를 통해 시스템 버스(121) 또는 적당한 메카니즘에 연결된다. 네트워킹된 환경에서, 컴퓨터(110)와 관련되서 도시된 프로그램 모듈, 또는 그 일부는 원격 메모리 저장 디바이스에 저장된다. 예로서 제한적이지 않게, 도 1은 원격 컴퓨터(180)상에 상주하는 원격 어플리케이션 프로그램(185)을 예시한다. 도시된 네 트워크 접속은 예시적이며, 컴퓨터들간에 통신 링크를 구축하는 다른 수단이 사용될 수 있음을 이해해야 한다.
본 발명이 도 1에 관해 설명된 것과 같은 컴퓨터 시스템과 연관되서 수행될 수 있음에 또한 유의해야 한다. 그러나, 본 발명은 서버, 메시지 조작 전용 컴퓨터와 연관되서, 또는 본 발명의 다른 부분들이 분배 컴퓨팅 시스템의 다른 부분상에서 수행되는 분배 시스템상에서, 유사하게 수행될 수 있다.
Ⅱ. 다른 예시적인 적당한 컴퓨팅 디바이스
도 2는 모바일 컴퓨팅 디바이스(200)의 블럭도이다. 모바일 디바이스(200)는 마이크로프로세서(202), 메모리(204), 입출력(I/O) 구성요소들(206), 및 원격 컴퓨터들 또는 다른 모바일 디바이스들과 통신하기 위한 통신 인터페이스(208)을 포함한다. 일 실시예에서, 디바이스(200)의 내부 구성요소들은 적당한 버스(210)를 통해 서로 통신하도록 연결된다.
디바이스(200)는 본 발명이 구현되는 적당한 컴퓨팅 디바이스의 예이다. 디바이스(200)는 이런 디바이스의 단지 일예이며, 본 발명의 사용 또는 기능의 범위에 관한 어떠한 제한을 제안하고자 하는 것이 아니다. 또한, 디바이스(200)는 예시적인 디바이스(200)에서 예시된 구성요소들중 어느 하나 또는 조합에 관한 어떠한 종속성 또는 요건을 갖는 것으로 해석되서는 안된다.
메모리(204)는 배터리 백업 모듈(도시 안됨)을 갖는 RAM과 같은 비휘발성 전자 메모리로서 구현되어, 모바일 디바이스(200)로의 일반적인 전력이 차단될 때 메모리(204)에 저장된 정보가 상실되지 않게 된다. 메모리(204)의 일부는 프로그램 실행용 어드레스가능한 메모리로서 바람직하게 할당되며, 메모리(204)의 다른 부분은 예컨대 디스크 드라이브상에서 저장을 시뮬레이트하는 것과 같은 저장을 위해 바람직하게 사용된다.
메모리(204)는 오퍼레이팅 시스템(212), 어플리케이션 프로그램(214)과 또한 오브젝트 스토어(store)(216)를 포함한다. 오퍼레이팅 시스템(212)은 메모리(204)로부터 프로세서(202)에 의한 동작 동안 바람직하게 실행된다. 하나의 바람직한 실시예에서, 오퍼레이팅 시스템(212)은 마이크로소프트(사)로부터 상용가능한 WINDOWS? CE 브랜드 오퍼레이팅 시스템이다. 오퍼레이팅 시스템(212)은 바람직하게 모바일 디바이스들용으로 설계되며, 노출된 어플리케이션 프로그래밍 인터페이스 및 방법의 세트를 통해 어플리케이션(214)에 의해 활용될 수 있는 데이터베이스 특성을 구현한다. 오브젝트 스토어(216)에서의 오브젝트는 노출된 어플리케이션 프로그래밍 인터페이스 및 방법의 호출에 적어도 부분적으로 응답하여, 어플리케이션(214) 및 오퍼레이팅 시스템(212)에 의해 유지된다.
통신 인터페이스(208)는 모바일 디바이스(200)가 정보를 전송 및 수신하게 하는 수많은 디바이스들 및 기술을 나타낸다. 이 디바이스들은 예를 들어, 유선 및 무선 모뎀, 위성 수신기 및 방송 튜너를 포함한다. 모바일 디바이스(200)는 데이터 교환을 위해 컴퓨터에 직접 연결될 수 있다. 이런 경우, 통신 인터페이스(208)는 적외선 송수신기, 또는 직렬 또는 병렬 통신 접속일 수 있으며, 이들 모두는 스트리밍 정보를 송신할 수 있다.
입출력 구성요소(206)는 각종 입력 디바이스, 예컨대 터치-감도 스크린, 버 튼, 롤러, 및 마이크로폰과, 오디오 발생기, 진동 디바이스 및 디스플레이를 포함하는 각종 출력 디바이스들중 어느 하나일 수 있다. 상기 리스트된 디바이스들은 예시적인 것이며, 모두가 모바일 디바이스(200)에 존재할 필요는 없다. 또한, 다른 입출력 디바이스들은 본 발명의 범위를 벗어남이 없이 모바일 디바이스(200)에서 첨부되거나 또는 찾아질 수 있다.
본 발명의 실시예는 수많은 범용 또는 특정 목적의 컴퓨팅 시스템 환경, 또는 예시된 것과는 다른 구성으로 사용가능하다. 공지된 적당한 컴퓨팅 시스템 환경 및 구성의 예는 제한적이지 않게 개인용 컴퓨터, 서버 컴퓨터, 휴대용 또는 랩탑 디바이스들, 멀티프로세서 시스템, 마이크로프로세서-기초 시스템, 셋탑 박스, 프로그램가능한 소비자 전자제품, 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터, 전화통신 시스템, 상술한 시스템 또는 디바이스들중 어느 하나를 포함하는 분배 컴퓨팅 환경 등을 포함한다.
본 발명의 실시예는 프로그램 모듈과 같은, 컴퓨터에 의해 실행되는 컴퓨터-실행가능한 지시의 일반적인 콘텍스트(context)로 개시된다. 일반적으로, 프로그램 모듈은 특정 태스크를 수행하거나 또는 특정 추상적인 데이터 타입을 구현하는 루틴, 프로그램, 오브젝트, 구성요소, 데이터 구조 등을 포함한다. 본 발명은 태스크가 통신 네트워크를 통해 링크되는 원격 프로세싱 디바이스들에 의해 수행되는 분배 컴퓨팅 환경에서 실시되도록 설계된다. 분배 컴퓨팅 환경에서, 프로그램 모듈은 메모리 저장 디바이스들을 포함하는 로컬 및 원격 컴퓨터 저장 매체에 위치한다. 프로그램 및 모듈에서 수행되는 태스크는 이하 도면을 참고로 설명된다. 본 기술 분야의 전문가는 컴퓨터 판독가능한 매체의 소정의 형태로 기록될 수 있는 프로세서 실행가능한 지시로서 상세한 설명 및 도면을 구현할 수 있다.
Ⅲ. 예시적인 컴퓨팅 시스템 환경
도 3은 본 발명의 실시예들이 구현되는 적당한 컴퓨팅 시스템 환경(300)의 예를 도시하는 블럭도이다. 컴퓨팅 시스템 환경(300)은 적당한 컴퓨팅 환경의 단지 일예이며, 본 발명의 사용 또는 기능의 범위로 제한되는 것을 의도나 제안하는 것이 아니다. 컴퓨팅 환경은 예시된 구성요소들중 임의의 하나 또는 그 조합에 관한 요건 또는 어떠한 종속성을 갖는 것으로 전혀 해석되서는 안된다.
환경(300)은 다수의 클라이언트들(304)을 포함한다. 클라이언트들(304)은 비록 필요하지는 않다하더라도 예시적으로 도 2에 예시된 디바이스(200)와 유사한 모바일 디바이스들이다. 클라이언트들(304)은 모바일일 필요가 없다. 일 실시예에 따르면, 적어도 하나의 클라이언트(304)는 일반적으로 도 1의 컴퓨터(110)와 유사한 PC 컴퓨터와 유사한 논-모바일 컴퓨팅 디바이스이다. 주어진 클라이언트(304)는 도 1 및 2와 관련되어 상술한 컴퓨터 디바이스들중 어느 하나, 또는 몇몇 다른 컴퓨팅 디바이스일 수 있다. 예시적인 실시예의 현 설명을 간략화하기 위하여, 클라이언트(304)가 도 2에 예시된 디바이스(200)와 유사한 모바일 디바이스라고 가정한다. 또한, 클라이언트(304)와의 통신이 무선 네트워크 통신을 통해 이루어진다고 일반적으로 가정한다. 비무선 통신은 모바일 또는 논모바일 클라이언트(304)중 어느 하나와의 통신을 지원하는데 용이하게 구현될 수 있다.
클라이언트(304)는 네트워크(310)상에서 유지되는 서버(302)에 적어도 일시 적으로 접속하도록 구성된다. 클라이언트(304)는 통신 인터페이스, 예컨대 도 2에 예시된 인터페이스(208)를 통해 서버(302)와 통신하도록 구성된다. 서버(302)는 정보 예컨대 어플리케이션 정보를 클라이언트(304)에 제공하도록 구성된다. 이런 정보는 어플리케이션 스토리지(214)로부터 액세스될 수 있으며, 언어 번역 기능을 클라이언트 사용자에게 제공하기 위한 프로세서(202)에 의해 활용될 수 있다.
본 발명의 실시예들은 클라이언트가 특정 정보, 예컨대 어플리케이션 정보를 서버(302)로부터 얻을 수 있게 하는 시스템에 관한 것이다. 특정 정보는 클라이언트가 모바일 언어 번역기로서 동작하게 한다. 모바일 번역기에서, 클라이언트(304)의 사용자는 이들이 특히 유창하지 않는 특정 자연어를 활용하여 통신의 몇가지 형태를 시행케하는 기회를 가진다. 서버로부터 클라이언트에 의해 수신된 정보는 사용자에게 친숙한 언어와 사용자에 의해 선택된 적어도 하나의 외국어간의 번역을 가능하게 한다. 수신된 정보는 또한 사용자에 의해 선택된 특정 목적지(즉, 도시)에 관한 정보를 포함한다.
서버(302)는 실제 번역 서비스를 네트워크(즉, 인터넷)를 통해 클라이언트(304)에 제공하도록 구성된다. 클라이언트(304)는 비록 필요치는 않다하더라도 예시적으로 무선 모바일 디바이스이다. 서버(302)에 의해 클라이언트(304)로 제공되는 서비스는 예시적으로 유료 기준으로 제공된다(즉, 일회성 또는 가입자 기준상에서 지불된다). 번역 서비스는 클라이언트 모바일 서비스가 그 사용자를 모바일 번역기로 쓸 수 있게 한다. 사용자는 모바일 번역기를 사용할 수 있어 이들이 특히 유창하지 않는 특정 자연어를 활용하는 대화에 참여할 수 있게 한다. 예컨대, 통상적으로 방문하는 나라의 언어에 대한 지식이 없는 외국 여행자는 호텔 체크-인 및 체크아웃, 택시 잡기, 쇼핑 등을 위해 그 지역 사람들과 일상적인 생활 대화를 할 필요가 있다.
전술한 바와 같이, 사용자를 모바일 번역기로 쓸 수 있도록 클라이언트(304)를 구비하기 위해서, 소정의 어플리케이션 아이템들이 구현을 위해 서버(304)로부터 클라이언트(302)로 전달된다. 어플리케이션 아이템은 언어 독립 번역 엔진과 적어도 하나의 언어 종속 번역 데이터베이스를 포함한다. 언어 종속 데이터베이스는 번역 템플레이트 및 번역 사전의 집합을 포함한다. 번역 템플레이트의 기능은 이하 후술될 번역의 특정 스킴에 관한 것이다.
서버(304)로부터 클라이언트(302)로 전달되는 어플리케이션은 하나 이상의 특정 목적지 도시를 나타내는 하나 이상의 특정 데이터베이스를 또한 선택적으로 포함한다. 특정 데이터베이스는 목적지 도시와 연관된 특정 단어 및 문구, 예컨대 특정 호텔, 거리명, 레스토랑, 관광객 유인 등을 포함한다. 다른 타입의 특정 데이터베이스(즉, 도시-기초 데이터베이스이외)는 본 발명의 범위를 벗어남이 없이 구현될 수 있다.
클라이언트(304)의 사용자는 필요하다면 하나 이상의 특정 데이터베이스와 함께 하나 이상의 언어 종속 데이터베이스(하나 이상의 자연어들에 대응함)의 전달을 요청할 수 있다. 서버(302)로부터 클라이언트 모바일 디바이스로의 어플리케이션 아이템의 전달에 후속해서, 언어들간의 번역이 언어 종속 번역 데이터베이스 및 선택적인 임의의 특정 데이터베이스를 번역 엔진에 적용함에 의해 실현된다. 번역 엔진은 오랜 기간 클라이언트(204)상에 상주하고, 또는 클라이언트(204)로부터 서버(202)로 가끔 전달(언어 종속 또는 특정 데이터베이스로 전달)된다. 번역 엔진은 이하 후술되는 번역의 특정 스킴을 구현한다.
하나의 특정 실시예에 따르면, 베이징으로 여행하는 미국인은, 서버로부터 무선 모바일 디바이스로, 번역 엔진, 중국어-영어 양방향 번역 템플레이트 및 사전과, 베이징-특정 번역 사전을 다운로드할 수 있다. 베이징에서, 미국인은 베이징에서 효율적인 통신을 용이하게 하기 위하여 언어 종속 번역 데이터베이스 및 도시-특정 번역 데이터베이스를 번역 엔진에 적용할 수 있다. 번역 엔진은 언어-독립적이다.
Ⅳ. 연합(federated) 번역 스킴
자유문에 대한 고품질 번역을 제공하는 것과 연관된 많은 난제들이 있다. 일 실시예에 따르면, 이들 난제들중 몇가지를 회피하기 위하여, 서버(302)에 의해 제공되며 클라이언트(304)상에서 구현되는 번역 서비스는 "연합 번역(federated translation)" 스킴에 기초한다. 이런 스킴에 따르면, 전형적인 시나리오용 번역이 제공된다. 각각의 전형적인 시나리오에서, 전형적인 문장(sentences)은 여러 외국어에서 그들의 번역과 함께 수집된다(collected). 이들 샘플 문장에 기초하여, 번역은 예제-기초 번역 시스템을 활용하여 행해진다.
도 4는 연합 번역 스킴의 작업플로우(workflow)를 일반적으로 예시하는 플로우도이다. 이런 프로세스에서 제1 단계는 사용자가 그 클라이언트 디바이스와 상호작용하게 하여, 소스 문장(408)의 선택을 수행하게 한다. 블럭 402, 404 및 406 으로 표시되는 바와 같이, 사용자는 음성 입력, 수기 입력 및/또는 키보드 입력을 통해 발효되는 상호작용을 통해 소스 문장(408)을 선택할 수 있다. 다른 입력 방법은 본 발명의 범위를 벗어남이 없이 활용될 수 있다. 소스 문장(408)은 서버(302)로부터 클라이언트(304)로 다운로드되는 특정 데이터베이스 및 언어 종속 데이터베이스로부터 선택된다. 소스 문장(408)은 사용자에게 친숙한 언어이다.
소스 문장(408)이 선택된 후, 번역기(410)는 언어 독립 번역 엔진을 적용하여 소스 문장을 타겟 문장(412)으로 번역한다. 타겟 문장(412)은 사용자가 상호작용을 발효하길 원하는 언어이다. 블럭 414 및 416에 따르면, 타겟 문장(412)은 음성(즉, 시뮬레이트된 음성)으로서 출력되거나, 또는 디스플레이상에서 클라이언트 디바이스의 사용자에게 출력된다. 사용자는 그 출력을 활용하여 상대적인 외국어로 통신을 시행한다. 출력의 다른 형태는 본 발명의 범위로부터 벗어남이 없이 발생할 수 있다.
일 실시예에 따르면, 소스 문장(408)의 선택은 단순히 직접적인 사용자 입력이다. 예컨대, 사용자는 소스 문장을 음성, 수기 또는 키보드 입력 방법을 활용하는 클라이언트 디바이스로 직접 입력한다. 대안적으로, 소스 문장(408)의 선택은 선택 프로세스를 통해 수행된다. 예컨대, 클라이언트 디바이스는 사용자가 선택하는 카테고리화된 소스 문장(408)의 리스팅(listing)을 제공할 수 있다.
그러나, 본 발명의 일 면에 따르면, 클라이언트 디바이스로 다운로드된 언어 종속 데이터베이스는 샘플 문장의 제한된 수를 포함한다. 이들 샘플 문장들중 하나가 사용자가 찾고있는 것과 매칭된다면, 사용자에 의해 소스 문장으로 쓸 수 있 도록 선택된다. 그렇지 않다면, 사용자는 그가 찾는 것과 상당히 유사한 샘플 문장을 선택한다. 그 후, 시스템은 소스 문장(408)으로 쓸 수 있는 적당한 형태에 있을 때까지 사용자가 유사한 문장을 변경할 수 있도록 구성된다. 사용자는 임의의 문장 엘리먼트들을, 언어 종속 데이터베이스 및/또는 하나 이상의 다운로드된 특정 데이터베이스에서 찾아진 사전에 포함된 엘리먼트들로 대체함으로써 유사한 문장을 변경한다. 이런 방식으로, 사용자는 유사한 문장을 바람직한 소스 문장(408)으로 변환한다. 달리 말하자면, 소스 문장(408)의 선택은 2 단계 프로세스를 이용하여 수행될 수 있다. 먼저, 유사한 문장이 선택된다. 그 후, 유사한 문장은, 이것이 소스 문장(408)의 상당한 또는 정확한 근사가 될때까지 용어(terms)를 대체, 부가 및/또는 삭제함에 의해 수정된다.
본 발명의 일 면에 따르면, 유사한 문장은 적어도 2가지 방식으로 선택될 수 있다. 먼저, 문장 데이터베이스(즉, 언어 종속 데이터베이스의 일부)는 사용자에 의해 수동으로 브라우징될 수 있다. 브라우징 프로세스는 카테고리-기초 메뉴 시스템을 이용하여 용이하게 실시된다. 예컨대, 사용자는 "택시"와 같은 넓은 카테고리를 선택하기 위해 입력 디바이스를 활용한다. 선택시, 서브-카테고리들의 리스트는 사용자에게 제시된다. 사용자는 이들이 소스 문장(408)으로 쓸 수 있기 위해 찾는 것과 유사한 문장을 찾을때까지 메뉴 시스템을 통해 이동할 수 있다. 사용자는 소스 문장(408)으로 쓸 수 있는 조건이 될 때까지 유사한 문장을 수정한다.
그러나, 대안적으로, 사용자는 찾고 있는 것을 입력함에 의해 유사한 문장을 찾길 시작할 수 있다. 시스템은 데이터베이스로부터 유사한 문장을 검색하고, 이 를 선택을 위해 사용자에게 제시한다. 사용자는 찾고 있는 것과 상당히 유사한 문장을 선택한다. 사용자는 소스 문장(408)으로 쓸 수 있는 조건이 될 때까지 유사한 문장을 수정한다. 예컨대, 사용자는 "May I get to the train station quickly by taxi?"를 입력한다. 시스템은 문장 데이터베이스를 탐색하여 다음과 같은 리스트를 제공한다:
a. "May I get to the hotel by taxi?"
b. "I get to the train station by bus."
c. "I get to the train station quickly."
사용자는 유사한 문장(즉, 수정을 위한 기초)으로 쓸 수 있도록 이 리스트로부터 문장을 선택한다. 수정의 일 예에서, 사용자는 문장 "a"에서 "the hotel"의 자리(slot)가 "train station"으로 대체되게 수정 선택한다. 용어 "train station"은 번역을 위한 언어 종속 데이터베이스로부터 이용가능한 용어이다.
본 발명의 제1 면에 따르는 제5 도는, 사용자가 번역하기 위해 보는 문장을 입력함으로써 시작하는 전체 플로우 프로세스를 설명하는 플로우챠트이다. 블럭 502는 음성 입력, 수기 입력 또는 다른 것들을 통해 수행되는 사용자에 의한 입력을 나타낸다. 블럭 504는 언어 종속 데이터베이스의 일부(및/또는 임의의 특정 데이터베이스의 일부)로서 클라이언트상에 저장되는 템플레이트(506) 및 문장과 입력을 매칭하기는 프로세스를 나타낸다.
블럭 508은 정확한 매칭이 사용자 입력에 위치하는 상황을 나타낸다. 이런 상황에서, 블럭 510에 따르면, 다운로드된 언어 종속 데이터베이스 및 독립 번역 엔진의 일부로서 구현되는 사전 및 규칙(512)은 문장(508)을 번역하기 위해 적용되어 출력(514)(즉, 음성 또는 디스플레이 출력)을 발생시킨다.
블럭 516은 정확한 매치(match)가 사용자 입력에 대해 위치하지 않으나 유사한 매치가 위치하는 상황을 나타낸다. 템플레이트(516)는 데이터베이스(506)로부터 검색된 유사한 매치를 나타낸다. 블럭 518에 따르면, 사용자는 원래 입력(502)에 상당히 근사할 때까지 유사한 매치를 수정한다. 블럭 510에 따르면, 수정된 문장은 출력(514)(즉, 음성 또는 디스플레이 출력)으로 번역된다.
블럭 520은 정확한 매치와 합리적인 추정 모두가 입력(502)에 위치할 수 없는 상황을 나타낸다. 이 경우, 대응하는 입력(502)은 서버에 다시 전달된다. 블럭 522에 따르면, 입력은 다른 클라이언트에 연속해서 전달되는 음성 종속 데이터베이스 및/또는 특정 데이터베이스를 트레이닝(training)하도록 활용된다.
Ⅴ. 템플레이트 기반 머신 번역
본 발명의 일 면에 따르면, 상술한 번역 프로세스는 다음 수학식 1이 샘플 데이터 포맷에 의해 일반적으로 예시화되는 템플레이트 기반 머신 번역 접근법(template based machine translation approach)을 통해 실현된다:
Figure 112004007292187-pat00001
템플레이트 기반 머신 번역 접근법에 따르면, 사용자가 번역을 원하는 문장을 근사화하기 위해 언어 종속 데이터베이스로부터 문장을 검색하는 것은 템플레이트 기반 접근법을 수용하는 알고리즘의 어플리케이션을 통해 수행된다. 알고리즘은 일번적으로 2단계와 관련된다.
알고리즘의 제1 단계는 가중 TF-IDF(weighted term frequency/inverse document frequency)정보 검색 접근법을 이용하여 캔디데이트(candidate) 문장을 선택하는 것이다. 이하 D로 표시되는 예제 문장의 집합은 많은 수의 문서들로 이루어지며, 이들 문서 각각은 실제로 예제 문장이다. (단지 하나의 문장을 포함하는)문서에 대한 인덱싱 결과는 가중 벡터로서 표현된다:
Figure 112004007292187-pat00002
여기서, dik(1≤k≤m)은 문서 Di에서 tk항의 가중치이며, m은 집합에서 찾아진 다른 용어의 수에 의해 결정되는 벡터 공간의 크기이다. 용어는 예시적인 것이지 반드시 필요한 것이 아닌 영어 단어이다. 이들은 용이하게 일본 문자, 중국 문자 또는 어떠한 다른 언어 유닛일 수 있다. 문서에서 가중치 항 dik는 문서에서 발생 빈도(tf-용어 빈도)와, 전체 집합에서의 그 분포(idf- 반대 문서 빈도)에 따라 계산된다. dik를 계산하는데 활용될 수 있는 다수의 방법이 있다. 예컨대, 다음이 수식이 활용될 수 있다:
Figure 112004007292187-pat00003
여기서, fik는 문서 Di에서 항 tk의 발생 빈도이며, N은 집합에서 문서의 전체 수이고, nk는 항 tk를 포함하는 문서의 수이다.
(본 경우에 사용자가 번역을 원하는 문장에 대응하는) 질의는 유사한 방식으로 인덱싱되며, 벡터는 질의에 대해 또한 얻어진다:
Figure 112004007292187-pat00004
Di와 Qj간의 유사성은 이들 벡터들의 내적(inner product)으로서 계산된다. 즉:
Figure 112004007292187-pat00005
출력은 문장 S의 세트이다:
Figure 112004007292187-pat00006
알고리즘의 제2 단계는 선택된 문장 세트를 재랭크(re-rank)하기 위해 가중된 편집 거리 접근법을 활용하는 것이다. 선택된 문장, Di -> (di1, di2, ..., dim)이 주어지면, ED(Di, Qj)로서 명시되는 Di와 Qj간의 편집 거리는 2개의 스트링들 A 및 B가 동일하게 하기 위해 필요한 용어들의 삽입, 삭제 및 대체의 최소한의 수로서 정의된다. 특히, ED(Di, Qj)는 Di를 Qj로 변경하는데 요구되는 오퍼레이션의 최소한의 수로서 정의되며, 여기서, 오퍼레이션은 다음 것 중 하나이다:
1. 용어 변경;
2. 용어 삽입; 또는
3. 용어 삭제.
동적 프로그래밍 알고리즘은 2개의 스트링들의 편집 거리를 계산하는데 활용된다. 2차원 매트릭스,
Figure 112004007292187-pat00007
는 편집 거리 값들을 유지하는데 사용된다;
Figure 112004007292187-pat00008
m[,]은 행별로 계산된다. 행 m[i,]은 행 m[i-1,]에만 종속한다. 이런 알고리즘의 시간 복잡도는
Figure 112004007292187-pat00009
이다. s1 및 s2가 용어 수의 관점에서 '유사한' 길이, 예컨대 약 'n'을 갖는다면, 이런 복잡도는 O(n2)이다.
가중된 편집 거리는 각각의 오퍼레이션(삽입, 삭제, 대체)의 패널티가 1을 필요하지 않으나, 관련된 용어들이 중요성에 기초한 다른 값들로 할당될 수 있다는 사실을 일반적으로 언급한다. 예컨대, 다음의 패널티 값 리스트는 다음과 같이 특정 음성의 일부(part-of-speech)에 따른 값을 할당하도록 활용될 수 있다:
POS 점수
명사 0.6
동사 1.0
형용사 0.8
부사 0.8
전치사 0.8
기타 0.4
이 리스트는 주어진 어플리케이션을 수용하도록 수정될 수 있는 단지 예이다. TF-IDF에 의해 선택된 문장
Figure 112004007292187-pat00010
은 가중된 편집 거리 ED에 의해 랭크되고, 순서화된 리스트가 얻어진다:
Figure 112004007292187-pat00011
순서화된 리스트는 유사한 문장 또는 문장들이 전술한 템플레이트 기반 번역 프로세스를 용이하게 하기 위해 사용자에게 제출되야 하는지를 결정하기 위한 기준으로서 활용된다.
비록 본 발명이 바람직한 실시예들을 참고로 설명된다 할지라도, 본 기술 분야의 전문가에게는 본 발명의 정신 및 범위를 벗어남이 없이 변경이 이루어질 수 있음을 이해할 것이다.
이상 설명드린 바와 같이, 다른 언어들을 말하는 개인들간에 대화를 용이하 게 하는 모바일 언어 번역기에 관한 본 발명에 따르면, 모바일 디바이스용의 효율적이고 효과적인 범용 언어 번역 시스템을 달성할 수 있다.

Claims (22)

  1. 서로 다른 언어를 말하는 개인들 간의 소통(communication)을 용이하게 하는, 모바일 클라이언트 컴퓨팅 디바이스의 사용자에게 언어 번역 서비스를 제공하는 방법으로서,
    상기 사용자로부터 언어 선택에 대응하는 입력을 수신하는 단계와,
    상기 모바일 클라이언트 컴퓨팅 디바이스로부터 서버로 요청을 전송하는 단계와,
    상기 요청에 응답하여 상기 서버로부터 클라이언트로 언어 종속 데이터베이스를 전달하는 단계 - 상기 언어 종속 데이터베이스는 상기 언어 선택에 대응하고, 번역 템플릿 및 번역 사전을 포함함 - 와,
    상기 사용자의 입력을 상기 언어 종속 데이터베이스의 내용과 매칭시키는(matching) 단계와;
    정확한 매치를 발견한다면, 상기 사용자에 의해 입력된 소스 문장의 예제-기반 기계 번역(example-based machine translation)을 수행하는 단계와;
    정확한 매치를 발견하지 못한다면, 상기 데이터베이스로부터의 템플릿과 유사한 매치를 검색하고, 사용자 입력에 기초하여 상기 템플릿을 상기 사전에서 검색된 요소들(elements)로 수정하고, 템플릿 기반 기계 번역 프로세스(tamplate based machine translation process)에 기초하여 언어 번역을 수행하는 단계를 포함하고,
    상기 유사한 매치를 검색하는 것은
    가중 TF-IDF 정보 검색 접근법(weighted term frequency/inverse document frequency information retrieval approach)을 이용하여 캔디데이트(candidate) 문장을 선택하는 것과,
    가중 편집 거리 접근법(weighted edit distance approach)에 기초하여 상기 선택된 캔디데이트 문장들을 랭크(rank)하는 것을 포함하는 방법.
  2. 제1항에 있어서,
    상기 사용자로부터 특수화된 데이터베이스(specialized database) 선택에 대응하는 입력을 수신하는 단계와,
    상기 클라이언트 컴퓨팅 디바이스로부터 서버로, 특수화된 데이터베이스 요청을 전송하는 단계와,
    상기 서버로부터 클라이언트로 상기 특수화된 데이터베이스 선택에 대응하는 특수화된 데이터베이스를 전달하는 단계
    를 더 포함하는 방법.
  3. 제2항에 있어서,
    상기 특수화된 데이터베이스를 전달하는 단계는,
    특정 목적지(destination)와 관련된(pertains to) 번역 정보를 갖는 특수화된 데이터베이스를 전달하는 단계를 포함하는 방법.
  4. 제3항에 있어서,
    상기 특수화된 데이터베이스를 전달하는 단계는,
    특정 도시(city)와 관련된 번역 정보를 갖는 특수화된 데이터베이스를 전달하는 단계를 포함하는 방법.
  5. 제4항에 있어서,
    상기 모바일 클라이언트 컴퓨팅 디바이스가 언어 번역을 수행하기 위해 상기 언어 종속 데이터베이스 및 상기 특수화된 데이터베이스와 연계하여 상기 모바일 클라이언트 컴퓨팅 디바이스에 오랜 기간 상주하는 언어 독립 번역 엔진을 활용하도록 동작시키는 단계를 더 포함하는 방법.
  6. 제1항에 있어서,
    상기 모바일 클라이언트 컴퓨팅 디바이스가 언어 번역을 수행하기 위해 상기 언어 종속 데이터베이스와 연계하여 상기 모바일 클라이언트 컴퓨팅 디바이스에 오랜 기간 상주하는 언어 독립 번역 엔진을 활용하도록 동작시키는 단계를 더 포함하는 방법.
  7. 제6항에 있어서,
    상기 언어 독립 번역 엔진을 상기 서버로부터 모바일 클라이언트로 전달하는 단계를 더 포함하는 방법.
  8. 제6항에 있어서,
    상기 사용자의 입력을 매칭시키는 단계는
    상기 언어 종속 데이터베이스내에 포함되며 사용자에게 친숙한 언어로 된 샘플 문장의 집합에 대한 액세스를 상기 사용자에게 제공하는 단계와,
    상기 사용자가 번역을 원하는 샘플 문장에 대응하는 선택 입력을 상기 사용자로부터 수신하는 단계를 더 포함하는 방법.
  9. 제8항에 있어서,
    상기 샘플 문장의 집합에 대한 액세스를 사용자에게 제공하는 단계는 샘플 문장의 카테고리화된 집합에 대한 액세스를 상기 사용자에게 제공하는 단계를 포함하는 방법.
  10. 제8항에 있어서,
    상기 언어 종속 데이터베이스와 연계하여 언어 독립 번역 엔진을 활용하는 것은
    상기 언어 독립 번역 엔진을 활용하여 상기 언어 종속 데이터베이스내에 포함된 번역 사전을 상기 샘플 문장에 적용함으로써 상기 샘플 문장을 번역하는 것을 포함하는 방법.
  11. 제6항에 있어서,
    상기 사용자의 입력을 매칭시키는 단계는
    상기 언어 종속 데이터베이스내에 포함되며 상기 사용자에게 친숙한 언어로 된 샘플 문장의 집합에 대한 액세스를 상기 사용자에게 제공하는 단계와,
    상기 사용자가 번역을 원하는 타겟 문장과 유사하지만 동일하지는 않은 샘플 문장을 식별하는 선택 입력을 상기 사용자로부터 수신하는 단계와,
    상기 사용자로부터 조작 입력을 수신하는 단계와,
    상기 샘플 문장을 상기 타겟 문장에 보다 가깝게 근사시키기 위해 상기 조작 입력에 따라 상기 샘플 문장을 수정하는 단계를 더 포함하는 방법.
  12. 제11항에 있어서,
    상기 샘플 문장의 집합에 대한 액세스를 상기 사용자에게 제공하는 단계는 샘플 문장의 카테고리화된 집합에 대한 액세스를 상기 사용자에게 제공하는 단계를 포함하는 방법.
  13. 제11항에 있어서,
    상기 언어 종속 데이터베이스와 연계하여 언어 독립 번역 엔진을 활용하는 것은 상기 언어 독립 번역 엔진을 활용하여 상기 언어 종속 데이터베이스내에 포함된 번역 사전을 상기 샘플 문장에 적용함으로써 상기 샘플 문장을 번역하는 것을 포함하는 방법.
  14. 제6항에 있어서,
    상기 사용자의 입력을 매칭시키는 단계는
    상기 사용자가 번역을 원하는 텍스트를 나타내는 타겟 입력을 상기 사용자로부터 수신하는 단계와,
    상기 언어 종속 데이터베이스내에 포함된 샘플 텍스트의 집합을 탐색하는 단계와,
    상기 타겟 입력에 적어도 실질적으로 유사한 샘플 텍스트를 식별하는 단계를 더 포함하는 방법.
  15. 제14항에 있어서,
    상기 언어 종속 데이터베이스와 연계하여 언어 독립 번역 엔진을 활용하는 것은 상기 언어 독립 번역 엔진을 활용하여 상기 언어 종속 데이터베이스내에 포함된 번역 사전을 상기 샘플 텍스트에 적용함으로써 상기 샘플 텍스트를 번역하는 것을 포함하는 방법.
  16. 제14항에 있어서,
    샘플 텍스트를 식별하는 것은,
    타겟 텍스트의 근사인 복수의 샘플 텍스트를 식별하는 것과,
    상기 복수의 샘플 텍스트를 상기 사용자에게 제시하는 것과,
    상기 복수의 샘플 텍스트 중 하나를 식별하는 선택 입력을 상기 사용자로부터 수신하는 것을 포함하는 방법.
  17. 제14항에 있어서,
    언어 독립 번역 엔진 및 상기 언어 종속 데이터베이스를 활용하는 것은 상기 언어 독립 번역 엔진을 활용하여 상기 언어 종속 데이터베이스내에 포함된 번역 사전을 적용함으로써 상기 복수의 샘플 텍스트들 중 상기 하나를 번역하는 것을 포함하는 방법.
  18. 제14항에 있어서,
    상기 사용자로부터 조작 입력을 수신하는 단계와,
    타겟 문장에 보다 가깝게 근사시키기 위해 상기 조작 입력에 따라 상기 복수의 샘플 텍스트 중 상기 하나를 수정하는 단계를 더 포함하는 방법.
  19. 제18항에 있어서,
    언어 독립 번역 엔진 및 상기 언어 종속 데이터베이스를 활용하는 것은 상기 언어 독립 번역 엔진을 활용하여 상기 언어 종속 데이터베이스내에 포함된 번역 사전에 보다 가까운 근사를 적용함으로써 상기 보다 가깝게 근사시킨 것을 번역하는 것을 포함하는 방법.
  20. 모바일 컴퓨팅 디바이스의 사용자에게 언어 번역 서비스를 제공하도록 서버를 동작시키는 방법으로서,
    제1 쌍의 언어에 대응하고 번역 템플릿을 포함하는 제1 언어 종속 데이터베이스를 저장하는 단계와,
    상기 제1 쌍과는 다른 제2 쌍의 언어에 대응하고 번역 템플릿을 포함하는 제2 언어 종속 데이터베이스를 저장하는 단계와,
    모바일 클라이언트로부터 번역 요청을 수신하는 단계와,
    상기 제1 및 제2 언어 종속 데이터베이스 중 적어도 하나의 사본을 상기 모바일 클라이언트에 전달함으로써 상기 요청에 응답하는 단계
    를 포함하는 방법.
  21. 서로 다른 언어를 말하는 개인들 간의 소통을 용이하게 하는, 모바일 클라이언트 컴퓨팅 디바이스의 사용자를 위해 언어 번역 서비스를 구현하는 장치로서,
    사용자 입력을 수신하도록 되어있는 입력 메카니즘과,
    상기 입력 메카니즘에 결합되고 상기 사용자 입력에 대응하는 입력 신호를 수신하도록 되어있는 프로세서와,
    상기 프로세서에 결합된 메모리와,
    상기 메모리에 저장되는 언어 종속 데이터베이스 - 상기 언어 종속 데이터베이스는 번역 사전 및 복수의 번역 템플릿을 포함함 - 와,
    상기 메모리에 저장되는 언어 독립 번역 엔진을 포함하고,
    상기 프로세서는 상기 사용자의 입력을 상기 언어 종속 데이터베이스의 내용과 매칭시키도록 되어 있으며,
    정확한 매치를 발견한다면, 상기 사용자에 의해 입력된 소스 문장의 예제-기반 기계 번역(example-based machine translation)을 수행하고;
    정확한 매치를 발견하지 못한다면, 상기 데이터베이스로부터의 템플릿과 유사한 매치를 검색하고, 사용자 입력에 기초하여 상기 템플릿을 상기 사전에서 검색된 요소들로 수정하고, 템플릿 기반 기계 번역 프로세스(tamplate based machine translation process)에 기초하여 언어 번역을 수행하며,
    상기 유사한 매치를 검색하는 것은
    가중 TF-IDF 정보 검색 접근법(weighted term frequency/inverse document frequency information retrieval approach)을 이용하여 캔디데이트 문장을 선택하는 것과,
    가중 편집 거리 접근법(weighted edit distance approach)에 기초하여 상기 선택된 캔디데이트 문장들을 랭크(rank)하는 것을 포함하는 장치.
  22. 삭제
KR1020040011839A 2003-02-24 2004-02-23 언어 번역 서비스를 사용자에게 제공하는 방법, 언어 번역 서비스를 제공하기 위해 서버를 동작시키는 방법, 및 이를 구현하는 장치 KR101076858B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US44971203P 2003-02-24 2003-02-24
US60/449,712 2003-02-24
US10/462,459 US7536293B2 (en) 2003-02-24 2003-06-16 Methods and systems for language translation
US10/462,459 2003-06-16

Publications (2)

Publication Number Publication Date
KR20040076213A KR20040076213A (ko) 2004-08-31
KR101076858B1 true KR101076858B1 (ko) 2011-10-25

Family

ID=32738447

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040011839A KR101076858B1 (ko) 2003-02-24 2004-02-23 언어 번역 서비스를 사용자에게 제공하는 방법, 언어 번역 서비스를 제공하기 위해 서버를 동작시키는 방법, 및 이를 구현하는 장치

Country Status (12)

Country Link
US (1) US7536293B2 (ko)
EP (1) EP1450267B1 (ko)
JP (1) JP2004259271A (ko)
KR (1) KR101076858B1 (ko)
CN (1) CN1530861B (ko)
AT (1) ATE441153T1 (ko)
AU (1) AU2004200638B2 (ko)
BR (1) BRPI0400333A (ko)
CA (1) CA2458138C (ko)
DE (1) DE602004022730D1 (ko)
MX (1) MXPA04001729A (ko)
RU (1) RU2357285C2 (ko)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7627817B2 (en) 2003-02-21 2009-12-01 Motionpoint Corporation Analyzing web site for translation
US7552221B2 (en) 2003-10-15 2009-06-23 Harman Becker Automotive Systems Gmbh System for communicating with a server through a mobile communication device
US8566081B2 (en) * 2004-03-25 2013-10-22 Stanley F. Schoenbach Method and system providing interpreting and other services from a remote location
DE602004010054T2 (de) * 2004-01-19 2008-03-06 Harman Becker Automotive Systems Gmbh Betätigung eines Sprachdialogsystems
ATE400871T1 (de) 2004-01-29 2008-07-15 Harman Becker Automotive Sys Multimodale dateneingabe
EP1560200B8 (en) * 2004-01-29 2009-08-05 Harman Becker Automotive Systems GmbH Method and system for spoken dialogue interface
EP1562180B1 (en) * 2004-02-06 2015-04-01 Nuance Communications, Inc. Speech dialogue system and method for controlling an electronic device
US7711571B2 (en) * 2004-03-15 2010-05-04 Nokia Corporation Dynamic context-sensitive translation dictionary for mobile phones
US20050288919A1 (en) * 2004-06-28 2005-12-29 Wang Jian C Method and system for model-parameter machine translation
WO2006019993A2 (en) * 2004-07-15 2006-02-23 Aurilab, Llc Distributed pattern recognition training method and system
US7825901B2 (en) * 2004-12-03 2010-11-02 Motorola Mobility, Inc. Automatic language selection for writing text messages on a handheld device based on a preferred language of the recipient
US7624099B2 (en) * 2005-10-13 2009-11-24 Microsoft Corporation Client-server word-breaking framework
JP4058071B2 (ja) * 2005-11-22 2008-03-05 株式会社東芝 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
US20070255554A1 (en) * 2006-04-26 2007-11-01 Lucent Technologies Inc. Language translation service for text message communications
US8209162B2 (en) * 2006-05-01 2012-06-26 Microsoft Corporation Machine translation split between front end and back end processors
US20080046231A1 (en) * 2006-05-26 2008-02-21 Srk Ventures, Llc System and Method of Language Translation
DE102007003862A1 (de) 2007-01-25 2009-02-05 Anders, Klaus E., 26127 Oldenburg Verfahren zur interkulturellen mehrsprachigen Kommunikation unter Einbeziehung einer Plansprache
US7983897B2 (en) * 2007-02-14 2011-07-19 Google Inc. Machine translation feedback
US8515728B2 (en) 2007-03-29 2013-08-20 Microsoft Corporation Language translation of visual and audio input
JP2008305167A (ja) * 2007-06-07 2008-12-18 Toshiba Corp 原言語文を目的言語文に機械翻訳する装置、方法およびプログラム
US20100324884A1 (en) * 2007-06-26 2010-12-23 Jeffrey Therese M Enhanced telecommunication system
US20090094018A1 (en) * 2007-10-08 2009-04-09 Nokia Corporation Flexible Phrasebook
US20090138255A1 (en) * 2007-11-26 2009-05-28 First Data Corporation Customer facing device having language translation capabilities
US20100082324A1 (en) * 2008-09-30 2010-04-01 Microsoft Corporation Replacing terms in machine translation
US20100198582A1 (en) * 2009-02-02 2010-08-05 Gregory Walker Johnson Verbal command laptop computer and software
JP5257189B2 (ja) * 2009-03-25 2013-08-07 富士通株式会社 検索結果出力プログラム、検索結果出力装置、および検索結果出力方法
CN102193939B (zh) * 2010-03-10 2016-04-06 阿里巴巴集团控股有限公司 信息导航的实现方法、信息导航服务器和信息处理系统
TWI490713B (zh) * 2010-05-14 2015-07-01 Alibaba Group Holding Ltd Information navigation method, information navigation server and information processing system
US8804574B2 (en) 2010-10-01 2014-08-12 Telefonaktiebolaget L M Ericsson (Publ) Language dependent positioning and signalling
JP5842452B2 (ja) * 2011-08-10 2016-01-13 カシオ計算機株式会社 音声学習装置及び音声学習プログラム
CN103544144B (zh) * 2012-07-10 2017-05-31 腾讯科技(深圳)有限公司 移动客户端云翻译方法和移动客户端云翻译系统
CN103631772A (zh) * 2012-08-29 2014-03-12 阿里巴巴集团控股有限公司 机器翻译方法及装置
KR101740332B1 (ko) * 2013-11-05 2017-06-08 한국전자통신연구원 자동 번역 장치 및 방법
RU2546064C1 (ru) * 2013-11-12 2015-04-10 Общество с ограниченной ответственностью "Технологии управления переводом" Распределенная система и способ языкового перевода
US10854106B2 (en) * 2014-07-30 2020-12-01 Ofir Geller Targeted repetition and targeted reinforcement in a language learning system
US10102202B2 (en) 2015-12-17 2018-10-16 Mastercard International Incorporated Systems and methods for independent computer platform language conversion services
WO2017163284A1 (ja) * 2016-03-25 2017-09-28 パナソニックIpマネジメント株式会社 翻訳装置
CN106021239B (zh) * 2016-04-29 2018-10-26 北京创鑫旅程网络技术有限公司 一种翻译质量实时评价方法
US11449495B2 (en) * 2017-02-01 2022-09-20 United Parcel Service Of America, Inc. Indexable database profiles comprising multi-language encoding data and methods for generating the same
CN107526730B (zh) * 2017-08-29 2022-03-25 惠州Tcl移动通信有限公司 一种翻译数据的管理方法、存储介质及电子设备
CN107885733A (zh) * 2017-11-13 2018-04-06 深圳市沃特沃德股份有限公司 语言翻译方法和装置
WO2019090782A1 (zh) * 2017-11-13 2019-05-16 深圳市沃特沃德股份有限公司 语言翻译方法、装置和服务器
CN108959276A (zh) * 2018-07-23 2018-12-07 传神语联网网络科技股份有限公司 一种用于翻译的术语发现方法及其系统
CN110866406B (zh) * 2019-11-15 2023-08-15 上海醍顶信息科技有限公司 用于翻译集成服务优化方法、电子装置及储存介质
CN111539231A (zh) * 2020-04-29 2020-08-14 北京金山安全软件有限公司 一种翻译方法、装置、服务器及计算机可读存储介质
CN111857906B (zh) * 2020-06-03 2022-02-01 北京旷视科技有限公司 终端的文本显示方法、装置、系统和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194698A (ja) 1998-12-25 2000-07-14 Sony Corp 情報処理装置および方法、並びに提供媒体
WO2000057320A2 (en) 1999-03-19 2000-09-28 Trados Gmbh Workflow management system
JP2001243224A (ja) 2000-02-25 2001-09-07 Sharp Corp 情報処理装置およびプログラム記録媒体
JP2002092462A (ja) 2000-09-12 2002-03-29 Casio Comput Co Ltd 情報提供システム、サーバ装置、プログラムが記憶された記憶媒体

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1988002516A1 (en) * 1986-10-03 1988-04-07 British Telecommunications Public Limited Company Language translation system
JPH02165378A (ja) * 1988-12-20 1990-06-26 Csk Corp 機械翻訳システム
US5659765A (en) * 1994-03-15 1997-08-19 Toppan Printing Co., Ltd. Machine translation system
US5884247A (en) * 1996-10-31 1999-03-16 Dialect Corporation Method and apparatus for automated language translation
JPH10198680A (ja) * 1997-01-07 1998-07-31 Hitachi Ltd 分散辞書管理方法及びそれを用いた機械翻訳方法
EP0968475B1 (en) * 1997-05-28 2001-12-19 Shinar Linguistic Technologies Inc. Translation system
US5960382A (en) * 1997-07-07 1999-09-28 Lucent Technologies Inc. Translation of an initially-unknown message
US6081803A (en) * 1998-02-06 2000-06-27 Navigation Technologies Corporation Support for alternative names in a geographic database used with a navigation program and methods for use and formation thereof
US6192332B1 (en) 1998-04-06 2001-02-20 Mitsubishi Electric Research Laboratories, Inc. Adaptive electronic phrase book
US7110938B1 (en) * 1999-09-17 2006-09-19 Trados, Inc. E-services translation portal system
JP2001101187A (ja) * 1999-09-30 2001-04-13 Sony Corp 翻訳装置および翻訳方法、並びに記録媒体
JP2001175683A (ja) * 1999-12-21 2001-06-29 Nec Corp 翻訳サーバシステム
US20010029442A1 (en) * 2000-04-07 2001-10-11 Makoto Shiotsu Translation system, translation processing method and computer readable recording medium
JP2001306564A (ja) * 2000-04-21 2001-11-02 Nec Corp 自動翻訳機能付き携帯端末
US7107204B1 (en) * 2000-04-24 2006-09-12 Microsoft Corporation Computer-aided writing system and method with cross-language writing wizard
US6904401B1 (en) * 2000-11-01 2005-06-07 Microsoft Corporation System and method for providing regional settings for server-based applications
US6859820B1 (en) * 2000-11-01 2005-02-22 Microsoft Corporation System and method for providing language localization for server-based applications
US7050979B2 (en) * 2001-01-24 2006-05-23 Matsushita Electric Industrial Co., Ltd. Apparatus and method for converting a spoken language to a second language
US20020111791A1 (en) 2001-02-15 2002-08-15 Sony Corporation And Sony Electronics Inc. Method and apparatus for communicating with people who speak a foreign language
JP4574047B2 (ja) * 2001-03-30 2010-11-04 富士通株式会社 訳例辞書を用いて翻訳を行う機械翻訳装置およびプログラム
US20020188670A1 (en) * 2001-06-08 2002-12-12 Stringham Gary G. Method and apparatus that enables language translation of an electronic mail message
US20020198699A1 (en) * 2001-06-21 2002-12-26 International Business Machines Corporation Apparatus, system and method for providing open source language translation
US20030101044A1 (en) * 2001-11-28 2003-05-29 Mark Krasnov Word, expression, and sentence translation management tool
WO2003065245A1 (fr) * 2002-01-29 2003-08-07 International Business Machines Corporation Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur
US7272377B2 (en) * 2002-02-07 2007-09-18 At&T Corp. System and method of ubiquitous language translation for wireless devices
US20030154069A1 (en) * 2002-02-14 2003-08-14 International Business Machines Corporation Computerized system and method for converting selected text between languages
JP3959453B2 (ja) * 2002-03-14 2007-08-15 沖電気工業株式会社 翻訳仲介システム及び翻訳仲介サーバ
US20030212542A1 (en) * 2002-05-08 2003-11-13 Amikai, Inc. Platform-independent automated machine translation system
US7548863B2 (en) * 2002-08-06 2009-06-16 Apple Inc. Adaptive context sensitive analysis
US20040044518A1 (en) * 2002-08-27 2004-03-04 Reed John E. Method and system for multilingual display generation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194698A (ja) 1998-12-25 2000-07-14 Sony Corp 情報処理装置および方法、並びに提供媒体
WO2000057320A2 (en) 1999-03-19 2000-09-28 Trados Gmbh Workflow management system
JP2001243224A (ja) 2000-02-25 2001-09-07 Sharp Corp 情報処理装置およびプログラム記録媒体
JP2002092462A (ja) 2000-09-12 2002-03-29 Casio Comput Co Ltd 情報提供システム、サーバ装置、プログラムが記憶された記憶媒体

Also Published As

Publication number Publication date
US7536293B2 (en) 2009-05-19
EP1450267B1 (en) 2009-08-26
CA2458138C (en) 2012-10-09
BRPI0400333A (pt) 2005-01-04
MXPA04001729A (es) 2004-12-02
CN1530861B (zh) 2010-05-26
AU2004200638A1 (en) 2004-09-09
AU2004200638B2 (en) 2010-09-16
RU2357285C2 (ru) 2009-05-27
RU2004105167A (ru) 2005-07-20
EP1450267A3 (en) 2004-12-22
JP2004259271A (ja) 2004-09-16
US20040167770A1 (en) 2004-08-26
DE602004022730D1 (de) 2009-10-08
CA2458138A1 (en) 2004-08-24
EP1450267A2 (en) 2004-08-25
ATE441153T1 (de) 2009-09-15
KR20040076213A (ko) 2004-08-31
CN1530861A (zh) 2004-09-22

Similar Documents

Publication Publication Date Title
KR101076858B1 (ko) 언어 번역 서비스를 사용자에게 제공하는 방법, 언어 번역 서비스를 제공하기 위해 서버를 동작시키는 방법, 및 이를 구현하는 장치
JP4173774B2 (ja) 重み付き編集距離に基づく例文の自動検索用システムおよび方法
JP3272288B2 (ja) 機械翻訳装置および機械翻訳方法
KR101721338B1 (ko) 검색 엔진 및 그의 구현 방법
US9002696B2 (en) Data security system for natural language translation
KR101554293B1 (ko) 교차 언어 정보 검색
US9720904B2 (en) Generating training data for disambiguation
WO2008069125A1 (ja) データ管理装置
JPH10198680A (ja) 分散辞書管理方法及びそれを用いた機械翻訳方法
WO2008141583A1 (fr) Procédé d'entrée de caractères, système d'entrée et procédé pour mettre à jour un lexique de mots
CN110413738A (zh) 一种信息处理方法、装置、服务器及存储介质
AU2018250372A1 (en) Method to construct content based on a content repository
EP2343661B1 (en) A multimedia search method and engine, a meta-search server, and client
JP3186960B2 (ja) 情報検索方法およびその装置
KR101734533B1 (ko) 다국가 뉴스 서비스 제공 방법
KR101501459B1 (ko) 자동 번역 기술을 이용한 작문 시스템 및 방법
JP4140343B2 (ja) 情報検索支援方法及び装置及び情報検索支援プログラム
JP3906820B2 (ja) 翻訳支援装置および翻訳支援プログラム
Weil et al. Acid-base balance during cardiopulmonary resuscitation
Lo et al. Research on developing healthy-life map guiding system
JP2000315210A (ja) 文書管理システムおよび文書管理方法
CN115221282A (zh) 跨语言的法规检索方法、装置、设备及存储介质
Westerfield Using Multilingual Neural Re-ranking Models for Low Resource Target Languages in Cross-lingual Document Retrieval
JP2000048018A (ja) 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体
Falk et al. Impact of large changes in minute ventilation on end tidal CO2 during controlled low cardiac output in swine

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140929

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150918

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160921

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170919

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180918

Year of fee payment: 8