KR101735024B1

KR101735024B1 - 키워드의 현지화 번역

Info

Publication number: KR101735024B1
Application number: KR1020137030658A
Authority: KR
Inventors: 만다얌 톤다누르 라그훈나스
Original assignee: 구글 인코포레이티드
Priority date: 2011-04-21
Filing date: 2012-04-19
Publication date: 2017-05-24
Also published as: US8484218B2; EP2700027A1; US20120271828A1; JP2014519074A; WO2012145521A1; KR20140027285A

Abstract

일 실시예에서, 본 방법에는 출발언어로 된 하나 이상의 제1키워드를 목표언어로 번역하라는 요청을 수신하고; 기계번역 프로세스를 사용하여 출발언어로 된 하나 이상의 제1키워드를 목표언어로 된 다수의 제2키워드들로 번역하는 것이 포함된다. 이 방법은 또한, 목표언어에 관련된 코퍼스에서 상기 제2키워드들의 각각이 출현하는 빈도를 컴퓨터 시스템에 의해서 결정하는 것을 추가로 포함할 수 있다. 이 방법은 또한, 상기 결정된 출현 빈도에 근거하여, 상기 제2키워드들 중에서 목표언어로 사용하기 위한 부분집합을 컴퓨터 시스템에 의해서 선택하는 것을 추가로 포함할 수 있다.

Description

키워드의 현지화 번역{LOCALIZED TRANSLATION OF KEYWORDS}

본 발명은 전반적으로 정보의 표시 내지는 제공에 관한 것이다.

본 출원은 미국 특허출원 제13/091,272호(2011년 4월 21일 출원, 명칭: Localized Translation of Keywords)의 우선권을 주장한다. 본 명세서를 참고자료로서 본 명세서에 포함시킨다.

키워드(예를 들어, 단어, 구, 두문자, 약어, 태그, 또는 그 밖의 메타 데이터)가 다양한 컴퓨터 시스템에 사용되고 있다. 예를 들어, 키워드는 이미지 및 비디오의 주제를 나타내기 위해 이미지나 비디오에 관련되어 왔다. 이러한 키워드는 사용자의 검색 질의어(search query)에 관련된 이미지나 비디오를 찾기 위하여, 이미지 및 비디오 검색 시스템에서 사용되어 왔다.

다른 예로서, 컴퓨터에 기반한 광고 시스템은 잠재적 사용자에 관련된 광고 기회(advertising opportunity)의 식별을 위해 사용할 수 있는 키워드를 광고주가 선택할 수 있도록 구성되어 있다. 광고 기회는, 사용자에게 광고를 제공(예를 들어, 시각적 표시, 또는 청각적 출력)하는 기회를 포함하는데, 예컨대, 검색 결과로서 표시되는 광고, 웹페이지로서 표시되는 배너 광고, 전자적 비디오의 시작시에 재생되는 비디오 광고 등을 들 수 있다. 예를 들어, 새로운 고연비 자동차의 광고 표시를 원하는 광고주는, "fuel efficient automobile", "fuel efficient car", "fuel efficient vehicle", "mpg(miles per gallon: 1갤런당 마일수)", "high mpg" 등과 같은 다양한 광고 연관 키워드를 선택할 수 있다. 광고주의 광고는, 다른 것들(예를 들어, 광고 경매의 결과)도 있지만 그 중에서도 특히, 상기 선택된 광고 키워드와 사용자의 검색 질의어(가령, "high mpg car")를 비교함으로써, 사용자의 검색 질의어에 대한 검색 결과로서 표시될 수 있다.

키워드를 출발언어(source language)에서 목표언어(target language)로 번역하기 위해 기계번역 기술이 사용되어 왔다. 예를 들어, 기계번역 기술의 일례로서, 출발언어 단어와 목표언어 단어 간의 매핑(mapping)을 사용하여 키워드를 번역할 수 있다.

본 명세서는 전반적으로 출발언어에서 목표언어로의 키워드 현지화 번역(localized keyword translation)을 설명하고 있다. 예를 들어 영어 사용자를 대상으로 영어로 된 키워드를 생성한 당사자는 이 키워드를 다른 언어(가령 불어) 사용자를 대상으로 하는 다른 언어로 번역하는 것에 관심을 가질 수 있다. 종종 당사자는 출발언어 사용자를 효과적으로 대상화하기 위한 키워드 집합에 도달하기 전에 여러 번의 수정을 했었을 것이다. 이러한 출발언어 키워드의 현지화 번역에 의해서 당사자는 출발언어 키워드를 목표언어 키워드로 발전시키고 다듬기 위해 드는 작업의 일부를 덜게 될 수 있다.

언어대조 사전(예를 들어, 영어-불어 사전)을 이용한 키워드의 단순한 번역으로는 출발언어의 키워드와 동일한 의미를 갖는 목표언어로 된 정확한 현지화된 키워드를 얻기 힘들다. 효과적인 키워드는 단어와 구문이 언어상의 특정 의미 -- 이는, 언어대조 사전에 정확하게 반영되지 못할 것이며 기계번역 기술에 의해서도 제공되지 못할 것이다 -- 를 갖는지에 대한 현지화된 지식에 기반하여 선택된다. 예를 들어, "car insurance(자동차 보험)"를 영어-불어 사전을 이용하여 영어에서 불어로 번역하면 "l'assurance automobile"이라는 말로 번역될 가능성이 크다. 그러나 불어 사용자들은 자동차 보험을 말할 때에는 "l'assurance voiture"를 더 일반적으로 사용한다. "car insurance"와 "l'assurance voiture"가 각각 영어와 불어로 무엇을 의미하는지에 대한 현지화된 지식이 이 키워드를 효과적으로 번역하는 데 유용하다.

키워드를 번역하는 데 사람이 번역을 해왔지만, 이는 비용과 시간이 걸릴 수 있고, 출발언어와 목표언어 모두에 대해 현지화된 지식을 가진 사람을 찾아내는 것은 어려울 수 있다.

본 명세서는 전반적으로 출발언어에서 목표언어로의 키워드 현지화 번역(localized keyword translation)을 설명하고 있다. 키워드의 현지화 번역에는 출발언어(예를 들면, 영어)로 특정 의미를 전달하는 키워드들을 목표언어(예를 들어, 불어)로 현지의 유사한 의미를 전달하는 키워드들로 번역하는 것이 포함된다. 이러한 키워드 현지화 번역은, 목표언어에 관련된 다양한 코프라(corpora)(예컨대, 목표언어로 된 검색 질의어 로그가 모인 자료)를 이용하여 할 수 있다. 실제로 목표언어 사용자가 사용하는 목표언어에서 일반적인 키워드들 그리고/또는 빈번하게 출현하는 키워드들을 유기적으로 확인(식별)하기 위하여 목표언어로 된 코퍼스를 분석할 수 있다.

일 실시예에서, 본 발명의 방법에는 출발언어로 된 하나 이상의 제1키워드를 목표언어로 번역하라는 요청을 수신하고; 기계번역 프로세스를 사용하여 출발언어로 된 하나 이상의 제1키워드를 목표언어로 된 다수의 제2키워드들로 번역하는 것이 포함된다. 이 방법은 또한, 목표언어에 관련된 코퍼스에서 상기 제2키워드들 각각이 출현하는 빈도를 컴퓨터 시스템에 의해서 결정하는 것을 추가로 포함할 수 있다. 이 방법은 또한, 상기 결정된 출현 빈도에 근거하여, 상기 제2키워드들 중에서 목표언어로 사용하기 위한 부분집합을 컴퓨터 시스템에 의해서 선택하는 것을 추가로 포함할 수 있다.

다른 실시예에서, 출발언어에서 목표언어로 키워드를 번역하는 시스템은, 하나 이상의 컴퓨터와, 출발언어로 된 하나 이상의 제1키워드를 목표언어로 번역하라는 요청을 수신하도록 구성된 상기 컴퓨터에 연결되는 인터페이스를 포함한다. 이 시스템은, 출발언어로 된 하나 이상의 제1키워드를 목표언어로 된 다수의 제2키워드들로 번역하도록 구성된 기계번역 모듈을 추가로 포함할 수 있다. 이 시스템은 또한, 목표언어에 관련된 코퍼스에서 상기 제2키워드들의 각각이 출현하는 빈도를 결정하도록 구성된 상기 컴퓨터의 키워드 빈도 모듈을 추가로 포함할 수 있다. 이 시스템은 또한, 상기 결정된 출현 빈도에 근거하여, 상기 제2키워드들 중에서 목표언어로 사용하기 위한 부분집합을 선택하도록 구성된 상기 컴퓨터의 키워드 선택부를 추가로 포함할 수 있다.

또다른 실시예에서, 데이터 처리 장치로 하여금 동작들을 수행하도록 컴퓨터 판독가능 매체에 인코드된 컴퓨터 프로그램 제품이 제공되는데, 이 동작은, 출발언어로 된 하나 이상의 제1키워드를 목표언어로 번역하라는 요청을 수신하고; 출발언어로 된 하나 이상의 제1키워드를 목표언어로 된 다수의 제2키워드들로 기계번역 프로세스를 사용하여 번역하는 것이 포함된다. 상기 동작은 또한, 목표언어에 관련된 코퍼스에서 상기 제2키워드들의 각각이 출현하는 빈도를 결정하는 것을 추가로 포함할 수 있다. 상기 동작은 또한, 상기 결정된 출현 빈도에 근거하여, 상기 제2키워드들 중에서 목표언어로 사용하기 위한 부분집합을 선택하는 것을 포함할 수 있다.

하나 이상의 실시예에 대한 자세한 내용은 이하의 첨부 도면 및 상세한 설명에 기재되어 있다. 하나 이상의 장점이 본 개시된 시스템, 장치, 방법에 의해 제공될 수 있다. 예를 들어, 일반적인 사용을 고려하여 번역된 키워드는, 전통적인 기계번역 과정을 통해 번역된 키워드 보다, 키워드의 출발언어의 의미를 더 정확하게 전달할 수 있다. 다른 예에서, 사람에 의한 번역 보다 더 신속하고 저렴한 비용으로 키워드를 출발언어에서 목표언어로 정확하게 번역할 수 있다. 또한, 키워드 번역의 정확도가 사람의 번역과 유사할 수 있다(혹은 더 우수할 수도 있다). 또다른 예에서, 언어가 사용되는 지역차를 키워드 번역시에 용이하게 반영할 수 있다. 예를 들면, 지역차에 관한 정보를 번역시에 반영하기 위하여 지역차에 관한 지식에 대한 서베이, 투표, 또는 번역인이 필요없게 될 수 있다. 다른 예에서, 시간 경과에 따른 키워드의 사용 상황의 변화가, 이러한 언어상의 변화를 공식적으로 인지하지 않아도, 키워드 번역시에 유기적으로 그리고 자동적으로 반영될 수 있다.

본 발명의 그 밖의 특징, 목적, 및 장점들은 상세한 설명과 도면 및 특허청구범위에서 명확해질 것이다.

도 1은 예시적인 현지화 번역 서버 시스템의 개념도이다.
도 2는 키워드의 현지화 번역을 수행하는 시스템의 일례를 나타내는 도면이다.
도 3은 하나 이상의 키워드를 출발언어에서 목표언어로 현지화 번역하는 방법의 일례를 나타내는 도면이다.
도 4는 본 문서에 기재된 시스템 및 방법을 실현하기 위해 사용할 수 있는 컴퓨팅 장치의 블록도이다.
각 도면에서 동일한 참조 번호는 동일한 구성요소를 나타낸다.

본 명세서는 사람에 의한 번역없이 키워드(가령, 광고 키워드 등)를 현지화 번역하는 것을 설명하고 있다. 여기 기재된 기술, 방법, 시스템, 및 컴퓨터 프로그램 제품은 목표언어에 관련된 코퍼스(corpus)(예컨대, 문서, 검색 로그, 소셜 네트워크 컨텐트 등)를 사용하여 현지화된 키워드를 산출한다. 키워드에 대한 목표언어로의 최적의 번역을 나타내는 상기 코퍼스를 사용함으로써 현지화가 유기적으로 달성될 수 있다. 이러한 코퍼스에 담겨있는 정보는 사용자 프라이버시 보호를 위해 익명화될 수 있다.

코퍼스에는 사용자를 식별하고 그리고/또는 사용자에 관한 상세 정보를 제공할 수 있는 정보가 포함될 수 있다. 예를 들어, 검색 로그의 코퍼스에는 검색 질의어(search query)의 기록과 이 검색 질의어를 송신한 컴퓨터의 인터넷 프로토콜(IP) 주소가 포함될 수 있다. 사용자는 이 IP 주소 정보에 의해 식별될 수 있다. 사용자 프라이버시 보호를 위해서, 사용자를 식별하거나 그렇지 않으면 사용자에 관련된 세부 사항을 제공하는 정보는 제거 및/또는 마스킹될 수 있는바, 따라서 코퍼스로부터 개인 사용자 정보가 취득되거나 추정되지 못하도록 할 수 있다.

일례로, 목표언어로 된 검색 로그의 코퍼스(예를 들어, 사용자가 검색 엔진에 제출한 검색 질의어 로그)를 사용하여, 다수의 후보키워드 번역들 중에서 어느 것이 출발언어 키워드에 대한 최적의 번역인지를 결정한다. 이 결정은, 검색 로그에서의 각 후보키워드의 출현 빈도 등과 같은 다양한 요인에 기초할 수 있다. 예를 들어, 검색 로그에서 가장 빈번하게 나오는 하나 이상의 목표언어 후보키워드를 출발언어 키워드에 대한 최적의 번역으로서 선택할 수 있다.

예를 들어, 전술한 바와 같은 "car insurance"를 부연하자면, 광고주는 이 키워드 "car insurance"를 영어에서 불어로 번역하길 원한다. 이 키워드는 먼저 불어로 된 다수의 후보키워드로 번역될 수 있다(예를 들어 기계번역 프로세스를 사용하거나, 전자적 언어대조 사전을 사용하여). 예를 들어, 후보키워드에는 "l'assurance automobile"와 "l'assurance voiture"와 같은 다양한 키워드가 포함될 수 있다. 후보키워드들 각각을 불어로 된 코퍼스(예를 들어, 검색 로그, 웹페이지, 또는 소셜 네트워크 컨텐트)를 참조해서 심사하여 후보키워드들 중 어느 것이 현지 불어 사용자가 이해할 수 있는 불어로 "car insurance" 와 가장 가까운지를 결정한다. 불어 코퍼스를 참조하여 후보키워드들을 평가하기 위해서, 이 코퍼스에서 나오는 말의 빈도수와 같은 각종 척도를 사용할 수 있다. 예를 들어, 후보키워드 "l'assurance voiture"가 "l'assurance automobile"보다 더 빈번히 나온다면, "l'assurance voiture"가 "car insurance"보다 더 적합한 현지화 번역으로 추정할 수 있고 이를 불어로 사용하기 위해 선택할 수 있다.

현지화 번역은, 컨텐트와 관련된 광고 키워드 및/또는 설명적 키워드(예컨대, 이미지, 동영상, 문서 등의 주제를 설명하는 키워드)와 같은 다양한 컨텐트 중 하나를 번역하는 데 사용할 수 있다. 예를 들어, 광고주는, 광고 캠페인(예를 들어, 특정 제품/서비스에 대한 광고들의 모음)에 관심있을 사용자를 정확하게 대상화하는 키워드 집합을 정하기 전에, 광고 캠페인에 관련된 키워드 집합을 여러 번 수정할 수 있다. 다른 지역 및/또는 다른 언어를 사용하는 인구 통계(demographics)에 대해 광고 캠페인을 전개할 때에, 다른 언어들로 된 키워드 집합을 즉시 만들 수 있다. 현지화 번역은, 광고 캠페인에 관심있을 사용자를 보다 효과적으로 식별하기 위하여 수정되었던 출발언어 광고 키워드의 의미를, 목표언어로 번역된 광고 키워드에 대해서도 이월시켜 줄 수 있다.

또 다른 예에서, 이미지에 관한 메타 데이터(예를 들어, 키워드)를, 이 이미지의 주제를 타언어로 정확히 설명하기 위하여 현지화 번역을 이용하여 번역할 수 있다. 이러한 번역된 메타 데이터(예를 들어, 키워드)는 다양한 방법으로 사용될 수 있다. 예를 들어, 이미지 검색 기능을 제공하는 검색 엔진은 타언어로 이미지 검색 질의어를 제출하는 사용자에게 이미지를 제공해주기 위하여, 번역된 키워드를 사용할 수 있다.

이들 특징들을, 앞에서 언급되지 않은 다른 특징과 함께, 이하에서 도면을 참조하여 자세히 설명한다.

도 1은 출발언어에서 목표언어로 컨텐트(예를 들어, 키워드)의 현지화 번역을 수행하도록 구성되는 현지화 번역 서버 시스템(100)의 개념도이다. 도시된 예에서 현지화 번역 서버 시스템(100)은 영어에서 스페인어로의 키워드 번역에 대한 요청을 수신하고 이에 응답하여 번역된 키워드를 출력한다.

현지화 번역 서버 시스템(100)은 랩톱 컴퓨터, 데스크톱 컴퓨터, 분산 서버 시스템, 또는 이들의 조합 등, 다양한 컴퓨팅 장치일 수 있다. 단계 A(102)에서, 현지화 번역 서버 시스템(100)은 "soda pop"(키워드 104)을 영어에서 스페인어로 번역하라는 전자적 요청을 수신한다. 이 전자적 요청은, 인터넷, 근거리 네트워크(LAN), 광역 네트워크(WAN), 가상 사설망(VPN), 무선 네트워크(예를 들어, WiFi, 셀룰러 전화 네트워크, 3G/4G 데이터 네트워크 등), 또는 이들의 임의 조합 등과 같은 임의의 다양한 통신 채널을 통해 현지화 번역 서버 시스템(100)이 수신할 수 있다.

도시되어 있지 않지만, 이 요청은, 타 컴퓨팅 장치(예컨대, 타 컴퓨터 서버 시스템, 휴대 전화, 스마트폰, 태블릿 컴퓨팅 장치, 데스크톱 컴퓨터, 또는 이들의 임의의 조합)에 의해서 현지화 번역 서버 시스템(100)으로 제공될 수 있다. 이러한 타 컴퓨팅 장치는, 타 컴퓨팅 장치의 사용자가 요청을 생성하기 위해 사용한 전자문서(예컨대, 웹페이지) 및/또는 응용 프로그램(예를 들어 독립형 키워드 번역 애플리케이션, 웹 브라우저, 등)을 사전에 받았을 수도 있다. 예를 들어, 타 컴퓨팅 장치의 사용자는 현지화 번역 서버 시스템(100)에 호스팅되고 현지화 키워드 번역을 요청하기 위해 사용할 수 있는 양식(예를 들어, 키워드 항목(필드), 출발언어 항목, 목표언어 항목, 제출 버튼 등)이 포함된 키워드 번역 웹페이지를 사전에 요청했을 수도 있다. 타 컴퓨팅 장치의 사용자가 해당 양식에 "soda pop"을 입력하고 요청 시작 행위를 취하면(예를 들어, 제출 버튼의 선택, 양식의 항목의 입력 완료 등) 이 타 컴퓨팅 장치는 이 요청이 현지화 번역 서버 시스템(100)으로 전송되도록 할 수 있다.

단계 B(106)에서, 현지화 번역 서버 시스템(100)은, 영어 키워드를 스페인어 키워드로 매핑하는 영어-스페인어 전자 사전을 이용한 기계번역 기술과 같은 공지의 다양한 번역 기술들 중 하나를 사용하여 영어 키워드 "soda pop"을 스페인어로 번역한다. 도시한 예에서 키워드 "soda pop"은 스페인어 키워드 "gaseosa"로 번역된다(108). 번역된 키워드 "gaseosa"는 "soda pop"의 현지화 번역의 한 후보로 간주될 수 있다.

단계 C(110)에서 현지화 번역 서버 시스템(100)은 단계 B 이후의 "gaseosa"가 포함된 목표언어(스페인어)로 된 후보키워드 그룹을 증강하여 "gaseosa"에 연관된 키워드들을 포함시킨다. 단계 C는 목표언어(스페인어)와 유사하지만 구별되는 의미를 갖는 연관 키워드를 추가로 포함시켜서 후보키워드 그룹을 증강시키도록 수행될 수 있다. 연관된 키워드들을 찾기 위하여 다양한 기술을 사용할 수 있다. 예를 들어 연관된 키워드들의 그룹을 제공하는 워드클러스터(word cluster) 및/또는 동의어 목록을 제공하는 어휘집(thesaurus)을 사용할 수 있다. 이 예에서, 단계 C의 수행 결과로 증강된 목표언어 후보키워드 그룹에는 "gaseosa", "refresco", "bebida cabonata", "soda"(112)가 포함되어 있다.

단계 D(114)에서 현지화 번역 서버 시스템(100)은 스페인어에 관련된 하나 이상의 코퍼스에서 각 후보키워드가 출현하는 빈도를 판단한다. 단계 D에서 사용되는 코퍼스에는, 해당 키워드가 여러 언어로 어떻게 사용되고 있는지를 나타내는 정보가 포함될 수 있다(추가로 분석을 해야 할 수도 있고 하지 않을 수도 있음). 예를 들어, 단계 D에서 사용할 수 있는 예시적 코퍼스(116a~n)는, 검색 질의어 로그(116a), 전자문서(116b), 소셜 네트워크 컨텐트(116n)를 포함할 수 있다. 코퍼스(116a~n)로부터 액세스되는 정보는 사용자의 프라이버시 보호를 위해 익명화될 수 있다.

검색 질의어 로그(116a)에는 컴퓨터 시스템(예컨대, 검색 엔진)의 사용자가 제출했던 검색 질의어의 기록이 들어 있다. 검색 질의어가 대부분 간단하기 때문에, 검색 질의어 로그를 조사하는 것은, 사용자가 어떤 키워드를 중시하는지 및/또는 사용자가 관심있어 하는 개념이나 생각을 전달하기 위한 최적의 방법으로서 사용자가 어떤 키워드들을 선택하는지를 나타낼 수 있다. 예를 들어 영어 사용자는 "automobile"이라는 말보다는 "car"라는 말이 포함된 검색 질의어를 더 빈번하게 제출할 수 있을 것이다. 검색 질의어 로그(116a)에서 "car"의 빈도가 더 많다는 것은, 영어 사용자는 "automobile"에 비해 "car"에 대해서 더 현지적 선호도를 갖는다는 것을 나타낼 수 있다. 검색 질의어 로그(116a)를 사용함으로써 이러한 현지적 선호도를 유기적으로 확인(identify)할 수 있으며, 검색 질의어 로그(116a)를 최근의 사용자 검색 질의어로 지속적으로 업데이트함으로써 시간 경과에 따른 이 선호도의 변화를 자동으로 확인할 수 있다.

검색 질의어 로그(116a)에는 다양한 정보, 예를 들어, 검색 질의어에 관련된 언어(예를 들어, 사용자의 컴퓨팅 장치에서 사용되는 언어), 검색 질의어에 대한 타임스탬프(timestamp), 그리고/또는 검색 질의어를 보낸 지역(예를 들어, 대륙, 국가, 주, 도시 등) 등이 포함/관련될 수 있다. 검색 질의어 로그는 검색 질의어를 수신한 컴퓨터 시스템에 의해 생성될 수 있다. 현지화 번역 서버 시스템(100)에는 인덱스들(indices) 및/또는 해시 표(hash tables)과 같은 다양한 데이터 구조를 사용하여 구성할 수 있는 검색 질의어 로그(116a)에 대한 액세스권이 부여될 수 있다.

검색 질의어 로그(116a)에서 후보 스페인어 키워드(112)의 빈도를 판단하는 때에, 코퍼스로부터 조사되는 검색 질의어 로그는, 해당 검색 질의어가 발송된 지역 및/또는 해당 검색 질의어가 수신된 시간 프레임(시간 범위)과 같은 다양한 기준에 만족하는 검색 질의어로 좁혀질 수 있다. 예를 들면, 멕시코에서 사용되는 스페인어 키워드는 스페인에서 사용되는 스페인어 키워드와 다를 수 있다. "soda pop"을 스페인어로 번역하라는 요청을 처리할 때에, 현지화 번역 서버 시스템(100)은 빈도 분석에 사용하는 스페인어 검색 질의어 로그를, 상기 요청시에 지정된(명시적이든 묵시적이든) 지역으로부터의 검색 질의어로 좁힐 수 있다. 마찬가지로, 현지화 번역 서버 시스템(100)은 사용되는 검색 질의어 로그의 시간 범위를 한정할 수 있다. 예를 들어, 현지화 번역 서버 시스템(100)은 검색 질의어 로그를, 최종의 시간, 일, 월, 년, 5년, 10년 등의 기간 내에 수신한 검색 질의어로 한정할 수 있다.

전자문서 코퍼스(116b)는 전자문서(예컨대, 웹페이지)에 관련된 정보를 포함할 수 있다. 예를 들어, 전자문서 코퍼스(116b)는 다양한 전자문서에서 사용된 키워드의 인덱스 및 전자문서에 관련된 정보(예를 들면, 언어, 웹 주소, 타임스탬프 등)를 포함할 수 있다. 검색 질의어 로그(116a)와 유사하게, 전자문서 코퍼스(116b)는 키워드가 언어 사용자에 의해 어떻게 사용되는지 그리고/또는 특정 지역 내에서 어떻게 사용되는지에 대한 지표를 제공할 수 있다. 예를 들어, 웹페이지를 만드는 사용자가 "automobile"보다는 "car"라는 말을 더 빈번하게 사용하는 경우, 이러한 빈도의 차이는 사용자가 "automobile" 보다는 "car"를 더 선호한다는 것에 대한 지표를 제공할 수 있는 것이다. 이 전자문서 코퍼스(116b)는 관련 컴퓨터 시스템(예컨대, 검색 엔진, 웹 크롤러 엔진 등)에 의해 생성되고 유지될 수 있으며, 현지화 번역 서버 시스템(100)에는 적어도, 빈도 분석을 위해 이 코퍼스(116b)로의 액세스권이 부여될 수 있다.

소셜 네트워크 컨텐트 코퍼스(116n)에는 소셜 네트워크(예를 들어, Facebook, Twitter, LinkedIn, Youtube 등)에서 사용자에 의해 생성된 컨텐트(예를 들어, 코멘트, 게시물, 프로필 정보 등)가 포함될 수 있다. 위에서 논의한 검색 질의어 로그 및 전자문서와 유사하게, 소셜 네트워크 사용자에 의해 생성된 컨텐트는 키워드가 어떻게 사용되며 특정 언어에서 키워드가 의미하는 것이 무엇인지를 나타낼 수 있다. 소셜 네트워크 컨텐트 코퍼스(116n)는 이 코퍼스(116n) 내에서의 키워드의 빈도를 분석할 때에 현지화 번역 서버 시스템(100)이 사용할 수 있는 추가적인 여러 가지 정보를 포함할 수 있는데, 이 정보의 예로서, 소셜 네트워크 컨텐트에 관련된 언어, 컨텐트가 창출된 지역, 및/또는 컨텐트의 타임스탬프를 들 수 있다. 소셜 네트워크 컨텐트 코퍼스(116n)는 해당 소셜 네트워크 서버 시스템에 의해서 취합 및 관리되며, 현지화 번역 서버 시스템(100)은 이 코퍼스(116n)에 대한 액세스권을 부여받을 수 있다.

도 1에 도시 및 설명되지 않은 다른 다양한 코포라도 또한 현지화 번역 서버 시스템(100)가 참조할 수 있다.

현지화 번역 서버 시스템(100)은 하나 이상의 코포라(116a~n) 내에서의 스페인어 후보키워드(112)의 출현 빈도를 결정할 수 있다. 하나 이상의 코포라(116a~n) 내에서의 상기 키워드(112)들의 출현 빈도를 표(118)에 예시적으로 나타내었다. 이 표(118)에 도시된 바와 같이, 키워드 "refresco"는 100회 출현한 최대 빈도수를 가지며, "soda pop"의 최초 번역 결과였던 "gaseosa"(단계 B 참조)는 25회 출현으로 두 번째 빈도수를 나타낸다.

출현수는 다양한 방법으로 계수할 수 있다. 예를 들어, 키워드가 나타난 문서 및/또는 검색 질의어의 수를 출현수로 정할 수도 있고, 키워드가 나타난 횟수(동일한 문서 및/또는 검색 질의어에서 여러 번 출현하는 것도 포함)를 출현수로 정할 수도 있다. 출현수는 다양한 데이터 형식을 이용하여, 가령, 항목(표(118)에 나타낸 것과 같은), 백분율, 그리고/또는 집계된 출현 수준(예를 들면, 높은 빈도, 중간 빈도, 낮은 빈도)을 사용하여 결정할 수 있다.

출현에는 가중치를 부여할 수 있는데, 가령, 일부 키워드의 출현에는 다른 출현보다 더 높은 가중치를 부여(더 강한 지표를 나타냄)할 수 있다. 예를 들어, 문서의 제목에서의 키워드 출현은 문서의 하단에 작은 글꼴로 표시되는 붙박이글(boilerplate language)에서의 키워드 출현보다 더 선호된다는 보다 강한 지표를 나타낼 수 있다. 다른 예를 들자면, 검색 질의어에서의 첫번째 키워드는 검색 질의어에서의 마지막 키워드보다 약간 더 큰 가중치를 부여받을 수 있는바, 사용자는 중요도에 따라 검색 질의어의 키워드들을 정렬할 수 있다. 또다른 예를 들자면, 시리즈 검색 질의어(예컨대, 세션)들로 제출된 키워드를 세분화(refinement)했다는 것은, 사용자가 어느 한 키워드가 다른 키워드보다 더 적합하다는 것(예를 들어, 더 나은 결과를 가져온다는 것)을 알았음을 나타내는 것일 수 있다. 예를 들어, 사용자가 검색 질의어 "home building"을 제출하고 나서 검색 질의어 "home construction"을 제출하였다고 할 경우(이 사용자 세션 동안에 더 이상의 검색 질의어는 제출되지 않았음), 키워드 "home construction"에 의한 검색 결과가 "home building"에 의한 결과보다 더 사용자에게 선호되는 것으로 추측할 수 있다. 이러한 세션 정보를 근거로, 키워드 "home construction"에 "home building"보다 더 큰 가중치를 부여할 수 있다. 이러한 중요도 및/또는 사용자 선호도의 지표는 키워드 출현에 가중치를 매기는 데 사용할 수 있는 지침을 줄 수 있다.

단계 E(120)에서, 현지화 번역 서버 시스템(100)은 표(118)에서 결정된 출현 빈도를 근거로, 스페인어 키워드들 중에서 하나 이상을 선택한다. 이 예에서 현지화 번역 서버 시스템(100)은, 현지화 번역 서버 시스템(100)이 조사한 하나 이상의 코포라(116a~n)에서 최다 출현 빈도를 갖는 키워드를 근거로 "refresco" (키워드 122)를 선택한다.

단계 F(126)에서 현지화 번역 서버 시스템(100)은 "soda pop"을 스페인어로 번역하라는 요청에 대한 응답으로서 이 키워드 122를 출력한다. 이 키워드(122)는 번역을 요청했던 컴퓨팅 장치로 제공될 수도 있고, 단독으로 또는 웹페이지 등의 전자문서와 함께 제공될 수도 있다. 예를 들어, 현지화 번역 서버 시스템(100)은 사용자의 요청에 대해 번역 결과를 제공하는 웹페이지를 서비스할 수 있다. 이러한 웹페이지는 다양한 전자 데이터 포맷(가령, HTML, 확장형 마크업 언어(XML: extensible markup language), SHOCKWAVE/FLASH, JAVASCRIPT, 및/또는 HTML5 등) 중 하나의 형태로 제공될 수 있다.

도 2는 키워드의 현지화 번역을 제공하는 예시적인 시스템(200)을 나타낸다. 이 시스템(200)은 키워드의 현지화 번역을 제공하도록 구성되는 현지화 번역 서버 시스템(202)을 포함한다. 이 시스템(200)은 또한, 사용자에게 컨텐트를 제공하고, 컨텐트 제공의 일부로서, 현지화 번역 서버 시스템(202)이 키워드 번역을 위해 사용할 수 있는 코퍼스(206)를 생성/관리하는 컨텐트 서버 시스템(204)을 포함한다. 예시 시스템(200)은 또한, 현지화 번역 서버 시스템(202)과 인터랙트하고(예컨대, 키워드 번역을 요청) 그리고/또는 컨텐트 서버 시스템(204)과 인터랙트(예컨대, 컨텐트 요청)할 수 있는 클라이언트 컴퓨팅 장치(208)를 포함한다. 이 현지화 번역 서버 시스템 202는, 도 1을 참조하여 위에서 설명한 현지화 번역 서버 시스템 100과 동일하다 할 수 있다.

클라이언트 컴퓨팅 장치(208)는 랩톱 컴퓨터, 데스크톱 컴퓨터, 넷북, 이동전화기, 스마트폰, 태블릿 컴퓨팅 장치, 및/또는 컴퓨터 서버 시스템 등의 다양한 컴퓨팅 장치 중의 임의의 것일 수 있다. 클라이언트 컴퓨팅 장치(208)는, 이 장치(208)가 네트워크(212)를 통해 타 컴퓨팅 장치와 통신하는 데 사용하는 입력/출력(I/O) 인터페이스(210)를 포함한다. I/O 인터페이스(210)는 이더넷 카드, 무선 네트워크 카드, 셀룰러 네트워크 송수신기, 또는 이들의 임의 조합 등과 같은 다양한 통신 인터페이스 중의 임의의 것일 수 있다. 클라이언트 컴퓨팅 장치(208)는 네트워크(212)를 통해 컨텐트 서버 시스템(204)으로 컨텐트 요청을 보내고/또는 현지화 번역 서버 시스템(202)으로 키워드 번역 요청을 보내도록 구성된 요청 모듈(214)을 포함한다. 요청 모듈(214)은 사용자의 입력(가령, 전자문서(예컨대, 웹페이지)에 제공되는 링크 및/또는 버튼을 사용자가 선택)에 응답하여 상기 요청을 수행하도록 구성할 수 있다. 클라이언트 컴퓨팅 장치(208)는 또한, 컨텐트 서버 시스템(204) 및/또는 현지화 번역 서버 시스템(202)에서 각각 수신된 컨텐트 및/또는 번역된 키워드를 클라이언트 컴퓨팅 장치(208) 상에 출력(예를 들어, 시각적 표시, 청각적 재생 등)하도록 구성된 표시 모듈(216)을 포함할 수 있다.

네트워크(212)는 컴퓨팅 장치가 통신을 위해 사용할 수 있는 다양한 네트워크들 중 임의의 것일 수 있다. 예를 들어, 네트워크(212)에는 LAN, WAN, VPN, 무선 네트워크, 인터넷, 점대점 네트워크, 전화 네트워크(예컨대, 공중 전화 교환망(PSTN)), 셀룰러 전화 네트워크, 3G/4G 네트워크, 또는 이들의 임의의 조합 등이 포함될 수 있다.

컨텐트 서버 시스템(204)은 데스크톱 컴퓨터, 랩톱 컴퓨터, 분산 컴퓨터 서버 시스템, 전용 컴퓨터 서버 시스템, 및/또는 공존(colocated) 컴퓨터 서버 시스템 등의 다양한 컴퓨팅 장치 중의 하나일 수 있다. 컨텐트 서버 시스템(204)은 요청받은 컨텐트를 각종 컴퓨팅 장치(예컨대, 클라이언트 컴퓨팅 장치(208))로 서비스하도록 구성된다. 컨텐트 서버 시스템(204)은 다양한 컨텐트, 검색 질의어, 전자문서, 및/또는 소셜 네트워크 정보를 서비스하도록 구성할 수 있다. 예를 들어, 컨텐트 서버 시스템(204)은 검색 엔진일 수 있다. 다른 예를 들자면 컨텐트 서버 시스템(204)은 소셜 네트워크 시스템일 수 있다.

컨텐트 서버 시스템(204)은 클라이언트 컴퓨팅 장치의 I/O 인터페이스(208)와 동일하다 할 수 있는 I/O 인터페이스(218)를 포함한다. 컨텐트 서버 시스템(204)은 또한, 검색 질의어 등의 컨테트에 대한 요청 및/또는 소셜 네트워크 페이지에 대한 요청을 서비스하도록 구성되는 컨텐트 요청 처리 모듈(220)을 포함한다. 컨텐트 요청 처리 모듈(220)은 수신 및 처리되는 다양한 요청에 관련되는 정보를 저장하도록 구성할 수 있다. 예를 들어, 컨텐트 요청 처리 모듈(220)은 클라이언트 컴퓨팅 장치(208)로부터 수신한 검색 질의어를 코퍼스(206) 내에 기록(log)할 수 있다. 또 다른 예로서, 컨텐트 요청 처리 모듈(220)은 소셜 네트워크 사용자가 생성한 컨텐트(예를 들어, 소셜 네트워크에 새로운 컨텐트를 추가하라는 요청의 댓글, 게시글 등) 및/또는 컨텐트 요청(예를 들어, 소셜 네트워크의 다른 사용자의 프로필 페이지의 요청)에 관한 로그 정보를 저장할 수 있다.

컨텐트 요청 처리 모듈(220)은 하나 이상의 언어(222)(예컨대, 영어, 스페인어, 불어 등)가 적용될 수 있는 정보를 이들 언어에 관련된 코퍼스(206)에 저장할 수 있다. 예를 들어 컨텐트 서버 시스템(204)이 영어 사용자로부터 수신한 영어로 된 검색 질의어를 코퍼스(206) 내에 영어와 관련하여 저장할 수 있다. 일부 실시예에서는 각 언어별로 별도의 코퍼스가 사용된다. 정보와 함께 다양한 추가적 세부 사항(예컨대, 정보가 발신된 지역 및/또는 정보에 관련된 타임스탬프)을 코퍼스에 저장할 수 있다.

현지화 번역 서버 시스템(202)은 네트워크(212)와 현지화 번역 서버 시스템(202)의 I/O 인터페이스(224)를 통해 하나 이상의 키워드의 현지화 번역 요청을 수신할 수 있다. 현지화 번역 서버 시스템(202)의 I/O 인터페이스(224)는 다른 I/O 인터페이스 210 및 218과 동일하다 할 수 있다. 번역의 요청은 클라이언트 컴퓨팅 장치(208)로부터 수신할 수 있다. 예를 들어, 현지화 번역 서버 시스템(202)은, 최종 사용자(예컨대, 클라이언트 컴퓨팅 장치(208))에게 키워드 번역 서비스(예를 들면, 웹페이지 서비스, 키워드 데이터 서비스 등)를 제공하도록 구성할 수 있다. 다른 예로서, 현지화 번역 서버 시스템(202)은, 최종 사용자에게 상기 정보를 제공하도록 구성되어 있는 타 컴퓨터 시스템(가령, 컨텐트 서버 시스템(204))에 키워드 번역 정보를 제공하도록 구성할 수 있다.

현지화 번역 서버 시스템(202)은 출발언어 키워드들을 연관된 키워드들의 그룹으로 분류(grouping)하는 키워드 분류 모듈(226)을 포함한다. 이들 그룹은 현지화 번역 서버 시스템(202)에 의해서, 기계번역된 키워드의 의미에 문맥(context)을 부여하는 데 사용될 수 있다. 이러한 문맥은 목표언어의 후보키워드 그룹을 보다 정확하게 증강(augment)하기 위하여 사용될 수 있다. 예를 들어, 다수의 키워드를 영어(출발언어)에서 불어(목표언어)로 일괄 번역하라는 요청을 현지화 번역 서버 시스템(202)이 받으면, 이 영어 키워드들은 기계번역 및 빈도 분석 전에 키워드 분류 모듈(226)에 의해서 분류될 수 있다. 이들 그룹은, 추가 연관 키워드들을 포함시켜서 불어 후보키워드를 증강시킬 때에 문맥을 제공하도록, 기계번역된 불어 키워드들에 대해서 관리될 수 있다.

예를 들어, 키워드 "jaguar"는 동물을 지칭할 수도 있고 자동차 브랜드를 지칭할 수도 있다. "jaguar"가 동물에 관련된 키워드들로 분류되는 경우에, 이들 키워드들은 이 "jaguar"에 대해 의도된 의미를 나타내는 문맥을 제공할 수 있다. 마찬가지로, "jaguar"가 자동차에 관련된 키워드들로 분류되는 경우에는, 이 키워드들이 제공하는 문맥은 "jaguar"가 자동차 브랜드로서 의도된 것임을 나타낼 수 있다.

키워드 분류 모듈(226)은, 함께 분류해야 할 연관 키워드를 식별하기 위하여 키워드 연관성 데이터 저장소(228)(예를 들어, 데이터베이스, 파일 시스템 등)를 활용할 수 있다. 키워드 연관성 데이터 저장소(228)는 키워드 분류 모듈(226)이 키워드를 분류하기 위해 사용할 수 있는 키워드들 간의 연관성을 매핑할 수 있다.

분류된 키워드들은 키워드 분류 모듈(226)에 의해서 자동 번역 모듈(230)로 제공될 수 있는데, 자동 번역 모듈(230)은 분류된 키워드들을 출발언어에서 목표언어로 번역한다. 자동 번역 모듈(230)은, 전자 사전을 참조하여 출발언어 키워드를 목표언어 키워드로 매핑하는 기법, 그리고/또는 다양한 규칙 및/또는 키워드 매핑을 사용하여 키워드를 출발언어에서 목표언어로 자동 번역하는 기계번역 프로세스를 이용하는 기법 등, 다양한 번역 기법을 사용할 수 있다.

목표언어의 후보키워드들은 키워드 증강 모듈(232)로 제공될 수 있는데, 이 키워드 증강 모듈(232)은 목표언어로 된 추가 연관 키워드를 후보키워드들의 그룹에 포함시켜서 이 후보키워드 그룹을 증강시키도록 구성된다. 키워드 증강 모듈(232)은 키워드의 의도된 본래의 의미를 추측하고 연관 키워드를 확인하기 위하여 키워드 분류 모듈(226)에 의해 결정된 출발언어 키워드의 그룹들을 사용할 수 있다. 목표언어로 된 연관 키워드를 확인하기 위하여, 워드클러스터 및/또는 전자 어휘집(electronic thesaurus)을 활용하는 등, 다양한 기법을 사용할 수 있다.

증강된 후보키워드 그룹은, 하나 이상의 적절한 코퍼스(예컨대, 목표언어로 된 검색 질의어 로그 코퍼스 그리고/또는 목표언어로 된 전자문서 코퍼스)에서의 각 후보키워드의 빈도를 결정하도록 구성되어 있는 키워드 빈도 모듈(234)에 제공될 수 있다. 키워드 빈도 모듈(234)은 키워드의 빈도 결정을 하기 위하여, 컨텐트 서버 시스템(204)에 의해 생성되고 관리되는 코퍼스(206)에 액세스할 수 있다. 도면에서는 현지화 번역 서버 시스템(202)이 네트워크(212) 및/또는 컨텐트 서버 시스템(204)을 거치지 않고 코퍼스(206)에 액세스하는 것으로 도시되어 있지만, 코퍼스(206)로의 액세스는 네트워크(212) 및/또는 컨텐트 서버 시스템(204)을 통해서 이루어질 수도 있다. 키워드 빈도 모듈(234)은 빈도 분석을 하기 위하여 코퍼스의 해당 관련 부분을 확인하기 위해 언어군(222)을 활용할 수 있다. 또한, 도 1에 대해 위에서 언급한 것처럼, 키워드 출현에는 키워드 출현의 중요도(예를 들어, 문서의 제목에서의 출현, 붙박이글에서의 출현 등) 등과 같은 다양한 요소에 따라 가중치를 부여할 수 있다.

결정된 키워드 빈도는, 이 결정된 빈도에 근거하여 출발언어 키워드들의 최적의 번역을 선택하도록 구성되어 있는 키워드 선택부(236)에 제공될 수 있다. 결정된 출현 빈도에 기초하여 키워드를 선택하기 위해 다양한 기법을 사용할 수 있다. 예를 들어, 키워드 선택부(236)는 출현 빈도가 가장 높은 것으로 결정된 후보키워드의 수(예컨대, 1, 2, 5, 7, 10 등)를 선택할 수 있다. 또 다른 예로서, 키워드 선택부(236)는, 최소한의 출현 빈도 임계값을 갖는 후보키워드를 선택할 수 있다. 키워드는 키워드 분류 모듈(226)에 의해 분류된 각 키워드 그룹들에서 선택할 수 있다. 키워드 선택부(236)는 선택된 키워드(목표언어)를 I/O 인터페이스(224)와 네트워크(212)를 통해서, 요청을 발송한 컴퓨팅 장치(예컨대, 클라이언트 컴퓨팅 장치(208) 및/또는 컨텐트 서버 시스템(204))로 보내줄 수 있다.

도시되어 있지 않지만, 현지화 번역 서버 시스템(202)은 키워드 선택부(236)가 행한 키워드 선택을 최소한 임계 시간 동안 캐시처리할 수 있다. 유사한 요청을 받으면 이 캐시처리된 키워드 선택을 단축키로서 사용하여 요청 컴퓨팅 장치로 키워드 번역을 제공해줄 수 있다.

도 3은 하나 이상의 키워드를 출발언어에서 목표언어로 현지화 번역하기 위한 예시적인 방법(300)을 나타낸다. 이 방법(300)은 도 1과 도 2에 각각 도시한 현지화 번역 서버 시스템(100) 및/또는 현지화 번역 서버 시스템(202) 등과 같은 다양한 컴퓨팅 장치/시스템에 의해 실행될 수 있다.

이 방법(300)은, 출발언어에서 목표언어로 하나 이상의 제1키워드를 현지화 번역하라는 요청을 수신하는 단계 302에서 시작한다. 예를 들어, 이 요청은 1군의 영어 키워드를 스페인어 키워드로 번역하라는 것일 수 있다. 각 키워드에는 하나 이상의 단어가 포함될 수 있다.

일부 실시예에서, 수신된 요청은 제1키워드를 지역에 관련된 목표언어로 번역하라고 추가적으로 지정할 수 있다. 예를 들어, 수신된 요청은 영어 키워드를 멕시코에서 사용되는 스페인어 키워드로(다른 나라(가령, 스페인)에서 사용되는 스페인어 키워드 대신에) 번역할 것을 지정할 수 있다. 목표언어 및 요청된 지역에 관련된 코퍼스(또는 그 일부)를 이용하여 현지화 키워드 번역을 행할 수 있다.

특정 실시예에서, 출발언어로 된 제1키워드를, 연관 키워드별로 하나 이상의 제1그룹들로 분류할 수 있다(단계 304). 예를 들어, 현지화 번역 서버 시스템(202)의 키워드 분류 모듈(226)은, 기계번역 전에, 출발언어로 된 키워드(제1키워드)를 분류할 수 있다. 도 2를 통해서 상술한 바와 같이, 이 제1키워드 분류는 번역시에 소실되는 출발언어 키워드의 의미를 최소화시키기 위해서, 기계번역된 키워드(목표언어로 된)에 문맥을 부여하기 위하여 사용할 수 있다.

단계 306에서 출발언어의 제1키워드를 목표언어로 된 다수의 제2 키워드로 번역한다. 번역은 기계번역 프로세스를 활용하여 수행할 수 있다. 예를 들어 도 2에서 전술한 기계번역 모듈(230)을 사용하여 출발언어의 제1키워드를 목표언어의 제2키워드로 번역할 수 있다.

일부 실시예에서, 제2키워드를, 상기 제1그룹 및 이 제2키워드로 번역된 제1키워드를 기준으로 하나 이상의 제2 키워드그룹으로 분류한다(단계 308). 예를 들어 본다. 출발언어(예컨대, 영어)의 제1키워드 As, Bs, Cs, Ds를 연관 키워드 As와 Bs의 첫 번째 그룹 및 연관 키워드 Cs와 Ds의 두 번째 그룹으로 분류한다. 제1키워드 각각을 단계 306에서 목표언어(예를 들어 스페인어)의 제2키워드 At, Bt, Ct, Dt로 번역한다. 제2키워드 At, Bt, Ct, Dt를, 이들이 번역되기 전의 제1키워드(가령, As는 At로부터 번역되었음) 및 제1키워드의 관련 그룹들(가령, As와 Bs로 이루어진 첫 번째 그룹)에 기초하여 분류할 수 있다. 예를 들어, 제2키워드를 At와 Bt, 및 Ct와 Dt로 분류할 수 있다.

일부 실시예에서 제2 키워드그룹에 근거하여 제2키워드에 대한 하나 이상의 소정의 워드클러스터를 확인할 수 있다(단계 310). 상술한 바와 같이, 워드클러스터에는 연관된 의미를 갖는 키워드의 집합이 포함될 수 있다. 제2 키워드그룹은 출발언어의 제1키워드의 의미와 유사한 목표언어의 의미를 전달하는 적절한 워드클러스터를 확인하는 데 사용할 수 있다. 워드클러스터는, 단독으로는 출발언어 키워드와 강한 관련성을 갖지만 다른 연관된 목표언어 키워드의 문맥의 관점에서 볼 때에는 출발언어 키워드와 약한 관련성을 갖는 목표언어 키워드에 문맥을 부여하기 위해 사용할 수 있다. 앞 단락에서의 예를 확대하여, 목표언어의 워드클러스터는 제2 키워드그룹 At 및 Bt를 이용하여 확인할 수 있다. 제2키워드 At, Bt의 각 의미가 이들이 번역되기 전의 제1키워드 As와 Bs의 의미에서 약간 변할 수도 있었음을 감안할 때, 제2 키워드그룹 At, Bt는 번역된 키워드의 의미의 편차를 완화시킬 수 있고 적절한 워드클러스터를 확인하는데 도움을 줄 수 있다.

단계 312에서, 목표언어로 된 추가 키워드들(각각은 최소한, 하나 이상의 제2키워드와의 임계적 관련성을 가짐)을 포함시켜서 제2키워드(후보키워드)를 증강한다. 예를 들어, 현지화 번역 서버 시스템(202)의 키워드 증강 모듈(234)이, 목표언어로 된 연관 키워드들로써 1군의 목표언어 후보키워드들을 증강할 수 있다.

다양한 기법을 사용하여 제2키워드에 포함시키기 위한 추가 키워드들을 찾을 수 있다. 예를 들어, 하나 이상의 추가 키워드를, 키워드에 연관된 하나 이상의 목표언어 랜딩 페이지(landing page)(예를 들어, 웹페이지)로부터 추출할 수 있다(단계 314). 예를 들어, 번역 대상 키워드는, 사용자를 광고대상 상품/서비스를 위한 하나 이상의 랜딩 페이지로 유도하는 광고에 관련된 광고 키워드일 수 있다. 출발언어 및/또는 목표언어로 된 광고대상 상품/서비스를 위한 랜딩 페이지는 확인가능하다. 제2키워드에 포함시킬 수 있는 하나 이상의 추가 키워드를, 이들 목표언어로 된 관련 랜딩 페이지에서 추출할 수 있다. 마찬가지로, 제2키워드에 포함시킬 수 있는 하나 이상의 추가 키워드를, 목표언어로 된 광고에서 추출할 수 있다(예를 들어, 광고 문안에서 추출).

다른 예에서, 추가 키워드는, 최소한 제2키워드들 중 하나와 임계적 관련성을 갖고 있다고 결정된 추가 키워드에 기초하여 제2키워드에 포함시키도록 선택될 수 있다. 이러한 임계적 관련성은 목표언어에 있어서 동의어라고 확인되는 추가 키워드 및 제2키워드에 근거하여 정해질 수 있다. 이러한 임계적 관련성은 또한, 의미론적으로(semantically) 유사한 키워드로 이루어진 소정의 워드클러스터(예를 들어, 단계 310에서 확인한 워드클러스터)에 포함된 추가 키워드와 제2키워드에 근거하여 정해질 수도 있다.

일부 실시예에서, 증강된 제2키워드의 평가(score)를 위하여 하나 이상의 코포라를 선택한다(단계 315). 예를 들어, 현지화 번역 서버 시스템(100)은 코포라(116a~n)(예를 들어, 검색 질의어 로그(116a), 소셜 네트워크 컨텐트(116n)) 중 하나 이상을 선택하여 스페인어 후보키워드(112)(도 1에 관한 설명 참조)를 평가할 수 있다. 하나 이상의 코포라는, 번역 목표 언어(예컨대, 스페인어, 불어) 및/또는 현지화 번역에 관련된 지역(예를 들어, 스페인, 멕시코) 등의 여러 요인에 기초하여 선택할 수 있다. 예를 들어, 키워드를 영어로부터 멕시코에서 사용되는 스페인어로 번역할 때(이는 예컨대 사용자 요청에 의해 지정됨), 멕시코에서 사용되는 스페인어에 관련된 하나 이상의 코포라(예컨대, 멕시코 출처의 검색 질의어 로그 및/또는 멕시코 사용자의 소셜 네트워크 컨텐트 등)를 선택할 수 있다.

단계 316에서, 목표언어에 관련된 코퍼스에서 각 제2키워드가 출현하는 빈도를 결정할 수 있다. 예를 들어, 키워드 빈도 모듈(234)이 도 2에 대해 상술한 것과 같이 코퍼스(206)에서 제2키워드가 출현하는 빈도를 결정할 수 있다. 도 1에 대해서 설명한 바와 같이, 제2키워드의 출현 빈도 결정은 단계 D(114)와 유사하게 수행될 수 있다.

다양한 언어 자료를 활용하여 제2키워드의 출현 빈도를 결정할 수 있다. 예를 들어, 출현 빈도의 결정을 위해 사용된 코퍼스에는 도 1에 대해 상술한 것과 같은 검색 질의어 로그 코퍼스(116a)와 유사한, 목표언어와 관련된 검색 질의어의 검색 로그가 포함될 수 있다. 빈도는 현재 시간의 임계 시간(예를 들어, 최종의 시간, 일, 주, 월, 년, 십년 등) 이내에 수신된 검색 질의어에 대한 검색 로그에 기반하여 결정할 수 있다. 다른 예에서, 코퍼스는 검색 엔진에서 온 하나 이상의 코퍼스, 예를 들어 전자문서로 된 코퍼스(예컨대, 전자문서 코퍼스(116b))를 포함할 수 있다. 이러한 검색 엔진 코퍼스에서 출현 빈도를 결정하는 것에는, 관련된 검색 엔진 컴퓨터 시스템을 이용하여 제2키워드 각각에 대해서 검색을 수행하는 것이 최소한 일부라도 포함될 수 있다. 또 다른 예에서는 코퍼스에는, 하나 이상의 소셜 네트워크에서 오며 목표언어에 연관된 사용자 생성 컨텐트가 포함될 수 있다(예를 들어, 소셜 네트워크 컨텐트 코퍼스(116n)).

단계 318에서, 결정된 출현 빈도를 최소한 부분적으로 이용하여, 목표언어로 사용하기 위한 제2키워드들의 부분집합을 선택할 수 있다. 예를 들어, 키워드 선택부(236)는 도 2에 관해서 상술한 키워드 빈도 모듈(234)에 의해 결정된 빈도에 기초하여 목표언어로 사용하기 위한 키워드를 선택할 수 있다.

단계 320에서, 선택된 제2키워드의 부분집합을 요청 당사자에게 제공할 수 있고/또는 후속 처리에 사용할 수 있다. 예를 들어, 현지화 번역 서버 시스템(202)은 요청 당사자(예컨대, 클라이언트 컴퓨팅 장치(208) 및/또는 컨텐트 서버 시스템(204))에게 제1키워드의 현지화 번역을 제공할 수 있다. 일부 실시예에서 현지화 번역 서버 시스템(202)은 추가 키워드에 기반한 서비스, 가령, 검색 질의어에 나타나는 특정 키워드의 존재에 기초하여 검색 질의어에 응하여 광고를 제공하는 서비스를 제공할 수 있다. 예를 들어, 제2키워드의 부분집합을 선택하는 것과 더불어, 이 제2키워드의 부분집합은 목표언어로 된 하나 이상의 광고와 관련될 수 있다. 이러한 키워드-광고 연계는 관련 컨텐트(가령, 검색 결과)와 함께 광고를 표시하는데 사용될 수 있다. 예를 들어, 광고는 검색 결과들과 함께 목표 언어로 제공될 수 있는바, 이는 광고와 관련된 제2키워드의 부분집합과 검색 질의어와의 비교에 기초하여 식별된 것이다.

일부 실시예에서 제2키워드에서 선택된 부분집합은, 사람의 심사를 위해 이 제2키워드에서 선택된 부분집합을 대기처리하는 컴퓨터 시스템으로 제공될 수 있다. 사람이 심사하는 것에는, 목표언어에 능숙한 사람이 이 선택된 제2키워드를 검토하여 의미가 통하는지 그리고/또는 의도된 의미를 전달하는지를 심사하는 것이 포함될 수 있다. 이 심사자는 출발언어에 능숙할 필요가 없고 심지어는 출발언어를 알고 있을 필요도 없지만, 그 대신에, 선택된 키워드가 목표언어로 된 해당 컨텐트(예를 들어, 광고의 랜딩 페이지, 이미지 등)에 적합한지에 대해서는 집중할 수 있어야 한다. 선택된 키워드가 사람의 심사에 합격했는지 여부를 나타내는 응답을 상기 컴퓨터 시스템에서 수신할 수 있다. 키워드가 합격한 경우에는 이 키워드를 출력할 수 있고/또는 상기와 같이 사용할 수 있다. 키워드가 합격하지 못한 경우에는 방법을 달리하여(가령, 사용한 기계번역 프로세스, 언어 자료, 키워드 분류, 및/또는 키워드 증강 방식 등을 변경) 상기 방법(300)을 다시 수행할 수 있다. 일부 실시예에서, 제2키워드에서 선택된 부분집합이 사람의 심사에 합격하지 못하면 이 키워드는 삭제/제거할 수 있고 상기 방법(300)을 보다 완화된 조건(예컨대, 낮은 빈도 임계 치)으로 다시 수행할 수 있다.

도 4는 본 명세서에 설명된 시스템 및 방법을 구현하기 위하여, 클라이언트로서 또는 서버(또는 다수의 서버)로서 사용할 수 있는 컴퓨팅 장치(400, 450)의 블록도이다. 컴퓨팅 장치 400은 랩톱, 데스크톱, 워크스테이션, 개인 디지털 보조장치, 블레이드 서버, 메인프레임, 및 그 밖의 적절한 컴퓨터 등의 다양한 형태의 디지털 컴퓨터를 나타낸다. 컴퓨팅 장치 450은 개인 디지털 보조장치, 셀룰러 전화, 스마트폰, 및 기타 유사한 컴퓨팅 장치 등의 다양한 형태의 모바일 장치를 나타낸다. 또한 컴퓨팅 장치(400 또는 450)는 범용 직렬 버스(USB) 플래시 드라이브를 포함할 수 있다. 이 USB 플래시 드라이브는 운영 체제 및 다른 애플리케이션을 저장할 수 있다. USB 플래시 드라이브는 타 컴퓨팅 장치의 USB 포트에 삽입할 수 있는 무선 송신기 또는 USB 커넥터 등과 같은 입력/출력부를 포함할 수 있다. 여기에 나타낸 구성요소와 그 연결 및 관계, 그리고 그 기능은 예시에 불과하며 본 명세서에 기재된 그리고/또는 청구된 실시예를 제한하는 것이 아니다.

컴퓨팅 장치(400)는 프로세서(402), 메모리(404), 저장 장치(406), 메모리(404) 및 고속 확장 포트(410)에 연결되는 고속 인터페이스(408), 그리고 저속 버스(414) 및 저장 장치(406)에 연결되는 저속 인터페이스(412)를 포함한다. 각 구성요소(402, 404, 406, 408, 410, 412)는 다양한 버스를 사용하여 서로 연결되며, 공통의 모판(머더보드) 위에 탑재되거나 또는 필요에 따른 적절한 방법으로 설치될 수 있다. 프로세서(402)는, 외부 입출력 장치(가령, 고속 인터페이스(408)에 연결되는 디스플레이(416))에 GUI 그래픽 정보를 표시하기 위하여 메모리(404) 또는 저장 장치(406)에 저장된 명령어를 포함해서 컴퓨팅 장치(400)에서 실행되기 위한 명령어를 처리할 수 있다. 다른 실시예에서는 다중 프로세서 및/또는 다중 버스를 다수의 메모리 및 다종의 메모리와 함께 적절하게 사용할 수 있다. 또한 다중 컴퓨팅 장치(400)는, 각 장치가 동작의 일부를 제공하도록 연결할 수 있다(예를 들어, 서버 뱅크, 블레이드 서버 그룹, 또는 멀티 프로세서 시스템 등).

메모리(404)는 컴퓨팅 장치(400) 내의 정보를 저장한다. 일 실시예에서, 메모리(404)는 휘발성 메모리 장치(들)이다. 다른 실시예에서, 메모리(404)는 비휘발성 메모리 장치(들)이다. 메모리(404)는 또한, 다른 형태의 컴퓨터 판독가능 매체, 가령, 자기 디스크 또는 광 디스크일 수 있다.

저장 장치(406)는 컴퓨팅 장치(400)를 위한 대용량 저장소 기능을 한다. 일 실시예에서, 저장 장치(406)는 플로피 디스크 장치, 하드 디스크 장치, 광 디스크 장치, 또는 테이프 장치, 플래시 메모리, 또는 기타 유사한 반도체 메모리 장치, 장치 어레이 등의 컴퓨터 판독가능 매체이거나 이 매체를 포함할 수 있는데, 여기에는, 저장영역 네트워크 또는 그 밖의 구성도 포함된다. 컴퓨터 프로그램 제품은 정보 담체(information carrier) 내에 유형적으로 구현될 수 있다. 컴퓨터 프로그램 제품은, 앞에서 설명한 것과 같은 하나 이상의 방법을 수행하는 명령어를 포함할 수 있다. 정보 담체는 컴퓨터 또는 기계가 판독가능한 매체로서, 메모리(404), 저장 장치(406), 또는 프로세서(402) 내 메모리 등이다.

저속 컨트롤러(412)는 컴퓨팅 장치(400)의 낮은 대역폭에 집중된 동작을 관리하고, 고속 컨트롤러(408)는 대역폭에 집중된 동작을 관리한다. 이러한 기능 할당은 예시에 불과하다. 일 실시예에서, 고속 컨트롤러(408)는 메모리(404), 디스플레이(416)(예를 들어, 그래픽 프로세서 또는 가속기를 통해서 연결), 및 고속 확장 포트(410)(다양한 확장 카드(미도시)가 접속될 수 있음)에 연결된다. 이 실시예에서, 저속 컨트롤러(412)는 저장 장치(406)와 저속 확장 포트(414)에 연결된다. 다양한 통신 포트(예를 들어, USB, 블루투스, 이더넷, 무선 이더넷)를 포함할 수 있는 저속 확장 포트는, 키보드, 포인팅 장치, 스캐너, 또는 네트워킹 장치(스위치 또는 라우터) 등, 하나 이상의 입력/출력 장치에 예컨대 네트워크 어댑터 등을 통해 연결될 수 있다.

도면에서와 같이 컴퓨팅 장치(400)는 많은 다양한 형태로 실시할 수 있다. 예를 들어, 이는 표준 서버(420)로서 또는 이 표준 서버 그룹 내의 다중 시간 방식으로 구현할 수 있다. 이는 또한, 랙 서버 시스템(424)의 일부로서 구현할 수 있다. 또한 랩톱 컴퓨터(422) 등의 개인용 컴퓨터로 구현할 수도 있다. 이와 다르게, 컴퓨팅 장치(400)의 구성요소들은, 장치 450과 같은 모바일 기기의 다른 구성요소들(미도시)과 결합될 수도 있다. 이러한 장치의 각각에는 하나 이상의 컴퓨팅 장치(400, 450)가 포함될 수 있고, 서로 통신하는 다수의 컴퓨팅 장치(400, 450)로 전체 시스템이 구성될 수도 있다.

컴퓨팅 장치 450은, 다른 구성요소들도 있지만 그 중에서도 특히, 프로세서(452), 메모리(464), 디스플레이 등의 입출력 장치(454), 통신 인터페이스(466), 트랜시버(468)를 포함한다. 이 장치(450)는 또한 추가적으로 저장기능을 제공하기 위해, 예를 들면 마이크로 드라이브 또는 기타 장치 등의 저장 장치가 추가로 구비될 수 있다. 각 구성요소(450, 452, 464, 454, 466, 468)는 각종 버스를 사용하여 서로 연결되고, 이들 구성요소들의 일부는 공통의 머더보드 위에 탑재되거나 또는 그 밖의 방식으로 적절하게 설치될 수 있다.

프로세서(452)는 메모리(464)에 저장된 명령어를 포함하여, 컴퓨팅 장치(450) 내의 명령어를 실행할 수 있다. 프로세서는 별개로 분리된 다수의 아날로그 및 디지털 프로세서를 포함하는 칩셋으로 구현할 수 있다. 또한 프로세서는 다양한 아키텍처 중 하나를 사용하여 구현할 수 있다. 예를 들어, 프로세서(410)는 CISC(complex instruction set computer) 프로세서, RISC(reduced instruction set computer), 또는 MISC(minimal instruction set computer) 프로세서일 수 있다. 프로세서는, 예를 들어, 사용자 인터페이스 제어 장치, 이 장치(450)가 실행하는 애플리케이션, 및 이 장치(450)에 의한 무선 통신(450) 등, 이 장치(450)의 타 구성요소와의 조정을 담당할 수 있다.

프로세서(452)는 제어 인터페이스(458)와, 디스플레이(454)에 결합된 디스플레이 인터페이스(456)를 통해 사용자와 통신할 수 있다. 디스플레이(454)는 예를 들어 TFT(박막 트랜지스터) 액정 디스플레이와 OLED(유기 발광 다이오드) 디스플레이 또는 기타 적절한 디스플레이일 수 있다. 디스플레이 인터페이스(456)는 사용자에게 그래픽 및 기타 정보를 제공하기 위해 디스플레이(454)를 구동하기 위한 적절한 회로를 포함할 수 있다. 제어 인터페이스(458)는 사용자로부터 명령을 수신하고 이를 프로세서(452)에 제출하기 위해 변환할 수 있다. 또한 외부 인터페이스(462)는 다른 장치와 이 장치(450)의 근거리 통신이 가능하도록 하기 위해 프로세서(452)와의 통신을 위해 구비된다. 외부 인터페이스(462)는 예를 들어, 일부 실시예에서는 유선통신을 위해, 또는 다른 실시예에서는 무선통신을 위해 제공될 수 있으며, 다수의 인터페이스를 사용할 수도 있다.

메모리(464)는 컴퓨팅 장치(450) 내의 정보를 저장한다. 메모리(464)는 컴퓨터 판독가능 매체(들), 휘발성 메모리 장치(들), 또는 비휘발성 메모리 장치(들) 중의 하나 또는 그 이상으로 구현할 수 있다. 확장 메모리(474)가 또한 제공되어 확장 인터페이스(472)를 통해 이 장치(450)에 연결될 수 있다. 이 확장 인터페이스(472)로는 예를 들어, SIMM(단일 인라인 메모리 모듈) 카드 인터페이스를 사용할 수 있다. 확장 메모리(474)는 이 장치(450)에 대한 별도의 저장 공간 역할을 할 수 있으며, 또는 이 장치(450)에 사용되는 애플리케이션(응용 프로그램)이나 다른 정보들을 저장할 수 있다. 구체적으로 확장 메모리(474)에는, 앞에서 설명한 방법의 절차를 실행하거나 보완하기 위한 명령어가 포함될 수 있고, 보안 정보도 또한 포함될 수 있다. 따라서, 예를 들어, 확장 메모리(474)는 이 장치(450)를 위한 보안 모듈로서 제공될 수 있는 것이며, 이 장치(450)의 안전한 사용을 위한 명령어로 프로그래밍될 수 있다. 또한 보안 프로그램은, 추가 정보(가령, 비해킹 방법으로 SIMM 카드 상에 식별 정보를 설치)와 함께 SIMM 카드를 통해서 제공될 수 있다.

메모리는 예를 들어 플래시 메모리 및/또는 NVRAM 메모리를 포함할 수 있다. 이는 아래에서 설명한다. 일 실시예에서, 컴퓨터 프로그램 제품은 정보 담체 내에 유형적으로 구현된다. 컴퓨터 프로그램 제품에는, 실행시에 상술한 하나 이상의 방법을 수행하는 명령어가 담긴다. 정보 담체는 컴퓨터 또는 기계 판독가능한 매체로서, 예를 들어 트랜시버(468) 또는 외부 인터페이스(462)를 통해 수신할 수 있는, 예컨대, 메모리(464), 확장 메모리(474), 또는 프로세서(452) 내 메모리 등이다.

장치(450)는 통신 인터페이스(466)(필요한 경우 디지털 신호 처리 회로를 포함할 수 있음)를 통해 무선으로 통신할 수 있다. 통신 인터페이스(466)는 GSM 음성 통화, SMS, EMS, 또는 MMS 메시징, CDMA, TDMA, PDC, WCDMA, CDMA2000, 또는 GPRS 등과 같은 다양한 모드 또는 프로토콜에 의한 통신을 행하도록 할 수 있다. 이러한 통신은 예컨대 RF 트랜시버(468)를 통해 이루어질 수 있다. 또한, 블루투스, WiFi, 또는 그 밖의 트랜시버(미도시) 등을 사용하여 단거리 통신이 이루어질 수 있다. 또한 GPS(Global Positioning System) 수신기 모듈(470)은 추가적으로 네비게이션 및 위치 관련 무선 데이터를 상기 장치(450)로 제공할 수 있는데, 이는 장치(450)에서 실행되는 애플리케이션에 의해 적절하게 사용될 수 있다.

장치(450)는, 사용자로부터 음성 정보를 수신하고 이를, 사용가능한 디지털 정보로 변환할 수 있는 오디오 코덱(460)을 이용하여 청각적 통신을 행할 수 있다. 이처럼 오디오 코덱(460)은 스피커(예를 들어 핸드셋 장치(450)에 있는 스피커) 등을 통해 사용자를 위한 가청 사운드를 생성할 수 있다. 이러한 사운드에는 음성 전화 통화시의 사운드가 포함될 수도 있고, 녹음된 사운드(예를 들면, 음성 메시지, 음악 파일 등)가 포함될 수도 있고, 그리고, 장치(450)에서 동작하는 애플리케이션에 의해 생성된 사운드가 포함될 수도 있다.

도면에서와 같이 컴퓨팅 장치(450)는 다양한 형태로 실시할 수 있다. 예를 들어, 셀룰러 전화(480)로서 실시할 수 있다. 또한 스마트폰(482), 개인 디지털 보조장치, 또는 그 밖의 유사한 이동 장치의 일부로서 실시할 수 있다.

다양한 실시예들을, 디지털 전자 회로, 집적회로, 특수 설계 ASIC(주문형 집적회로), 컴퓨터 하드웨어, 펌웨어, 소프트웨어, 및/또는 이들의 조합으로 구현할 수 있다. 이들 다양한 실시예에는, 저장 시스템, 적어도 하나의 입력 장치, 및 적어도 하나의 출력 장치로부터 데이터와 명령어를 수신하고 이들로 데이터와 명령어를 전송하도록 특수 목적으로 또는 범용 목적으로 연결될 수 있는 최소한 하나의 프로그래머블 프로세서를 포함한 프로그래머블 시스템에서 실행 및/또는 해독 가능한 하나 이상의 컴퓨터 프로그램에서 구현되는 실시예가 포함될 수 있다.

이들 컴퓨터 프로그램(또는 프로그램, 소프트웨어, 소프트웨어 애플리케이션, 또는 코드라고도 함)은 프로그래머블 프로세서를 위한 기계 명령어를 포함할 수 있고, 고급 절차형 및/또는 객체지향형 프로그래밍 언어로, 그리고/또는 어셈블리/기계어로 구현할 수 있다. 본 명세서에서 사용한 용어 "기계 판독가능 매체" 및 "컴퓨터 판독가능 매체"는, 기계 명령어 및/또는 데이터를 프로그래머블 프로세서에 제공하기 위해 사용되는 모든 컴퓨터 프로그램 제품, 기구, 및/또는 장치(예컨대, 자기디스크, 광디스크, 메모리, 프로그래머블 로직 디바이스(PLD))를 지칭한다(기계 명령어를 기계 판독가능 신호로서 수신하는 기계 판독가능 매체를 포함함). 용어 "기계 판독가능 신호"는 프로그래머블 프로세서로 기계 명령어 및/또는 데이터를 제공하는 데 사용되는 모든 신호를 지칭한다.

사용자와의 인터랙션을 제공하기 위해, 여기서 설명한 시스템 및 기술은 사용자에게 정보를 표시하는 디스플레이 장치(예컨대, CRT(음극선 관) 또는 LCD(액정 디스플레이) 모니터)와 사용자가 컴퓨터에 입력하기 위한 키보드 및 포인팅 장치(마우스 또는 트랙볼)를 갖는 컴퓨터 상에서 구현될 수 있다. 뿐만 아니라 타 유형의 장치를 사용하여 사용자와의 인터랙션을 제공할 수 있다. 예를 들어, 사용자에게 제공되는 피드백은 모든 형태의 감각 피드백(예를 들어, 시각 피드백, 청각 피드백, 또는 촉각 피드백)일 수 있으며, 사용자로부터의 입력은 음향, 음성, 또는 촉각 입력을 포함한 모든 형태로 받을 수 있다.

여기서 설명한 시스템, 방법, 장치, 및 기술은, 백엔드 구성부(예를 들어 데이터 서버), 미들웨어 구성부(예를 들어 애플리케이션 서버), 프런트엔드 구성부(예를 들어 사용자가 여기서 설명된 시스템과 기술의 실시예와 인터랙션할 수 있는 그래픽 사용자 인터페이스 또는 웹브라우저가 있는 클라이언트 컴퓨터), 또는 상기 하나 이상의 백엔드, 미들웨어, 프런트엔드 구성부의 임의의 조합이 포함되는 컴퓨팅 시스템에서 실현될 수 있다. 시스템의 구성부들은 임의의 형식으로 또는 디지털 데이터 통신을 매개로(예컨대, 통신 네트워크) 상호 연결될 수 있다. 통신 네트워크의 예로는, 근거리 네트워크(LAN), 광역 네트워크(WAN), 피어투피어 네트워크(애드혹 또는 스태틱 요소를 갖는), 그리드 컴퓨팅 인프라스트럭쳐, 인터넷 등이 있다.

컴퓨팅 시스템은 클라이언트 및 서버를 포함할 수 있다. 클라이언트와 서버는 일반적으로 서로 원격지에 떨어져 있으며 보통은 통신 네트워크를 통해 인터랙트한다. 클라이언트와 서버의 관계는, 각각의 컴퓨터에서 실행되고 서로 간에 클라이언트-서버 관계를 갖는 컴퓨터 프로그램에 의해 이루어진다.

위에서 몇몇 실시예에 대해서 자세히 설명했지만 다른 변형도 가능하다. 또한 키워드의 현지화 번역을 제공하는 다른 메커니즘을 이용할 수도 있다. 또한 원하는 결과를 얻기 위하여, 도면에 도시한 논리 흐름이, 도시된 특정 순서, 또는 시간적 순서를 필요로 하는 것은 아니다. 설명한 흐름에, 다른 절차 단계를 추가허가나 생략할 수도 있으며, 설명한 시스템에, 다른 구성요소를 추가하거나 제거할 수도 있다. 따라서 다른 실시예들도 이하의 특허청구범위에 포함된다.

Claims

컴퓨터로 구현되는 방법에 있어서,
제 1 키워드를 연관 키워드들의 하나 이상의 제 1 그룹들로 분류(grouping)하는 단계와;
기계 번역 프로세스를 이용하여, 상기 제1 키워드를 연관 키워드들의 하나 이상의 제 1 그룹들로 분류한 후, 출발 언어(source language)로부터의 제 1 키워드를 목표언어(target language)의 다수의 제 2 키워드들로 번역하는 단계와;
상기 제 1 키워드를 제 2 키워드들로 번역한 후, 상기 제 1 그룹과 그리고 상기 제 2 키워드들 각각으로 번역된 상기 제 1 키워드에 기초하여 상기 제 2 키워드들을 하나 이상의 제 2 키워드들의 그룹들로 분류하는 단계와;
상기 제 2 키워드들의 그룹들에 기초하여, 상기 제 2 키워드들에 대한 상기 하나 이상의 사전 결정된 단어 클러스터들을 식별하는 단계와;
각각 상기 제 2 키워드들의 하나 이상과 임계적 관련성(threshold association)을 적어도 갖는 상기 목표 언어로 된 추가적인 키워드들을 포함하도록 상기 제 2 키워드를 증강(augmenting)하는 단계와, 상기 추가적인 키워드들은 상기 추가적인 키워드들에 기초하여 상기 하나 이상의 제2 키워드들과 적어도 상기 임계적 관련성을 갖는 것으로 결정되고, 상기 하나 이상의 제 2 키워드들은 상기 하나 이상의 사전 결정된 단어 클러스터에 포함되며;
상기 제 2 키워드들을 증강한 후, 컴퓨터 시스템에 의해 상기 제2 키워드들 각각이 상기 목표 언어와 관련된 코퍼스(corpus)에서 출현하는 빈도들을 결정하는 단계와, 상기 코퍼스는 검색 엔진에 의해 이용되는 하나 이상의 코포라(corpora)를 포함하고, 상기 빈도들을 결정하는 것은 적어도 부분적으로, 상기 검색 엔진을 사용하여 상기 제 2 키워드들 각각에 대한 검색을 수행하는 것을 포함하며;
상기 컴퓨터 시스템에 의해, 상기 결정된 출현 빈도들에 기초하여 상기 목표 언어로 사용하기 위해 상기 제 2 키워드들로부터 특정 키워드를 선택하는 단계와;
상기 목표 언어의 특정 키워드를 상기 목표 언어의 광고와 관련시키는 단계와;
상기 목표 언어의 하나 이상의 검색 용어들을 포함하는 검색 질의어를 수신하는 단계와;
상기 컴퓨터 시스템에 의해, 적어도 상기 특정 키워드와 상기 검색 질의어의 하나 이상의 검색 용어들과의 비교에 기초하여 상기 검색 질의어에 대한 검색 결과들과 함께 상기 광고를 제공할지 여부를 결정하는 단계와; 그리고
상기 광고를 제공한다는 결정에 기초하여, 상기 광고를 제공하는 단계를 포함하는 것을 특징으로 하는 컴퓨터에 의해 구현되는 방법.
제 1 항에 있어서,
상기 추가적인 키워드들은 상기 추가적인 키워드들 및 상기 목표 언어의 동의어로서 식별되는 상기 하나 이상의 제 2 키워드에 더 기초하여 상기 하나 이상의 제 2 키워드들과 임계적 관련성을 갖는 것으로 결정되는 것을 특징으로 하는 컴퓨터에 의해 구현되는 방법.
제 1 항에 있어서,
상기 목표 언어로 되어 있으며 상기 광고와 관련된 하나 이상의 랜딩 페이지들로부터 하나 이상의 상기 추가적인 키워드들을 추출하는 단계를 더 포함하는 것을 특징으로 하는 컴퓨터에 의해 구현되는 방법.
제 1 항에 있어서,
상기 코퍼스는 상기 목표 언어와 관련된 검색 질의어들의 검색 로그들을 더 포함하는 것을 특징으로 하는 컴퓨터에 의해 구현되는 방법.
제 4 항에 있어서,
상기 결정된 빈도들은 현재 시간으로부터 임계시간 내에 수신된 검색 질의어들의 검색 로그에 더 기초하는 것을 특징으로 하는 컴퓨터로 구현하는 방법.
제 1 항에 있어서,
상기 코퍼스는 상기 목표 언어와 관련된, 하나 이상의 소셜 네트워크들로부터의 사용자-생성 컨텐트를 더 포함하는 것을 특징으로 하는 컴퓨터에 의해 구현되는 방법.
제 1 항에 있어서,
상기 제 1 키워드를 지리적 영역과 관련된 목표 언어로 번역하라는 요청을 수신하는 단계와; 그리고
다수의 코포라로부터, 상기 코퍼스가 상기 목표 언어 및 상기 지리적 영역과 관련됨에 기초하여 상기 제 2 키워드들의 빈도들을 결정하는데 사용하기 위한 상기 코퍼스를 선택하는 단계를 더 포함하는 것을 특징으로 하는 컴퓨터에 의해 구현되는 방법.
제 1 항에 있어서,
각각의 키워드는 하나 이상의 단어들을 포함하는 것을 특징으로 하는 컴퓨터에 의해 구현되는 방법.
출발 언어로부터의 키워드들을 목표 언어로 번역하기 위한 시스템으로서,
하나 이상의 컴퓨터들과;
출발 언어로부터의 제 1 키워드를 목표 언어의 다수의 제 2 키워드들로 번역하도록 구성된 상기 컴퓨터들의 기계 번역 모듈과;
i) 상기 제 1 키워드를 연관 키워드들의 하나 이상의 제 1 그룹들로 분류(grouping)하고, ii) 상기 제 1 키워드를 제 2 키워드들로 분류한 후, 상기 제 1 그룹과 그리고 상기 제 2 키워드들 각각으로 번역된 상기 제 1 키워드에 기초하여 상기 제 2 키워드들을 하나 이상의 제 2 키워드들의 그룹들로 분류하고, 그리고 iii) 상기 제 2 키워드들의 그룹들에 기초하여, 상기 제 2 키워드들에 대한 상기 하나 이상의 사전 결정된 단어 클러스터들을 식별하도록 구성된 상기 컴퓨터들의 키워드 분류 모듈과;
각각 상기 제 2 키워드들의 하나 이상과 임계적 관련성(threshold association)을 적어도 갖는 상기 목표 언어로 된 추가적인 키워드들을 포함하도록 상기 제 2 키워드를 증강(augmenting)하도록 구성된 키워드 증강 모듈과, 상기 추가적인 키워드들은 상기 추가적인 키워드들에 기초하여 상기 하나 이상의 제2 키워드들과 적어도 상기 임계적 관련성을 갖는 것으로 결정되고, 상기 하나 이상의 제 2 키워드들은 상기 하나 이상의 사전 결정된 단어 클러스터에 포함되며;
상기 제2 키워드들 각각이 상기 목표 언어와 관련된 코퍼스에서 출현하는 빈도들을 결정하도록 구성된 상기 컴퓨터들의 키워드 빈도 모듈과, 상기 코퍼스는 검색 엔진에 의해 이용되는 하나 이상의 코포라를 포함하고, 상기 빈도들은 적어도 부분적으로, 상기 검색 엔진을 사용하여 상기 제 2 키워드들 각각에 대한 검색을 수행함으로써 결정되고;
상기 결정된 출현 빈도에 기초하여 상기 목표 언어로 사용하기 위해 상기 제 2 키워드들로부터 특정 키워드를 선택하도록 구성된 상기 컴퓨터들의 키워드 선택 컴포넌트와; 그리고
컨텐트 컴퓨터 시스템을 포함하여 구성되며,
상기 컨텐트 컴퓨터 시스템은:
상기 목표 언어의 특정 키워드를 상기 목표 언어의 광고와 관련시키고,
상기 목표 언어의 하나 이상의 검색 용어들을 포함하는 검색 질의어를 수신하고;
적어도 상기 특정 키워드와 상기 검색 질의어의 하나 이상의 검색 용어들과의 비교에 기초하여 상기 검색 질의어에 대한 검색 결과와 함께 상기 광고를 제공할지 여부를 결정하고, 그리고
상기 광고를 제공한다는 결정에 기초하여, 상기 광고를 제공하도록 구성된 것을 특징으로 하는 시스템.
명령어들이 수록된 컴퓨터 판독가능 저장 매체가 구비된 장치로서,
상기 명령어들은 컴퓨팅 디바이스에 의한 실행에 응답하여 상기 컴퓨팅 디바이스로 하여금:
제 1 키워드를 연관 키워드들의 하나 이상의 제 1 그룹들로 분류하는 동작과;
기계 번역 프로세스를 이용하여, 상기 제1 키워드를 연관 키워드들의 하나 이상의 제 1 그룹들로 분류한 후, 출발 언어로부터의 제 1 키워드를 목표언어의 다수의 제 2 키워드들로 번역하는 동작과;
상기 제 1 키워드를 제 2 키워드들로 번역한 후, 상기 제 1 그룹과 그리고 상기 제 2 키워드들 각각으로 번역된 상기 제 1 키워드에 기초하여 상기 제 2 키워드들을 하나 이상의 제 2 키워드들의 그룹들로 분류하는 동작과;
상기 제 2 키워드들의 그룹들에 기초하여, 상기 제 2 키워드들에 대한 상기 하나 이상의 사전 결정된 단어 클러스터들을 식별하는 동작과;
각각 상기 제 2 키워드들의 하나 이상과 임계적 관련성(threshold association)을 적어도 갖는 상기 목표 언어로 된 추가적인 키워드들을 포함하도록 상기 제 2 키워드를 증강(augmenting)하는 동작과, 상기 추가적인 키워드들은 상기 추가적인 키워드들에 기초하여 상기 하나 이상의 제2 키워드들과 적어도 상기 임계적 관련성을 갖는 것으로 결정되고, 상기 하나 이상의 제 2 키워드들은 상기 하나 이상의 사전 결정된 단어 클러스터에 포함되며;
상기 제 2 키워드들을 증강한 후, 컴퓨터 시스템에 의해 상기 제2 키워드들 각각이 상기 목표 언어와 관련된 코퍼스(corpus)에서 출현하는 빈도들을 결정하는 동작과, 상기 코퍼스는 검색 엔진에 의해 이용되는 하나 이상의 코포라(corpora)를 포함하고, 상기 빈도들을 결정하는 것은 적어도 부분적으로, 상기 검색 엔진을 사용하여 상기 제 2 키워드들 각각에 대한 검색을 수행하는 것을 포함하며;
상기 결정된 출현 빈도들에 기초하여 상기 목표 언어로 사용하기 위해 상기 제 2 키워드들로부터 특정 키워드를 선택하는 동작과;
상기 목표 언어의 특정 키워드를 상기 목표 언어의 광고와 관련시키는 동작과;
상기 목표 언어의 하나 이상의 검색 용어들을 포함하는 검색 질의어를 수신하는 동작과;
적어도 상기 특정 키워드와 상기 검색 질의어의 하나 이상의 검색 용어들과의 비교에 기초하여 상기 검색 질의어에 대한 검색 결과들과 함께 상기 광고를 제공할지 여부를 결정하는 동작과; 그리고
상기 광고를 제공한다는 결정에 기초하여, 상기 광고를 제공하는 동작을 포함하는 것을 특징으로 하는 장치.
제 10항에 있어서,
상기 목표 언어로 되어 있으며 상기 광고와 관련된 하나 이상의 랜딩 페이지들로부터 하나 이상의 상기 추가적인 키워드들을 추출하는 동작을 더 포함하는 것을 특징으로 하는 장치.
제 10항에 있어서,
상기 제 1 키워드를 지리적 영역과 관련된 목표 언어로 번역하라는 요청을 수신하는 동작과; 그리고
다수의 코포라로부터, 상기 코퍼스가 상기 목표 언어 및 상기 지리적 영역과 관련됨에 기초하여, 상기 제 2 키워드들의 빈도들을 결정하는데 사용하기 위한 상기 코퍼스를 선택하는 동작을 더 포함하는 것을 특징으로 하는 장치.
제 9 항에 있어서,
상기 키워드 증강 모듈은 상기 목표 언어로 되어 있으며, 상기 광고와 관련된 하나 이상의 랜딩 페이지들로부터 하나 이상의 상기 추가적인 키워드를 추출하도록 더 구성된 것을 특징으로 하는 시스템.
제 9 항에 있어서,
상기 제 1 키워드를 지리적 영역과 관련된 목표 언어로 번역하라는 요청을 수신하기 위한 상기 컴퓨터 시스템들의 인터페이스와; 그리고
다수의 지리적 영역과 연관되고 다수의 언어로 되어 있는 코포라의 저장소를 더 포함하여 구성되며,
상기 키워드 빈도 모듈은 상기 코퍼스가 상기 목표 언어 및 상기 지리적 영역과 관련됨에 기초하여, 상기 제 2 키워드의 빈도들을 결정하는데 사용하기 위한 상기 코퍼스를 상기 코포라의 저장소로부터 선택하도록 더 구성된 것을 특징으로 하는 시스템.
제 9 항에 있어서,
상기 추가적인 키워드들은 상기 추가적인 키워드들 및 상기 목표 언어의 동의어로서 식별되는 상기 하나 이상의 제 2 키워드에 더 기초하여 상기 하나 이상의 제 2 키워드들과의 임계적 관련성을 갖는 것으로 결정되는 것을 특징으로 하는 시스템.
제 9 항에 있어서,
상기 코퍼스는 상기 목표 언어와 관련된 검색 질의어들의 검색 로그들을 더 포함하는 것을 특징으로 하는 시스템.
제 16 항에 있어서,
상기 결정된 빈도들은 현재 시간으로부터 임계 시간 내에 수신된 검색 질의어의 검색 로그에 더 기초하는 것을 특징으로 하는 시스템.
제 9 항에 있어서,
상기 코퍼스는 상기 목표 언어와 관련된, 하나 이상의 소셜 네트워크들로부터의 사용자-생성 콘텐츠를 더 포함하는 것을 특징으로 하는 시스템.
제 9 항에 있어서,
각각의 키워드는 하나 이상의 단어들을 포함하는 것을 특징으로 하는 시스템.
제 10 항에 있어서,
상기 추가적인 키워드들은 상기 추가적인 키워드들 및 상기 목표 언어의 동의어로서 식별되는 상기 하나 이상의 제 2 키워드들에 더 기초하여 상기 하나 이상의 제 2 키워드들과의 임계적 관련성을 갖는 것으로 결정되는 것을 특징으로 하는 장치.
제 10 항에 있어서,
상기 코퍼스는 상기 목표 언어와 관련된 검색 질의어들의 검색 로그들을 더 포함하는 것을 특징으로 하는 장치.
제 21 항에 있어서,
상기 결정된 빈도들은 현재시간으로부터 임계시간 내에 수신된 검색 질의어의 검색 로그에 더 기초하는 것을 특징으로 하는 장치.