KR20150119048A - 다중 사용자 다중 언어 통신 시스템 및 방법 - Google Patents

다중 사용자 다중 언어 통신 시스템 및 방법 Download PDF

Info

Publication number
KR20150119048A
KR20150119048A KR1020157024532A KR20157024532A KR20150119048A KR 20150119048 A KR20150119048 A KR 20150119048A KR 1020157024532 A KR1020157024532 A KR 1020157024532A KR 20157024532 A KR20157024532 A KR 20157024532A KR 20150119048 A KR20150119048 A KR 20150119048A
Authority
KR
South Korea
Prior art keywords
message
module
language
chat
translation
Prior art date
Application number
KR1020157024532A
Other languages
English (en)
Inventor
가브리엘 레이던
프랑수아 오르시니
니킬 보짜
쉐일린 카루르
Original Assignee
머신 존, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 머신 존, 인크. filed Critical 머신 존, 인크.
Publication of KR20150119048A publication Critical patent/KR20150119048A/ko

Links

Images

Classifications

    • G06F17/289
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • G06F17/2836
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/06Message adaptation to terminal or network requirements
    • H04L51/063Content adaptation, e.g. replacement of unsuitable content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/10Multimedia information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1827Network arrangements for conference optimisation or adaptation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

여기서 설명되는 다양한 실시예들은, 다중 언어 통신을 가능하게 한다. 일부 실시예의 시스템 및 방법은, 예를들어, 인터넷 기반 채팅, 이메일, 텍스트 기반 모바일 폰 통신, 온라인 포럼에 대한 포스팅, 온라인 소셜 미디어 서비스에 대한 포스팅 등을 포함하는 서로 다른 통신 모드를 통하여, 다중 언어 통신을 가능하게 할 수 있다. 어떤 실시예들은, 텍스트 내의 하나 또는 그 이상의 다음: 전문적/분야에 한정된 용어, 약어, 두음자어, 고유명사, 보통명사, 지소사, 구어체 단어 또는 구절 및 비속어 단어 또는 구절을, 처리/수용하면서, 2 또는 그 이상의 언어 사이의 텍스트를 번역하는 통신 시스템 및 방법을 실행할 수 있다.

Description

다중 사용자 다중 언어 통신 시스템 및 방법 {SYSTEMS AND METHODS FOR MULTI-USER MULTI-LINGUAL COMMUNICATIONS}
본 발명은 일반적으로 통신과 관련되는 것으로, 보다 구체적으로, 복수의 사용자와 복수의 언어를 포함하는 전세계적인 통신에 관한 것이다.
기계에 의한 언어 번역(이하, “기계 번역”이라 함)이 등장하기 전에는, 두 언어 사이의 번역은, 양쪽 언어를 모두 교육받은 사람의 개입(intervention)이나 해석(interpretation)에 의하여만 가능하였다. 반면에, 전형적인 기계 번역기는, 문맥(context)과 문법(grammar)에 대한 통계적(statistical)/확률적(stochastic) 해석에 기반하여 동작하며, 주로 사람의 개입/해석은 필요하지 않았다.
일반적인 기계 해석은, 특히 번역될 텍스트(text)가 최소한의 문맥을 가지는 경우에, 주로 오류가 발생이 쉽다. 최소한의 문맥을 가지는 텍스트는 간단한 문장 구조를 사용하는 대화에서 주로 발견된다. 추가적으로, 기계 번역은, 대화 텍스트에서도 일반적으로 발견되는, 약어(abbreviations), 두문자어(acronyms), 지소자(diminutives), 구어체 단어/구절(colloquial word/phrases), 고유명사(proper nouns) 및 보통명사(common noun)에 대하여, 주로 문제점을 가진다.
여기서 설명되는 다양한 실시예들은, 2 또는 그 이상의 클라이언트 시스템의 사용자일 수 있는, 복수의 사용자들 사이의 다중 언어 통신과 관련된 시스템 및 방법을 제공한다. 실시예들에 의하여 가능하게 되는 통신의 모드들은, 인터넷 기반의 채팅(예를들어, 애플®의 iMessage, Windows® Live Messenger 등), 이메일(예를들어, 임베디드 포럼 메시징, Yahoo® 메일, RFC 5322 등), 텍스트 기반의 모바일 폰 통신(예를들어, SMS 메시지나 MMS 메시지), 온라인 포럼에 대한 포스팅(예를들어, 웹 기반의 취미 포럼에 대한 포스팅) 및 온라인 소셜미디어서비스(online social media service)에 대한 포스팅(예를들어, Twitter®, Facebook® 등)을 포함할 수 있다. 예를들어, 시스템 및 방법들은 다중 언어, 다중 사용자 채팅 시스템을 실행할 수 있다.
일부 실시예에서, 제공되는 상기 방법은, 제1 언어와 제2 언어를 식별하는 단계; 제1 채팅 클라이언트 시스템에서 상기 제1 언어로 통신(communicate)하는 제1 인물로부터, 상기 제1 언어로 된 초기메시지(initial message)를 수신하는 단계; 데이터 저장부로 상기 제2 언어로 된 제1 대응 메시지를 질의하는 것으로, 상기 제1 대응 메시지는 상기 제1 언어의 상기 초기 메시지에 기반하는 것인 단계를 포함할 수 있다. 상기 데이터 저장부가 상기 제1 대응 메시지를 포함하면, 상기 방법은 제2 채팅 클라이언트 시스템에서 상기 제2 언어로 통신하는 제2 인물에 대한, 상기 대응 메시지의 전송을 지원(assist)할 수 있다. 상기 실시예에 의하면, 상기 초기 메시지는 텍스트, 이모티콘, ASCII 기반의 기술, 또는 네트워크를 통하여 전송된, 사람이 읽을 수 있는 메시지에 적용가능(suitable) 하거나 관습적인(customary) 다른 콘텐츠를 포함할 수 있다. 추가적으로, 상기 초기 메시지는 채팅 클라이언트 시스템 사이에서 통신되는 더 큰 메시지(예를들어, 상기 초기 메시지는, 복수-문장 메시지에 포함된 하나의 문장)의 일부분일 수 있다.
상기 데이터 저장부가 상기 제1 대응 메시지를 포함하지 않으면, 상기 방법은, 상기 초기 메시지의 적어도 일 부분을, 상기 제1 언어로 된 변환된 메시지로 변환하기 위한 시도를 수행하기 위하여, 변환엔진(transformation engine)을 활용할 수 있다. 상기 변환된 메시지를 이용하여, 상기 방법은, 상기 변환된 메시지에 기반하는, 상기 제2 언어로 된 제2 대응 메시지를, 상기 데이터 저장부로 질의할 수 있다.
특정 실시예에서, 상기 시스템 또는 방법은, 상기 변환된 메시지에 기반하는 제2 대응 메시지가 질의되는, 상기 데이터 저장부에 질의하기 전에, 일련의 변환동작을 사용하여 상기 초기 메시지를 변환하려고 시도할 수 있다. 그렇지 않으면, 일부 실시예에서는, 상기 시스템 또는 방법이 상기 변환 및 질의를 반복적으로 수행할 수 있으며, 여기서, 상기 초기메시지는, 가능한 변환 동작의 부분집합(subset)을 이용하여 변환되고, 상기 데이터저장부는 상기 결과로 초래된 변환된 메시지에 기반하는 제2 대응메시지에 대하여 질의를 받으며, 만약 제2 대응 메시지가 식별되지 않으면, 변환 및 질의의 다른 반복이 수행된다(예를들어, 상기 결과로 초래된 변환된 메시지는, 다른 가능한 변환 동작의 부분집합을 이용하여 더 변환될 수 있으며, 상기 데이터 저장부는, 상기 결과로 초래된 변환된 메시지에 기반하는, 제2 대응 메시지를 질의 받을 수 있다). 이러한 일부 실시예에서, 각각의 반복마다 적용되는 변환 동작의 부분집합은, 상기 초기 메시지에 적용되거나, 또는 최근에 결과로 초래된 변환된 메시지에 적용될 수 있다.
결국, 상기 방법은, 상기 초기 메시지 또는 상기 변환된 메시지를, 제2 언어로 된, 대응 메시지로 번역하는 것을 지원할 수 있다. 일부 실시예에서는, 상기 초기 메시지에 대한 상기 제1 대응 메시지가 데이터 저장부에 있지 않고, 상기 변환 엔진(transformation engine)이 상기 초기 메시지의 적어도 일 부분을 변환하지 않으면, 상기 초기 메시지는 대응 메시지로 번역될 수 있다. 추가적으로, 다양한 실시예에서, 상기 초기 메시지에 대한 상기 제1 대응 메시지가 상기 데이터 저장부에 없고; 상기 변환 엔진이, 상기 초기 메시지의 적어도 일부분의 변환을 포함하는, 변환된 메시지를 야기하고; 상기 데이터 저장부가 상기 변환된 메시지에 대한 제2 대응 메시지를 포함하지 않는 경우에, 상기 변환된 메시지는 상기 대응 메시지로 번역될 수 있다.
상기 실시예에 의하면, 상기 초기 메시지의 일부를 변환하는 것은, 상기 초기 메시지에 포함된 채팅용어(chatspeak) 단어 또는 구절(예를들어, 'lol', 'gr8t')을 식별하고, 상기 채팅용어 단어 또는 구절을 채팅용어가 아닌 단어 또는 구절로 치환하며, 상기 초기 메시지의 일 부분에 대한 맞춤법 검사를 수행하거나, 상기 초기 메시지의 일부분의 약어(abbreviation)를 식별하고 상기 약어를 상기 약어에 대응하는(예를들어, 나타내는) 단어 또는 구절로 치환하는 것을 포함할 수 있다(예를들어, 'CA'를 'California' 또는 'brb'를 'be right back').
추가적으로, 상기 초기 메시지의 일 부분을 변환하는 것은, 상기 초기 메시지의 일 부분의 두음자어(acronym)을 식별하고, 상기 두음자어를 상기 두음자어(예를들어, 'USA')에 대응하는(예를들어, 나타내는) 단어 또는 구절로 치환하거나, 상기 초기 메시지의 일 부분의 구어체(colloquial)를 식별하고 상기 구어체를 상기 구어체에 대응하는 단어 또는 구절로 치환하는 것을 포함할 수 있다. 나아가, 상기 초기 메시지의 일 부분을 변환하는 것은, 상기 초기 메시지의 일 부분의 비속어(profane) 단어 또는 구절을 식별하고, 상기 비속어 단어 또는 구절을 비속어가 아닌 단어 또는 구절로 치환하거나(예를들어, 상기 비속어 단어 또는 구절이 나타내는 것으로), 상기 비속어 단어 또는 구절을 상기 초기 메시지에서 삭제하는 것을 포함할 수 있다.
일부 실시예에 의하면, 상기 초기 메시지의 일 부분을 변환하는 것은, 상기 초기 메시지의 번역하지 않을 부분에 표시하는 것을 포함한다. 예를들어, 상기 초기 메시지의 특정 영역에, 고유명사(proper noun), 보통명사(common noun), 지소사(diminutive), 약어(abbreviation) 또는 두음자어(acronym)가 포함되면, 상기 방법은 상기 특정 영역에, 이후의 동작에서 번역되지 않음을 표시할 수 있다.
일 실시예에서는, 여기서 설명되는 다양한 동작들을 수행하도록 구현된 다양한 구성들을 포함하는 실시예를 제공한다. 유사하게, 컴퓨터 프로그램 제품을 제공하는 일 실시예들은, 컴퓨터 시스템이 여기서 기술된 다양한 동작들을 수행할 수 있도록 구현된 컴퓨터 명령어 코드를 포함할 수 있다.
다양한 실시예들의 다른 특징(features)과 양상(aspects)들은, 실시예들의 특징을 예시적으로 나타낸 첨부된 도면과 연계된 다음의 상세한 설명에 의하여 명백해질 것이다.
다양한 실시예들은 다음의 도면과 함께 상세히 설명된다. 도면들은 오직 예시적으로 나타내기 위한 목적으로서, 어떤 실시예들을 묘사히기 위한 것은 아니다. 도면들은 실시예들의 폭(breadth), 범위(scope) 또는 적용가능성(applicability)을 제한하는 것으로 고려되어서는 아니 된다.
도1은 다양한 실시예에 따르는 다중 언어 통신 시스템을 활용하는 예시적인 환경을 나타내는 블록도이다.
도2는 다양한 실시예에 따르는 예시적인 통신 변환 및 번역 시스템을 나타내는 블록도이다.
도3은 다양한 실시예에 따르는 예시적인 변환 모듈을 나타내는 블록도이다.
도4는 다양한 실시예에 따르는 예시적인 채팅 클라이언트 시스템을 나타내는 블록도이다.
도5는 다양한 실시예에 따르는 다중 언어 통신의 예시적인 방법을 나타내는 순서도이다.
도6은 다양한 실시예에 따른 통신을 변환하는 예시적인 방법을 나타내는 순서도이다.
도7은 다양한 실시예에 따르는, 채팅 클라이언트 시스템 사이의 예시적인 다중 언어 채팅 세션을 나타내는 도면이다.
도8은 다양한 실시예에 따르는 예시적인 다중 언어 통신 방법의 동작을 나타내는 순서도이다.
도9는 다양한 실시예에 따르는 예시적인 다중 언어 통신 방법의 동작을 나타내는 순서도이다.
도10은 다양한 실시예에 따르는 예시적인 다중 언어 통신 방법의 동작을 나타내는 순서도이다.
도11은 다양한 실시예에 따르는 예시적인 다중 언어 통신 방법의 동작을 나타내는 순서도이다.
도12는 다양한 실시예의 실행에 활용될 수 있는 예시적인 디지털 장치를 나타내는 블록도이다.
여기서 기술되는 다양한 실시예들은, 다중 언어 통신의 구현에 관한 것이다. 일부 실시예에 의한 시스템 및 방법은, 예를들어, 인터넷 기반의 채팅(예를들어, 애플®의 iMessage, Windows® Live Messenger 등), 이메일(예를들어, 임베디드 포럼 메시징, Yahoo® 메일, RFC 5322 등), 텍스트 기반의 모바일 폰 통신(예를들어, SMS 메시지나 MMS 메시지), 온라인 포럼에 대한 포스팅(예를들어, 웹 기반의 취미 포럼에 대한 포스팅), 온라인 소셜미디어서비스(online social media service)에 대한 포스팅(예를들어, Twitter®, Facebook® 등) 등을 포함하는 서로 다른 통신 모드들을 통하여, 다중 언어 통신을 가능하게 할 수 있다. 특정 실시예들은, 과거에 일어난 통신 또는 대화의 트랜스크립트(transcripts)를 번역하는데 사용될 수 있다(예를들어, 증언 녹취록(deposition transcripts)이나 채팅 히스토리(chat history)). 다양한 실시예들은 텍스트 내의 하나 또는 그 이상의 다음: 전문적/분야에 한정된 용어(예를들어, 채팅용어(chatspeak)), 약어(abbreiviations), 두음자어(acronyms), 고유명사(proper noun), 보통명사(common noun), 지소사(diminutives), 구어체(colloquial) 단어 또는 구절, 및 비속어(profane) 단어 또는 구절을, 다루거나/수용하면서, 2개 또는 그 이상의 언어(예를들어, 발화된(spoken)) 사이의 텍스트를 번역하는 시스템이나 방법을 구현할 수 있다. 예를들어, 여기서 설명되는 일부 시스템 및 방법은, 서로 다른 외국의 언어로 채팅하고자 하는 사용자들을 가질 수 있는, 대규모 멀티플레이어 온라인(MMO, Massive-Multiplayer Online) 게임과 같은, 채팅 시스템을 연결하는데 활용될 수 있다. 특정 실시예들을 통하여, 2 이상의 사용자들 사이의 채팅 대화(chat dialogue)는, 투명하게(transparently) 번역되고, 각각의 사용자에게, 그들의 각각의 모국어(native language) 또는 선택된 언어로 제공될 수 있다. 추가적으로, 다중 계층(multi-tiered)/다중 모듈(multi-module) 변환 프로세스의 사용을 통하여, 특정 실시예에서는, 기존의 번역 시스템 단독으로 가능한 것에 비하여, 2 이상의 사용자들 사이의 통신에 대한 빠른 번역을 가능하게 할 수 있다(예를들어, 수 마이크로세컨드(microseconds) 사이의 번역).
일부 실시예에 의하면, 시스템 또는 방법은, 영어(English)와 같은 제1 언어의 채팅용어(chatspeak)로부터, 불어(French)와 같은 제2 언어의 채팅용어로의 번역을 수행할 수 있다. 다른 예에서는, 시스템 또는 방법은, 제2 언어(예를들어, 불어)로의 번역을 시도하기 전에, 제1 언어(예를들어, 영어)의 채팅용어(chatspeak)로부터 제1 언어(예를들어, 영어)의 공식적인 용어(formal speak)로의 변환을 수행할 수 있다. 어떤 실시예에서는, 인간 운영자에 의하여 수동으로 입력된 번역 또는 번역 시스템에 의하여 이전에 수행된 것에 기반하는 번역(예를들어, 실시예에 따라 수행된 역사적인 번역(historical translations))이 저장되는 데이터 저장부(예를들어, 번역 캐시(cache))로 먼저 질의하여, 이러한 텍스트 번역을 달성할 수 있다. 실시예에서는, 정확한 텍스트 번역에 적합하도록, 텍스트의 하나 또는 그 이상의 부분(예를들어, 텍스트에 포함된 하나 또는 그 이상의 다음에 대한 처리(process): 채팅용어, 두음자어, 약어, 고유명사, 보통명사, 구어체 및 비속어)에 대한 변환을 시도할 수 있다. 예를들어, 특정 실시예에서는, 다른 언어들 사이에서의 (현재 또는 과거의) 관용적인(idiomatic) 언어 사용을 처리하기 위하여, 주어진 텍스트를 변환할 수 있다. 실시예들은, 텍스트의 일 부분에 대한 변환 후, 상기 데이터 저장부로 질의를 재시도할 수 있다. 이러한 번역 검색 재시도(translate lookup attempt)가 실패하면, 실시예에서는 상기 (이미 변환된) 텍스트를 기계 번역 서비스(예를들어, 제3자, Google®translate과 같은 클라우드 기반의 번역 시스템)를 이용하여 번역하는 것을 시도할 수 있다.
실시예는, 결과적으로 생성되는 텍스트의 번역을 보다 정제하기 위하여, 공식적인 텍스트(formal text)의 번역된 부분을, 새로운 언어의 채팅용어로 변환(예를들어, 불어의 공식적인 용어(formal speak)를 불어의 채팅용어(chatspeak)로 변환)하는 것을, 시도할 수 있다. 따라서, 특정 실시예는, 제1 언어(예를들어, 영어)의 채팅용어와 제2 언어(예를들어, 러시아어, 불어, 스페인어, 중국어, 힌두어 등)의 채팅용어 사이의 채팅 번역을 가능하게 한다.
일부 실시예들은, 기계 번역을 사용할 필요를 줄이거나 방지하는 것을 도울 수 있으며(따라서, 시간, 비용 및 기계 번역과 관련된 다른 간접비용을 줄일 수 있음), 최소한의 문맥 또는 짧은 문장 구조를 가지는 텍스트의 정확한 번역을 가능하게 할 수 있다. 상기 기계번역은 제3자 서비스 또는 보안 네트워크 연결(예를들어, Secure-Socket Layer(SSL) 연결)에 의하여 구현되는 것으로, 특정 실시예에 의하여 피할 수 있는 비용 또는 간접비용은 큰 의미가 있을 수 있다.
여기서 이해되는 바와 같이, “변환(transformation)”은 제1 텍스트 세그먼트(segment)를 제1 언어로 조작(manipulate)하여, 제1 언어의 제2 텍스트 세그먼트를 형성하는 것을 의미한다. 결과로 도출된 제2 텍스트 세그먼트도, 여기서 “변환된 텍스트(transformed text)”로 나타낼 수 있다. “번역(translation)”은 제1 언어의 텍스트 세그먼트를 대응하는 제2 언어의 텍스트 세그먼트로 전환(convert)하는 것을 의미하는 것으로 이해될 수 있다.
또한, 여기서 이해되는 바와 같이, “변환된 번역(transformed translation)”은, 여기서 설명된 실시예에 따라, 이미 변환된 텍스트 세그먼트의 번역(제1 언어에서 제2 언어로)을 의미한다(예를들어, 제1 언어의 채팅용어 텍스트로부터, 제1 언어의 공식적인 텍스트로의 변환). “변환되지 않은 번역(untransformed translation)”은, 여기서 설명된 실시예에 따라, 상기 텍스트 세그먼트가 변환되기 전에, 텍스트 세그먼트의 번역(제1 언어에서 제2 언어)을 의미하는 것으로 이해될 수 있다.
다양한 실시예들은, 특정한 번역 어플리케이션에 잘 맞는 특정한 전략과 함께, 상이한 변환/번역 전략들을 구현할 수 있다. 예를들어, 특정한 채팅 시스템 어플리케이션에 있어서, 구현된 변환 전략은, 다음의 변환 관련 모듈들의 집합: 채팅용어 모듈, 두문자어 모듈, 고유명사 모듈, 보통명사모듈, 구어체 모듈, 맞춤법 검사 모듈, 약어 모듈 및 비속어 모듈을, 나열된 순서에 따라, 적용하는 단계를 포함할 수 있다. 일반적으로, 상기 적용된 변환/번역 전략은, 어떠한 변환 동작(transform operation)이 수행되는지, 전체 번역 프로세스에서 언제 상기 변환 동작이 수행되는지(예를들어, 기계번역 이전 또는 이후에 수행되는 변환), 또는 어떠한 순서로 상기 변환 동작들이 수행되는지(예를들어, 변환동작의 우선권 또는 우선순위)를 결정한다. 상기 변환/번역 전략은, 또한 상기 데이터 저장부 내에 어떠한 번역을 미리 채워둘 것인지(번역은, 전체 프로세스의 속도를 높이기 위하여 번역 “캐시”에 저장될 수 있다), 전체 번역 프로세스에서 언제 번역 캐시를 활용할 것인지를 결정할 수 있다. 특정한 실시예에서, 상기 적용된 변환/번역 전략은, 실시예들이 사용되는 환경의 조건에 기반하여 동적으로 결정될 수 있다. 예를들어, 채팅 시스템이 평소보다 더 많은 사용자의 부하를 경험하면, 상기 변환/번역 전략은 상기 채팅 시스템에 처리 부담을 줄이도록 전환할 수 있다(예를들어, 데이터 저장부 보다 기계번역에 더 의지).
도1은 다양한 실시예에 따라 다중 언어 시스템을 활용하는 예시적인 환경(100)을 나타내는 블록도이다. 도1에 도시한 바와 같이, 예시적인 환경(100)은 클라이언트(102-1 내지 102-N, 이하 통칭하여 “클라이언트들 102” 또는 클라이언트 102”라 함), 채팅서버(108) 및 번역서버(110)를 포함하며, 각각은 컴퓨터 네트워크(106)을 통하여 서로 통신가능하게 결합될 수 있다. 일부 실시예에 의하면, 상기 컴퓨터 네트워크(106)는, 인터넷, WiFi 네트워크, WiMax 네트워크, 개인 네트워크, 공용네트워크 등, 하나 또는 그 이상의 로컬 또는 광대역 통신 네트워크를 이용하여 실행 또는 구현될 수 있다. 실시예에 따라서는, 컴퓨터 네트워크(106)와의 일부 또는 전체 통신연결은, 예시적 환경(100) 내에 도시된 다양한 구성원 사이에서 교환되는 정보들을 지키기 위하여, 암호화(예를들어, Secure Sockets Layer(SSL))를 활용할 수 있다.
각각의 클라이언트(102), 채팅 서버(108) 및 번역 서버(110)는 하나 또는 그 이상의 디지털 장치를 이용하여 구현될 수 있으며, 여기서 디지털 장치는 이후 도12와 관련하여 논의될 디지털 장치와 유사할 수 있다. 예를들어, 클라이언트(102-1)는, 사용자 입력을 수신할 수 있는 어떠한 형태의 컴퓨팅 장치(예를들어, 사용자의 상호작용(interaction)을 위해 구성된)도 될 수 있으며, 하나 또는 그 이상의 다른 클라이언트들(예를들어, 클라이언트 102-2부터 102-N 중 어느 것)과의 통신을 구현할 수 있는 클라이언트 사용자 인터페이스를 제공할 수 있으며, 컴퓨터 네트워크(106)를 통하여 채팅 서버(108)와 통신을 수행할 수 있다. 이러한 컴퓨팅 장치는 모바일 폰(mobile phone), 태블릿 컴퓨팅 장치(tablet computing device), 랩탑(laptop), 데스크탑(desktop) 컴퓨터, PDA(Personal Digital Assistant), 휴대용 게임장치(portable gaming unit), 연결된 게임 장치(wired gaming unit), 신 클라이언트(thin client), 셋탑박스(set-top box), 휴대용 멀티미디어 플레이어(Portable multi-media player) 또는 당업자에게 알려진, 어떠한 다른 형태의 네트워크에 접속가능한 사용자 장치를 포함할 수 있다. 나아가, 하나 또는 그 이상의 채팅 서버(108) 및 번역 서버(110)는, 하나 또는 그 이상의 클라우드 기반의 서비스(예를들어, System-as-a-Service(SaaS), Platform-as-a-Service(PaaS) 또는 Infrastructure-as-a-Service(IaaS)) 상에서 동작하거나, 이를 이용하여 구현되는, 하나 또는 그 이상의 서버를 포함할 수 있다.
클라이언트(102)들은, 클라이언트(102)들 사이의 채팅 세션을, 제공하거나 달리 가능하게 하는 채팅서버(108)와, 통신가능하게 연결하도록 구성될 수 있다. 각각의 클라이언트들(102-1 내지 102-N)은, 각각의 클라이언트(102)의 사용자가, 상기 채팅 서버(108)를 통하여 채팅 세션에 접근할 수 있도록 하는, 채팅 클라이언트 시스템(104-1 내지 104-N)을 포함할 수 있다. 추가적으로, 실시예에 의하면, 각각의 채팅 클라이언트 시스템(104-1 내지 104-N, 이하 통칭하여 “채팅 클라이언트 시스템 104”라 함)들은, 독립형(standalone) 채팅 어플리케이션, 비 채팅 어플리케이션(예를들어, video game) 내에 내장되는 채팅 특성(chat feature), 또는 웹 브라우저를 통하여 클라이언트에서 접근가능한 채팅 서비스를 통하여 실행될 수 있다. 일부 실시예들에서, 채팅 클라이언트 시스템(104)이 서로에 대하여 이기종(heterogeneous)이 아닐 수 있고, 아직 그들 사이의 채팅 세션을 성립시키는 것이 가능하다는 것을, 당업자들은 인정할 수 있다. 상기 채팅 클라이언트 시스템(104)은, 사용자(예를들어, 사용자 설정 또는 선호도)에 의하여 선택된 언어(그리고 대응하는 문자세트)로, 그들 각각의 사용자로부터 채팅 입력(예를들어, 채팅 메시지)을 수신할 수 있으며, 다른 사용자(예를들어, 다른 채팅 클라이언트 시스템의 다른 사용자)에게 중계될, 채팅 입력을 채팅서버(108)로 전송할 수 있다. 상기 채팅 클라이언트 시스템(104)은, 또한 채팅 서버(108)로부터(예를들어, 다른 채팅 클라이언트 시스템의 다른 사용자로부터) 채팅 출력(예를들어, 채팅 세션 대화)을 수신할 수 있으며, 수신된 채팅 출력을, 사용자(예를들어, 사용자 설정이나 선호도)에 의하여 선택된 언어(그리고 대응하는 문자세트)로 디스플레이할 수 있다.
일부 실시예의 사용에 의하면, 상기 채팅 대화의 번역은, 상기 채팅 클라이언트 시스템(104) 사이를 통과하면서, 사용자들에게 명백(transparent)해질 수 있다. 따라서, 일부 실시예에 의하면, 주어진 채팅 클라이언트 시스템(104)에서 제공된 모든 채팅 대화는, 동일한 채팅 대화에 기여하는 다른 채팅 클라이언트 시스템(104)에서 사용자에 의하여 어떠한 언어가 있는지에 무관하게, 상기 주어진 채팅 클라이언트 시스템(104)의 사용자의 모국어(또는 선택된)일 수 있다. 예를들어, 채팅 클라이언트 시스템(104-1)의 사용자와, 채팅 클라이언트 시스템(104-2)의 사용자가 동일한 채팅 대화를 형성하면(즉, 동일한 채팅 세션에 포함되면), 상기 채팅 클라이언트 시스템(104-1)의 사용자는, 상기 채팅 클라이언트 시스템(104-2)의 사용자가 러시아어로 채팅 대화를 입력하고 수신하는 것을 선택하는 동안, 영어로 채팅 대화를 입력하고 수신하는 것을 선택할 수 있다. 비록 채팅 클라이언트 시스템(104-1, 104-2)의 사용자는 동일한 채팅 내용(chat content)을 볼 수 있지만, 상기 채팅 대화는 그들 각각이 선택한 언어로 표시될 수 있다.
도시한 바와 같이, 채팅 서버(108)는, 채팅 클라이언트 시스템(104) 사이의 채팅 세션을 형성 및/또는 실행하도록 구성하는 채팅 호스트 시스템(112)과, 여기서 기술되는 다양한 시스템 및 방법들에 따르는 변환 및/또는 번역 동작을 수행하도록 구성되는 통신 변환 및 번역(CTT: communication Transformation and Translation) 시스템(114)을 포함할 수 있다. 일부 실시예에서, 채팅 클라이언트 시스템(104)은 상기 채팅 호스트 시스템(112)을 통하여 서로 간의 채팅 세션을 형성할 수 있으며, 상기 채팅 호스트 시스템(104)는, 채팅 클라이언트 시스템(140)들 사이의 채팅 대화의 투명한 번역을 촉진하는 CTT 시스템(114)의 특징을 활용할 수 있다. 일 실시예에서, 당업자는, 채팅 호스트 시스템(112) 및 CTT 시스템(114)이 별도의 서버들의 일 부분일 수 있으며, 상기 채팅 호스트 시스템(112)을 운영하는 구성원(entity)은 상기 CTT 시스템(114)을 운영하는 구성원과 상이할 수 있음을, 인정할 수 있다. 예를들어, 상기 채팅 호스트 시스템(112)은, CTT 시스템(114)의 서비스를 활용하는 제3자의 채팅 호스트 시스템일 수 있다.
또한, 도시한 바와 같이, 번역 서버(110)는, 기계 텍스트 번역에 대한 요청을 수신하고, 서비스하도록 구성된 번역 모듈(116)을 포함할 수 있다. 일부 실시예에 의하면, 상기 CTT 시스템(114)는, 텍스트의 기계 번역을 수행하는 번역 모듈(116)의 동작/서비스를 활용할 수 있다. 상기 CTT 시스템(114)은, 상기 번역 모듈(116)에 의하여 제공되는 서비스에 대한 접근을 획득하기 위하여, 하나 또는 그 이상의 번역 API(Application Programming Interfaces)를 이용할 수 있다. 실시예에 따라서는, 상기 번역 모듈(116)과 그것이 위치하는 서버(110)는, Google®과 같은, 유료 또는 무료의 기계번역 서비스를 제공하는, 제3자에 의하여 동작할 수 있다. 비록 번역 모듈(116)이 CTT 시스템(114)와는 별도의 서버 상에서 동작하는 구성으로 보이지만, 당업자는, 일부 실시예에서, 상기 번역 모듈(116)이 CTT 시스템(114)과 동일한 서버 상에서 동작하거나, 및/또는 상기 CTT 시스템(114)의 구성요소에 집적될 수 있음을 인정할 수 있다.
도2는 다양한 실시예에 따르는 예시적인 통신 변환 및 번역 시스템(114)을 나타내는 블록도이다. 도시한 바와 같이, 상기 CTT 시스템(114)는 통신 변환 및 번역(CTT) 제어 모듈(202), 통신 변환 및 번역(CTT) 통신 모듈(204), 언어 모듈(206), 변환모듈(208), 번역 데이터 저장부(210) 및 번역 어플리케이션 API(Application Programming Interface) 모듈(212)을 포함할 수 있다. 상기 CTT 제어 모듈(202)은, 여기서 설명되는 시스템 및 방법에 따라, CTT시스템(114)이 변환 또는 번역을 수행하도록, 상기 CTT 시스템(114) 내의 다양한 동작들의 수행을 제어 및/또는 지휘하도록 구성될 수 있다. 일부 실시예에서는, 상기 CTT 제어 모듈(202)이, 상기 CTT 통신 모듈(204), 상기 언어모듈(206), 상기 변환 모듈(208), 상기 번역 데이터 저장부(210) 및 번역 API 모듈(212)과 같은, 상기 CTT 시스템(114)의 다른 구성요소의 동작을 제어할 수 있다.
상기 CTT 통신 모듈(204)은, CTT 시스템(114)과, 채팅 서버(108) 및 /또는 번역 서버(110)와 같은, CTT 시스템(114)에 대하여 외부인 시스템 및 구성요소 사이의 통신을 실행하도록 구성될 수 있다. 따라서, CTT 통신 모듈(204)을 통하여, 상기 CTT 시스템(114)는, CTT 시스템(114)에 의하여 변환되거나 번역될 채팅 대화(적어도 하나 또는 그 이상의 채팅 메시지를 포함하는)를 수신할 수 있으며, CTT 시스템(114)으로부터 결과로 도출되는 번역된 채팅 대화를 출력할 수 있다.
상기 언어 모듈(206)은, CTT 시스템(114)에 의하여 수신된 채팅 대화와 관련하여 사용된, 하나 또는 그 이상의 언어를 식별하도록 구성될 수 있다. 일부 실시예에서는, 상기 언어 모듈(206)이 수신한 채팅 대화의 내용물(content)에 대한 분석을 통하여 상기 언어를 식별할 수 있으며, 및/또는 수신한 채팅 대화에 참여한 상기 각각의 채팅 클라이언트 시스템(예를들어, 채팅 클라이언트 시스템 104)으로부터, 언어 선호도/설정 정보를 획득할 수 있다.
상기 변환 모듈(208)은, 여기서 설명되는 시스템 및 방법에 따라, CTT 시스템(114)으로부터 수신한, 채팅 대화(하나 또는 그 이상의 채팅 메시지를 포함하는)에 대한 변환 동작을 수행하도록 구성될 수 있다. 일부 실시예에 의하면, 상기 변환 모듈(208)에 의하여 수행되는 상기 변환 동작은, 채팅용어, 두음자어, 약어, 고유명사, 보통명사, 구어체 및 비속어에 관계되는 것은, 제한없이 포함할 수 있다. 상기 변환 모듈(208)의 추가적인 세부사항은 도3에서 논의된다.
CTT 시스템(114)이, 여기서 설명되는 일부 시스템 및 방법에 따라, 변환된 번역(transformed translation)과 변환되지 않은 번역(untransformed translation)을 수행하면, 번역 데이터 저장부(210)는, 저장하고 이후 이전에 번역된 텍스트를 CTT 시스템(114)에 제공하도록 구성될 수 있다. 여기서 설명한 바와 같이, 상기 번역 데이터 저장부(210)는, 상기 CTT 시스템(114)에 의하여 이전에 수행된 번역의 캐시로서 동작하거나, 및/또는 인간 운영자에 의하여 수동으로 입력되어 저장(예를들어, 번역 훈련 시스템의 방법으로)되는 번역을 저장할 수 있다. 일부 실시예에서, 상기 번역 데이터 저장부(210)는, 특정 채팅 문맥에 대하여, 상기 CTT 시스템(114)의 동작 속도를 높일 수 있는, 번역들로 채워질 수 있다. 예를들어, CTT 시스템(114)은, MMO 게임과 관련되는 채팅 시스템과 연결되어 활용될 수 있으며, 상기 번역 데이터 저장부(210)는, 특히, MMO 게임과 관련된 (변환된 및 변환되지 않은)번역으로 채워질 수 있다(예를들어, CTT 시스템(114)의 동작에 의하여). 특정한 실시예에서, 변환 모듈(208)에 의하여 사용되는, 텍스트를 변환하는 상기 다중 계층(multi-tiered)/다중 모듈(multi-module) 접근법은, 실제로는 매우 복잡하지만, 특히, MMO 게임의 채팅 텍스트의 처리에 매우 적합하다.
실시예에 따르면, 상기 데이터 저장부(210)는 변환되지 않은 번역(예를들어, <공식적인 영어(English Formal)> 'you' -> <공식적인 불어(French Formal)> -> 'vous'), 변환된 번역(예를들어, <영어 채팅용어(English Chatspeak)> 'u' -> <공식적인 불어> -> 'vous'), 또는 양쪽 모두를 저장할 수 있다. 일부 실시예에서, 상기 번역 데이터 저장부(210)는, 대응하는 채팅 메시지가 해쉬 밸류/태그를 이용하여 식별될 수 있는 번역을 저장할 수 있다. 예를들어, 영어로 된 원본 메시지에 대한 스페인어 번역을 저장하기 위하여, 상기 스페인어 번역은 상기 영어 메시지의 해쉬 밸류에 기반하여 저장될 수 있으며, 그로 인하여, 상기 스페인어 번역은, 상기 영어 메시지의 해쉬 밸류를 이용하여, 이후 위치되고 획득되도록 할 수 있다. 당업자는, 일부 실시예에서, 상기 번역 데이터 저장부(210)가, 2개의 특정한 언어 사이의 번역을 위하여, 개별적인 데이터 저장부을 포함할 수 있음을 인정할 수 있다. 따라서, 채팅 메시지가 영어와 불어 사이에서 변환되거나/번역되면, 대응하는 데이터 영어-불어 데이터 저장부(English-French data store)는, 상기 번역 데이터 저장부(210)와 관련된 동작을 위하여, 활용될 수 있다.
상기 번역 API 모듈(212)는, 상기 CTT 시스템(114)의 외부에서 제공되는 기계번역 서비스로의 접속을, CTT 시스템(114)에 제공하도록 구성될 수 있다(예를들어, 상기 번역 서버(110)의 번역 모듈(116)에 의하여). 여기서 설명된 바와 같이, 상기 번역 데이터 저장부(210)에 번역이 위치하지 않으면, 상기 번역 API 모듈(212)이 CTT 시스템(114)에 의하여 활용될 수 있다.
도3은 다양한 실시예에 따르는, 예시적인 변환 모듈(280)을 나타내는 블록도이다. 도시한 바와 같이, 변환 모듈(208)은 채팅용어 모듈(302), 두문자어 모듈(304), 고유명사 모듈(306), 보통명사모듈(307), 구어체 모듈(310), 맞춤법 검사 모듈(312), 약어 모듈(314) 및/또는 비속어 모듈(316)을 포함할 수 있다. 일부 실시예에 의하면, 동작 중에, 변환모듈(208)은 채팅 메시지의 전체 또는 일부를 처리할 수 있다(예를들어, 메시지를 토큰(token) 또는 논리적 부분(logical portion)으로 나누고, 이후 이들 토큰/부분을 처리함). 일부 실시예에서는, 변환 모듈(208)의 다양한 모듈이 병렬로 호출될 수 있다.
상기 채팅용어 모듈(302)는, 채팅 메시지 내에서, 채팅 특수용어(chat jargon) (즉, 채팅용어)와 관련되는, 하나 또는 그 이상의 단어 또는 구절을 식별할 수 있으며, 나아가, 식별된 단어 또는 구절에 대한, 교체 단어 또는 구절(예를들어, 대응하는 공식적인 용어/즉, 비채팅용어)을 제안하도록 구성될 수 있다. 일부 실시예에서는, 채팅용어 모듈(302)이, 순차적인 기계 번역 과정에서 생략하거나 또는 이외에 무시하도록, 식별된 채팅용어 단어 또는 구절을 표시할 수 있다(예를들어, 번역 모듈(116)에 의하여). 추가적으로, 일부 실시예에서, 식별된 채팅용어 단어 또는 구절은, 이후 인간 운영자(예를들어, CTT 시스템(114)의 관리자)에 의한 검토(review) 및 처분(disposition)을 위하여 표시될 수 있다. 채팅용어 단어 또는 구절, 및/또는 그의 대응하는 (공식적인) 단어 또는 구절을 식별하기 위하여, 일부 실시예는, 채팅용어 단어 또는 구절, 및/또는 채팅용어 단어 또는 구절과 그들의 대응하는 단어 또는 구절 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다. 상기 데이터세트는 훈련이나 학습 시스템의 방법으로 형성된 것일 수 있으며, 소유주가 있는 것일 수 있고(예를들어, 상기 CTT 시스템(114)의 관리자에 의하여 수동으로 수집된 “내부용(in-house)”), 상업적으로 얻을 수 있거나, 또는 공개적으로 이용가능한 인터넷 지식기반으로부터 도출되는 것일 수 있다. 예를들어, 상기 채팅용어 모듈(302)는, 그것의 기능에 통계적인 기계 번역을 적용할 수 있다. 일부 실시예에서는, 상기 적용된 통계적인 기계번역은, 병렬적인 텍스트을 이용하거나 및/또는 문맥적인 정보를 포함하는 변환으로부터 추출된 구절-레벨의 짝(pair)들을 이용하여 훈련할 수 있으며, 및/또는 그렇지 않으면 문법에 맞지 않는 문장에, 문법을 추가할 수 있다. 채팅용어 모듈(302)에 의한 결과는, 상기 채팅용어 모듈(302)에 의하여 무시할 것으로 표시된 채팅용어 단어 또는 구절, 제안된 치환(replacement), 또는, 상기 채팅용어 모듈(302)에 의하여 상기 메시지에 삽입될(예를들어, 식별된 채팅용어 단어 또는 구절의 위치에) 채팅용어가 아닌(non-chatspeak) 단어 또는 구절을 포함할 수 있다. 실시예에 의하면, 채팅용어 모듈(302)에 의하여 결과로 도출된 상기 메시지는, 추가적인 처리를 위하여 (변환 모듈(208)에 포함된) 다른 변환 모듈로 제공될 수 있으며, 또는 상기 채팅용어 모듈(302)에 의하여 변환된 메시지가 상기 데이터 저장부(210)에 있는지 여부를 판별하기 위하여, 상기 제안된 치환이 상기 CTT 제어 모듈(202)로 제공될 수 있다.
상기 두음자어 모듈(304)은, 채팅 메시지에 포함된 하나 또는 그 이상의 두음자어를 식별하도록 구성될 수 있으며, 나아가 상기 두음자어에 대응하는(예를들어, 에 의하여 대표되는) 대체 단어 또는 구절을 제안하도록 구성될 수 있다. 일부 실시예에서는, 두음자어 모듈(304)은, 생략하거나 아니면 이후의 기계 번역(예를들어, 번역 모듈(116)에 의한) 동안에서 무시하도록, 식별된 두음자어를 표시할 수 있다. 추가적으로, 일부 실시예에서, 식별된 두음자어는, 이후 인간 운영자(예를들어, CTT 시스템(114)의 관리자)에 의한, 검토(review) 및 처분(disposition)을 위하여 표시될 수 있다. 두음자어 및 또는 그에 대응하는 단어 또는 구절을 식별하기 위하여, 일부 실시예에서는, 두음자어 및/또는 두음자어와 그들의 대응하는 단어 및 구절들 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다. 상기 데이터세트는 훈련이나 학습 시스템의 방법으로 형성된 것일 수 있으며, 소유주가 있는 것일 수 있고(예를들어, 상기 CTT 시스템(114)의 관리자에 의하여 수동으로 수집된 “내부용(in-house)”), 상업적으로 얻을 수 있거나, 또는 공개적으로 이용가능한 인터넷 지식기반으로부터 도출되는 것일 수 있다. 두음자어 모듈(304)에 의한 결과는, 상기 두음자어 모듈(304)에 의하여 무시할 것으로 표시된 두음자어, 제안된 치환(replacement), 또는, 상기 두음자어 모듈(302)에 의하여 상기 메시지에 삽입될(예를들어, 식별된 두음자어의 위치에) 단어 또는 구절을 포함할 수 있다. 실시예에 의하면, 두음자어 모듈(304)에 의하여 결과로 도출된 상기 메시지는, 추가적인 처리를 위하여 (변환 모듈(208)에 포함된) 다른 변환 모듈로 제공될 수 있으며, 또는 상기 두음자어 모듈(304)에 의하여 변환된 메시지가 상기 데이터 저장부(210)에 있는지 여부를 판별하기 위하여, 상기 제안된 치환이 상기 CTT 제어 모듈(202)로 제공될 수 있다.
상기 고유명사 모듈(306)은, 채팅 메시지에 포함된 하나 또는 그 이상의 고유명사를 식별하도록 구성될 수 있으며, 나아가 상기 고유명사에 대응하는(예를들어, 나타내는) 대체 단어 또는 구절을 제안하도록 구성될 수 있다. 일부 실시예에서, 고유명사 모듈(306)은, 생략하거나 아니면 이후의 기계 번역(예를들어, 번역 모듈(116)에 의한) 동안 무시하도록, 식별된 고유명사를 표시할 수 있다. 추가적으로, 일부 실시예에서, 식별된 고유명사는, 이후 인간 운영자(예를들어, CTT 시스템(114)의 관리자)에 의한, 검토(review) 및 처분(disposition)을 위하여 표시될 수 있다. 고유명사 및/또는 그에 대응하는 단어 또는 구절을 식별하기 위하여, 일부 실시예에서는, 고유명사 및/또는 고유명사와 그들의 대응하는 단어 및 구절들 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다(예를들어, Disneyland®와 같이 잘 알려진 고유명사 또는 개인들의 흔한 이름). 상기 데이터세트는 훈련이나 학습 시스템의 방법으로 형성된 것일 수 있으며, 소유주가 있는 것일 수 있고(예를들어, 상기 CTT 시스템(114)의 관리자에 의하여 수동으로 수집된 “내부용(in-house)”), 상업적으로 얻을 수 있거나, 또는 공개적으로 이용가능한 인터넷 지식기반으로부터 도출되는 것일 수 있다. 고유명사 모듈(306)에 의한 결과는, 상기 고유명사 모듈(306)에 의하여 무시할 것으로 표시된 고유명사, 제안된 치환, 또는, 상기 고유명사 모듈(302)에 의하여 상기 메시지에 삽입될(예를들어, 식별된 고유명사의 위치에) 단어 또는 구절을 포함할 수 있다. 실시예에 의하면, 고유명사 모듈(306)에 의하여 결과로 도출된 상기 메시지는, 추가적인 처리를 위하여 (변환 모듈(208)에 포함된) 다른 변환 모듈로 제공될 수 있으며, 또는 상기 고유명사 모듈(306)에 의하여 변환된 메시지가 상기 데이터 저장부(210)에 있는지 여부를 판별하기 위하여, 상기 제안된 치환이 상기 CTT 제어 모듈(202)로 제공될 수 있다.
상기 보통명사 모듈(308)은, 채팅 메시지에 포함된 하나 또는 그 이상의 보통명사를 식별하도록 구성될 수 있으며, 나아가 상기 보통명사에 대응하는(예를들어, 나타내는) 대체 단어 또는 구절을 제안하도록 구성될 수 있다. 일부 실시예에서, 보통명사 모듈(308)은, 생략하거나 아니면 이후의 기계 번역(예를들어, 번역 모듈(116)에 의한) 동안 무시하도록, 식별된 보통명사를 표시할 수 있다. 추가적으로, 일부 실시예에서, 식별된 보통명사는, 이후 인간 운영자(예를들어, CTT 시스템(114)의 관리자)에 의한, 검토(review) 및 처분(disposition)을 위하여 표시될 수 있다. 보통명사 및/또는 그에 대응하는 단어 또는 구절을 식별하기 위하여, 일부 실시예에서는, 보통명사 및/또는 보통명사와 그들의 대응하는 단어 및 구절들 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다. 상기 데이터세트는 훈련이나 학습 시스템의 방법으로 형성된 것일 수 있으며, 소유주가 있는 것일 수 있고(예를들어, 상기 CTT 시스템(114)의 관리자에 의하여 수동으로 수집된 “내부용(in-house)”), 상업적으로 얻을 수 있거나, 또는 공개적으로 이용가능한 인터넷 지식기반으로부터 도출되는 것일 수 있다. 보통명사 모듈(308)에 의한 결과는, 상기 보통명사 모듈(308)에 의하여 무시할 것으로 표시된 보통명사, 제안된 교체 또는, 상기 보통명사 모듈(308)에 의하여 상기 메시지에 삽입될(예를들어, 식별된 보통명사의 위치에) 단어 또는 구절을 포함할 수 있다. 실시예에 의하면, 보통명사 모듈(308)에 의하여 결과로 도출된 상기 메시지는, 추가적인 처리를 위하여 (변환 모듈(208)에 포함된) 다른 변환 모듈로 제공될 수 있으며, 또는 상기 보통명사 모듈(308)에 의하여 변환된 메시지가 상기 데이터 저장부(210)에 있는지 여부를 판별하기 위하여, 상기 제안된 치환이 상기 CTT 제어 모듈(202)로 제공될 수 있다.
상기 구어체 모듈(310)은, 채팅 메시지에 포함된 하나 또는 그 이상의 구어체 단어 또는 구절을 식별하도록 구성될 수 있으며, 나아가 상기 식별된 단어 또는 구절에 대한 대체(예를들어, 대응하는 공식적인/즉, 구어체가 아닌) 단어 또는 구절을 제안하도록 구성될 수 있다. 일부 실시예에서, 구어체 모듈(310)은, 생략하거나 아니면 이후의 기계 번역(예를들어, 번역 모듈(116)에 의한) 동안 무시하도록, 식별된 구어체 단어 또는 구절을 표시할 수 있다. 추가적으로, 일부 실시예에서, 식별된 구어체 단어 또는 구절은, 이후 인간 운영자(예를들어, CTT 시스템(114)의 관리자)에 의한, 검토(review) 및 처분(disposition)을 위하여 표시될 수 있다. 구어체 단어 또는 구절 및/또는 그에 대응하는 (공식적인) 단어 또는 구절을 식별하기 위하여, 일부 실시예에서는, 구어체 단어 또는 구절 및/또는, 구어체 단어 또는 구절과 그들의 대응하는 단어 및 구절들 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다. 상기 데이터세트는 훈련이나 학습 시스템의 방법으로 형성된 것일 수 있으며, 소유주가 있는 것일 수 있고(예를들어, 상기 CTT 시스템(114)의 관리자에 의하여 수동으로 수집된 “내부용(in-house)”), 상업적으로 얻을 수 있거나, 또는 공개적으로 이용가능한 인터넷 지식기반으로부터 도출되는 것일 수 있다. 구어체 모듈(310)에 의한 결과는, 상기 구어체 모듈(310)에 의하여 무시할 것으로 표시된 구어체 단어 또는 구절, 제안된 치환 또는, 상기 구어체 모듈(310)에 의하여 상기 메시지에 삽입될 (예를들어, 식별된 구어체 단어 또는 구절의 위치에) 단어 또는 구절을 포함할 수 있다. 실시예에 의하면, 구어체 모듈(310)에 의하여 결과로 도출된 상기 메시지는, 추가적인 처리를 위하여 (변환 모듈(208)에 포함된) 다른 변환 모듈로 제공될 수 있으며, 또는 상기 구어체 모듈(310)에 의하여 변환된 메시지가 상기 데이터 저장부(210)에 있는지 여부를 판별하기 위하여, 상기 제안된 치환이 상기 CTT 제어 모듈(202)로 제공될 수 있다.
상기 맞춤법 검사 모듈(312)은, 채팅 메시지에 포함된 하나 또는 그 이상의 맞춤법이 틀린(misspelled) 단어 또는 구절을 식별하도록 구성될 수 있으며, 나아가 상기 식별된 단어 또는 구절에 대한 대체(예를들어, 정정된) 단어 또는 구절을 제안하도록 구성될 수 있다. 예를들어, 맞춤법 검사 모듈(312)은, 상기 단어 또는 구절을 상기 제안된 대체 단어 또는 구절로 자동으로 정정하도록 구성될 수 있다. 일부 실시예에 의하면, 맞춤법 검사 모듈(312)은, 생략하거나 아니면 이후의 기계 번역(예를들어, 번역 모듈(116)에 의한) 동안 무시하도록, 식별된 맞춤법이 틀린 단어 또는 구절을 표시할 수 있다. 추가적으로, 일부 실시예에서, 상기 식별된 맞춤법이 틀린 단어 또는 구절은, 이후 인간 운영자(예를들어, CTT 시스템(114)의 관리자)에 의한, 검토(review) 및 처분(disposition)을 위하여 표시될 수 있다. 맞춤법이 틀린 단어 또는 구절 및/또는 그에 대응하는 (정정된) 단어 또는 구절을 식별하기 위하여, 일부 실시예에서는, 맞춤법이 틀린 단어 또는 구절 및/또는, 맞춤법이 틀린 단어 또는 구절과 그들의 대응하는 단어 및 구절들 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다. 상기 데이터세트는 훈련이나 학습 시스템의 방법으로 형성된 것일 수 있으며, 소유주가 있는 것일 수 있고(예를들어, 상기 CTT 시스템(114)의 관리자에 의하여 수동으로 수집된 “내부용(in-house)”), 상업적으로 얻을 수 있거나, 또는 공개적으로 이용가능한 인터넷 지식기반으로부터 도출되는 것일 수 있다. 맞춤법 검사 모듈(312)에 의한 결과는, 상기 맞춤법 검사 모듈(312)에 의하여 무시할 것으로 표시된 맞춤법이 틀린 단어 또는 구절, 제안된 치환, 또는, 맞춤법 검사 모듈(312)에 의하여 상기 메시지에 삽입될(예를들어, 맞춤법이 틀린 단어 또는 구절의 위치에) 정정된 단어 또는 구절을 포함할 수 있다. 실시예에 의하면, 맞춤법 검사 모듈(312)에 의하여 결과로 도출된 상기 메시지는, 추가적인 처리를 위하여 (변환 모듈(208)에 포함된) 다른 변환 모듈로 제공될 수 있으며, 또는 상기 맞춤법 검사 모듈(312)에 의하여 변환된 메시지가 상기 데이터 저장부(210)에 있는지 여부를 판별하기 위하여, 상기 제안된 치환이 상기 CTT 제어 모듈(202)로 제공될 수 있다.
상기 약어 모듈(314)은, 채팅 메시지에 포함된 하나 또는 그 이상의 약어를 식별하도록 구성될 수 있으며, 나아가 상기 식별된 상기 약어에 대응하는(예를들어, 나타내는) 대체 단어 또는 구절을 제안하도록 구성될 수 있다. 일부 실시예에 의하면, 약어 모듈(314)은, 생략하거나 아니면 이후의 기계 번역(예를들어, 번역 모듈(116)에 의한) 동안 무시하도록, 식별된 약어를 표시할 수 있다. 추가적으로, 일부 실시예에서, 상기 식별된 약어는, 이후 인간 운영자(예를들어, CTT 시스템(114)의 관리자)에 의한, 검토(review) 및 처분(disposition)을 위하여 표시될 수 있다. 약어 및/또는 그에 대응하는 단어 또는 구절을 식별하기 위하여, 일부 실시예에서는, 약어 및/또는, 약어와 그들의 대응하는 단어 및 구절들 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다. 상기 데이터세트는 훈련이나 학습 시스템의 방법으로 형성된 것일 수 있으며, 소유주가 있는 것일 수 있고(예를들어, 상기 CTT 시스템(114)의 관리자에 의하여 수동으로 수집된 “내부용(in-house)”), 상업적으로 얻을 수 있거나, 또는 공개적으로 이용가능한 인터넷 지식기반으로부터 도출되는 것일 수 있다. 약어 모듈(314)에 의한 결과는, 상기 약어 모듈(314)에 의하여 무시할 것으로 표시된 약어, 제안된 치환 또는, 약어 모듈(314)에 의하여 상기 메시지에 삽입될(예를들어, 상기 식별된 약어의 위치에) 단어 또는 구절을 포함할 수 있다. 실시예에 의하면, 약어 모듈(314)에 의하여 결과로 도출된 상기 메시지는, 추가적인 처리를 위하여 (변환 모듈(208)에 포함된) 다른 변환 모듈로 제공될 수 있으며, 또는 상기 약어 모듈(314)에 의하여 변환된 메시지가 상기 데이터 저장부(210)에 있는지 여부를 판별하기 위하여, 상기 제안된 치환이 상기 CTT 제어 모듈(202)로 제공될 수 있다.
상기 비속어 모듈(316)은, 채팅 메시지에 포함된 하나 또는 그 이상의 비속한 단어 또는 구절(이하, “비속어”라 함)를 식별하도록 구성될 수 있으며, 나아가 상기 식별된 비속어에 대응하는 대체 단어 또는 구절(예를들어, 적절한 대체)을 제안하도록 구성될 수 있다(예를들어, 부드러운 완곡어구). 일부 실시예에 의하면, 비속어 모듈(316)은, 생략하거나 아니면 이후의 기계 번역(예를들어, 번역 모듈(116)에 의한) 동안 무시하도록, 식별된 비속어를 표시할 수 있다. 추가적으로, 일부 실시예에서, 상기 식별된 비속어는, 이후 인간 운영자(예를들어, CTT 시스템(114)의 관리자)에 의한, 검토(review) 및 처분(disposition)을 위하여 표시될 수 있다. 비속어 및/또는 그에 대응하는 단어 또는 구절을 식별하기 위하여, 일부 실시예에서는, 비속어 및/또는, 비속어와 그들의 대응하는 단어 및 구절들 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다. 상기 데이터세트는 훈련이나 학습 시스템의 방법으로 형성된 것일 수 있으며, 소유주가 있는 것일 수 있고(예를들어, 상기 CTT 시스템(114)의 관리자에 의하여 수동으로 수집된 “내부용(in-house)”), 상업적으로 얻을 수 있거나, 또는 공개적으로 이용가능한 인터넷 지식기반으로부터 도출되는 것일 수 있다. 비속어 모듈(316)에 의한 결과는, 상기 비속어 모듈(316)에 의하여 무시할 것으로 표시된 비속어, 제안된 치환 또는, 비속어 모듈(316)에 의하여 상기 메시지에 삽입될(예를들어, 상기 식별된 비속어의 위치에) 단어 또는 구절을 포함할 수 있다. 실시예에 의하면, 비속어 모듈(316)에 의하여 결과로 도출된 상기 메시지는, 추가적인 처리를 위하여 (변환 모듈(208)에 포함된) 다른 변환 모듈로 제공될 수 있으며, 또는 상기 비속어 모듈(316)에 의하여 변환된 메시지가 상기 데이터 저장부(210)에 있는지 여부를 판별하기 위하여, 상기 제안된 치환이 상기 CTT 제어 모듈(202)로 제공될 수 있다.
일부 실시예에 의하면, 상기 변환 모듈(208)의 하나 또는 그 이상의 다양한 모듈들은, 상기 표시될 부분의 앞 및/또는 뒤에, 기 설정된 기호(character)를 삽입하여, 상기 채팅 메시지의 하나 또는 그 이상의 부분을 표시할 수 있다. 예를들어, 채팅용어 모듈(302)이 상기 채팅 메시지의 일 부분에 포함된 단어 “LOL”를 표시할 때, 상기 채팅용어 모듈(302)는, 상기 표시된 부분이 번역 모듈(116)에 의하여 무시되어야 함을 표시하기 위하여, 기 설정된 기호(“_”)를 상기 단어의 앞 및/또는 뒤에 삽입할 수 있다(예를들어, “_LOL_”)
일부 실시예에 의하면, 변환 모듈(208)은, 초기 메시지에 대하여 병렬적으로, 2 또는 그 이상의 변환 동작을 수행할 수 있으며, 그에 대응하여, 각각의 2 또는 그 이상의 변환은 개별적인 응답을 회신할 수 있고, 그로부터 변환 모듈(208)은 추가적인 처리(예를들어, 동작(514)에서 수행되는)를 위하여 하나의 변환된 메시지를 선택할 수 있다. 상기 실시예에 의하면, 각각의 응답은, 표시된 텍스트 영역, 제안된 치환, 또는 상기 초기 메시지에 삽입된 단어 또는 구절을 포함할 수 있다. 그 후에, 상기 선택된 변환된 메시지는, 어떠한 전래에 따라, 어떤 변환된 메시지가 추가적인 처리를 위하여 선택될 것인가를 결정할 수 있는, 선택의 우선순위에 따를 수 있다. 일부 실시예에서는, 상기 우선순위 선택은, 어떠한 변환 동작이 가장 번역 데이터 저장부(210)의 비교결과 또는 기계 번역 결과에 대하여, 적합한 변환된 메시지를 생성하기 쉬운가에 따를 수 있다. 추가적으로, 일부 실시예에 의하면, 상기 선택의 우선순위는 어떠한 변환 동작이 가장 공식적인 변환된 메시지를 생성하는가에 따를 수 있다. 선택의 우선순위는, 실시예에 의하여 선택된 변환/번역 전략에 따라 결정될 수 있다.
다음은, 다양한 실시예에 따라, 변환모듈이 채팅 메시지의 부분을 어떻게 처리하는지에 대한 예시를 제공하고 있다. 도시한 바와 같이, 상기 변환 모듈(208)은 토큰(token) 또는 프록시말 토큰(proximal token)에 기반하는 채팅메시지를 처리할 수 있으며, 한번 변환이 수행되면 특정한 토큰에 대한 처리를 중단할 수 있다.
채팅메시지의 토큰
(Token(s) from a Chat Message)
변환 처리
(Transformation Processing)
Token = 'USA' 채팅용어 모듈 ('USA') → 두음자어 모듈 ('USA') → 번역하지 않을 것을 표시
Token = 'brb' 채팅용어 모듈 ('brb') → 두음자어 모듈 ('brb') → 고유명사모듈 ('brb') → 보통명사모듈 ('brb') → 구어체모듈 ('brb') → 맞춤법검사모듈('brb') → 약어모듈('brb') → 'be right back'으로 변환
Token = '9' 채팅용어 모듈 ('9') → 'parents watching over shoulder'로 변환
Token = '99' 채팅용어 모듈 ('99') → 'parents stopped watching over shoulder'로 변환
Proximal tokens = 'go gabe' 채팅용어 모듈 ('go gabe') → 두음자어모듈 ('go gabe') → 고유명사모듈 ('going') → 보통명사모듈 ('go gabe') → 보통명사에 해당할 가능성이 있음을 표시
String = 'Your going to attack him?'
Token#1 = 'Your'
Token#2 = 'going'
Token#3 = 'to'
Token#4 = 'attack'
Token#5 = 'him'
맞춤법 검사 모듈('Your') → 프록시말 토큰 'going'을 기반으로 'you're'로 정정(즉, 맞춤법 검사를 위하여 프록시말 문맥(proximal context)을 사용함)

채팅용어모듈 ('going') → 두음자어모듈 ('going') → 고유명사모듈 ('going') → 보통명사모듈 ('going') → 구어체모듈 ('going') → 맞춤법 검사 모듈('going') → 약어모듈 ('going') → 비속어 모듈('going') → 변환하지 않음.

채팅용어모듈 ('to') → 두음자어모듈('to') → 고유명사모듈('to') → 보통명사모듈 ('to') → 구어체모듈 ('to') → 맞춤법 검사 모듈('to') → 약어모듈 ('to') → 비속어모듈('to') → 변환하지 않음.

채팅용어모듈 ('attack') → 두음자어모듈('attack') → 고유명사모듈('attack') → 보통명사모듈 ('attack') → 구어체모듈 ('attack') → 맞춤법 검사 모듈('attack') → 약어모듈 ('attack') → 비속어모듈('attack') → 변환하지 않음.

채팅용어모듈 ('him') → 두음자어모듈('him') → 고유명사모듈('him') → 보통명사모듈 ('him') → 구어체모듈 ('him') → 맞춤법 검사 모듈('him') → 약어모듈 ('him') → 비속어모듈('him') → 변환하지 않음.
String = 'Sup bro, sup yall?'
Token#1 = 'Sup'
Token#2 = 'bro'
Token#3 = 'sup'
Token#4 = 'yall'
채팅용어모듈 ('Sup') → "How is it going."으로 치환

채팅용어모듈 ('bro') → 두음자어모듈('bro') → 고유명사모듈 ('bro') → 보통명사모듈 ('bro') → 구어체모듈 ('bro') → 맞춤법 검사 모듈('bro') → 약어모듈('bro') → "brother"로 치환

채팅용어모듈 ('sup') → "how is it going."로 치환

채팅용어모듈 ('yall') → "you all."로 치환
도4는 다양한 실시예에 따르는 예시적인 채팅 클라이언트 시스템(104)을 나타내는 블록도이다. 도시한 바와 같이, 채팅 클라이언트 시스템(104)은 채팅 클라이언트 제어부(402), 채팅 클라이언트 통신 모듈(404) 및 채팅 클라이언트 GUI(Graphic User Interface) 모듈(406)을 포함할 수 있다. 상기 채팅 클라이언트 제어 모듈(402)은, 채팅 클라이언트 시스템(104)이 채팅과 관련된 동작(예를들어, 채팅 서버(108)와의 통신 채팅 대화)을 수행함에 따라, 채팅 클라이언트 시스템(104) 내에서의 다양한 동작의 수행을 제어 및/또는 지휘하도록 구성될 수 있다. 일부 실시예에서, 상기 채팅 클라이언트 제어 모듈(402)은, 예를들어 채팅 클라이언트 통신모듈(404) 및 채팅 클라이언트 GUI 모듈(406)과 같은, 상기 채팅 클라이언트 시스템(104)에 포함되는 다른 구성요소의 동작을 제어할 수 있다.
상기 채팅 클라이언트 통신 모듈(404)는, 채팅 클라이언트 시스템(104)과, 채팅 서버(108)와 같은, 상기 채팅 클라이언트 시스템(104)에 대한 외부의 시스템 및 구성요소들(components) 사이의 통신을 구현하도록 구성될 수 있다. 따라서, 채팅 클라이언트 모듈(404)을 통하여, 상기 채팅 클라이언트 시스템(104)은 채팅 서버(108)로부터 상기 채팅 클라이언트 시스템(104)에 의하여(예를들어, 채팅 클라이언트 GUI 모듈(406)을 통하여) 제공되는 채팅 대화를 수신할 수 있으며, 상기 채팅 클라이언트 시스템(104)의 사용자로부터 수신한 채팅 대화를 채팅 서버로 전송할 수 있다 (예를들어, 채팅 클라이언트 GUI 모듈(406)을 통하여).
상기 채팅 클라이언트 GUI 모듈(406)은, 채팅 클라이언트 시스템(104)의 사용자에게, 다른 채팅 클라이언트 시스템과의 채팅 세션에 대한 그래픽적인 입력/출력 접속(access)를 제공하도록 구성될 수 있다. 따라서, 일부 실시예에서, 상기 채팅 클라이언트 GUI 모듈(406)은, 클라이언트(102)의 사용자에게, 상기 클라이언트(102)를 통하여 사용자의 상호작용(interaction)을 수신하도록 적용된, 클라이언트 GUI를 제공할 수 있다. 일부 실시예에 의하면, 상기 채팅 클라이언트 GUI모듈(406)은 사용자에게, 그들의 선택 언어(예를들어, 사용자의 선호/설정 언어에 따르는)로 된 채팅 대화(예를들어, 채팅 서버(108)로부터 그들이 수신한 바와 같이)를 제공하도록 구성될 수 있다. 추가적으로, 상기 채팅 클라이언트 GUI 모듈(406)은, 그들이 선택한 언어로 된 채팅 입력을(예를들어, 사용자의 선호/설정 언어에 따르는), 상기 사용자로부터 수신하도록 구성될 수 있다. 여기서, 설명한 바와 같이, 상기 채팅 클라이언트 시스템(104)에서, 상기 채팅 대화를 표시하고 수신하는데 사용된 언어는, 다른 채팅 클라이언트 시스템에서 상기 채팅 대화를 표시하고 수신하는데 사용된 언어와는 상이할 수 있다. 상기 채팅 클라이언트 GUI 모듈(406)에 대한 더 많은 것은 도7과 관련하여 설명된다.
도5는 다양한 실시예에 따르는, 다중 언어 통신에 대한 예시적인 방법(500)을 나타내는 순서도이다. 아래에 설명하는 바와 같이, 일부 실시예에서, 상기 방법(500)에 의하여 표시되는 방법은, 채팅 클라이언트 시스템(104-1), 채팅 클라이언트 시스템(104-2), CTT 시스템(114)(예를들어, 채팅 서버(108)) 및 번역 모듈(116)(예를들어, 번역 서버(110))과 관련된 동작을 수행할 수 있다.
방법(500)은 동작(502)에서 시작할 수 있으며, (CTT 시스템(114)의) 언어모듈(204)은 제1 채팅 클라이언트 시스템(예를들어, 104-1)의 사용자에 의하여 사용되는 제1 언어와, 제2 채팅 클라이언트 시스템(예를들어, 104-2)의 사용자에 의하여 사용되는 제2 언어를 식별하면서, 있을 수 있다. 일부 실시예에 의하면, 상기 언어 모듈(204)는, 각각의 채팅 클라이언트 시스템(104)로부터 획득한 언어 선호도/설정에 따라, 제1 언어 및 제2 언어를 식별할 수 있다.
동작(504)에서는, (CTT 시스템(114)의) 상기 CTT 통신 모듈(204)은 제1 언어로 된 초기 메시지를 수신할 수 있다. 일부 실시예에서, 상기 CTT 통신 모듈(204)은, 채팅 클라이언트 시스템(예를들어, 104-1)으로부터 초기 메시지를 수신한, 채팅 호스트 시스템(112)로부터 상기 초기 메시지를 수신할 수 있다.
동작(506)에서, (CTT 시스템(114)의) 상기 CTT 제어 모듈(202)은, 상기 초기 메시지에 대응하는, 제2 언어로 된 대응 메시지에 대하여, 번역 데이터 저장부(210)로 질의할 수 있다. 동작 (508)에서, 상기 CTT 제어 모듈(202)은, 대응 메시지가 상기 번역 데이터 저장부(210)에서 발견되는지 여부를, 판별할 수 있다. 만약, 하나 존재하면, 동작(510)에서 상기 CTT 통신 모듈(204)는 제2 채팅 클라이언트 시스템(예를들어, 채팅 클라이언트 시스템(104-2))으로 상기 대응 메시지를 전송하는 것을 지원할 수 있다. 일부 실시예에서, 상기 대응 메시지는, 상기 대응메시지를 제2 채팅 클라이언트 시스템(예를들어, 104-2)으로 중계할 수 있는, 채팅 호스트 시스템(112)로 전송될 수 있다. 상기 방법(500)은 이후 종료될 수 있다.
만약, 번역 데이터 저장부(210) 내에 대응메시지가 존재하지 않으면, 동작(512)에서, 상기 변환모듈(208)은, 상기 초기 메시지의 적어도 일부에 대하여, 제1 언어로 된 변환된 메시지로의 변환을 시도할 수 있다. 여기서 설명된 바와 같이, 상기 변환 모듈(208)에 의하여 도출된 상기 메시지는, 변환되거나 또는 변화되지 않은 상태로 남을 수 있다(예를들어, 변환모듈(208)의 변환동작이 초기 메시지에 적용되지 않을 때). 일부 실시예에서, 상기 변환 모듈(208)은, 상기 초기 메시지에 대하여 병렬적으로, 2 또는 그 이상의 변환 동작을 수행할 수 있으며, 대응하여, 각각의 2 또는 그 이상의 변환동작은 개별적인 응답을 회신할 수 있고, 변환모듈(208)은, 그러면, 추가적인 처리를 위하여, 하나의 변환된 메시지를 선택할 수 있다. 실시예에 따르면, 각각의 응답은 표시된 텍스트부분, 제안된 치환, 또는, 상기 초기 메시지에 삽입될 단어 또는 구절을 포함할 수 있다. 그 후에, 상기 선택된 변환된 메시지는, 어떠한 전래에 따라, 어떤 변환된 메시지가 추가적인 처리를 위하여 선택될 것인가를 결정할 수 있는, 선택의 우선순위에 따를 수 있다. 일부 실시예에서는, 상기 우선순위 선택은, 어떠한 변환 동작이 가장 번역 데이터 저장부(210)의 비교결과 또는 기계 번역 결과에 대하여, 적합한 변환된 메시지를 생성하기 쉬운가에 따를 수 있다. 추가적으로, 일부 실시예에 의하면, 상기 선택의 우선순위는 어떠한 변환 동작이 가장 공식적인 변환된 메시지를 생성하는가에 따를 수 있다. 선택의 우선순위는, 실시예에 의하여 선택된 변환/번역 전략에 따라 결정될 수 있다.
동작(514)에서, 변환모듈(208)이 상기 메시지를 변환한 것으로 가정하면, (CTT 시스템(114)의) 상기 CTT 제어 모듈(202)은, 변환된 메시지에 대응하는, 제2 언어로 된 대응 메시지를, 번역 데이터 저장부(210)로 질의할 수 있다. 동작(516)에서, 상기 CTT 제어 모듈(202)는 상기 대응메시지가 상기 번역데이터 저장부(210)에서 발견되는지 여부를 판별할 수 있다. 만약, 하나가 존재하면, 동작(518)에서, 상기 CTT 통신 모듈(204)은 제2 채팅 클라이언트 시스템(예를들어, 채팅 클라이언트 시스템(104-2))으로 대응 메시지를 전송하는 것을 지원할 수 있다. 일부 실시예에서, 상기 대응 메시지는, 상기 제2 채팅 클라이언트 시스템(예를들어, 104-2)으로 대응 메시지를 중계하는, 채팅 호스트 시스템(112)으로 전송될 수 있다. 방법(500)은 이후 종료될 수 있다.
일부 실시예에서, 대응 메시지가 번역 데이터 저장부(210)에 여전히 존재하지 않으면, 동작(520)에서, 상기 CTT 제어 모듈(202)은, 이미 적용하지 않은, 채팅 메시지 상에 수행할 수 있는 변환모듈(208)의 추가적인 변환 동작이 있는지 여부를 판별할 수 있다.
만약 추가적인 변환 동작이 존재하면, 방법(500)은 동작(512)로 돌아가서 추가적인 변환 동작(들)을 수행한다. 실시예에 의하면, 상기 추가적인 변환 동작(들)은, 변환 모듈(208)에 의하여, 초기 메시지 상에 이미 적용된 것들과 상이한 변환 동작의 적용을 포함할 수 있으며, 적용된 변환동작과 동일하지만, 영어 채팅 메시지의 다른 부분에 적용하거나, 또는 그들의 동일한 조합을 포함할 수 있다. 예를들어 만약, 동작(512)의 제1 실행 도중, 상기 변환 모듈(208)이 (제1 변환된 메시지를 생성하기 위하여) 초기 메시지에 채팅용어-관련 동작을 적용하면, 동작(512)의 제2 실행 도중에는, 상기 변환 모듈(208)이, 제2 변환된 메시지에 대하여 약어-관련 동작을 적용할 수 있다. 그 다음, 동작(512)의 다음 실행으로, 상기 방법(500)은, 상기 CTT 제어 모듈(202)이 가장 최근에 도출된 변환된 메시지에 대응하는, 제2 언어로 된 대응 메시지를 번역 데이터 저장부(210)에 다시 질의하면, 상기 CTT 제어 모듈(202)이 대응메시지가 상기 번역 데이터 저장부(210)에서 발견되는지를 판별하는, 동작(514) 및 (516)을 계속할 수 있다. 변환 및 질의 동작을 이러한 반복 방식에 따라, 수행함에 따라, 일부 실시예들은 가능한 모든 변환 동작을 수행하기 전에 대응 메시지를 찾는 것이 가능할 수 있다. 당업자들은, 특정한 실시예에서, 오직 변환 모듈(208)에 의하여 제공되는 모든 가능한 변환 동작이 상기 채팅 메시지 상에 수행된 이후에 수행되는 질의 동작(예를들어, 동작(514))과 함께, 상기 변환 및 질의 동작이 직렬적으로 수행될 수 있음을 인정할 수 있다.
만약 대응 메시지가 번역 데이터 저장부(210)에 존재하지 않고 (변환 모듈(208)의) 추가적인 변환 동작이 존재하지 않으면, 동작(522)에서 (번역 API 모듈(212)를 통하여), 상기 번역 모듈(116)은 초기 메시지 또는 변환된 메시지를 제2 언어로 된 대응 메시지로 번역하는 것을 지원할 수 있다. 그 후로, 동작(524)에서, 상기 CTT 통신 모듈(204)은 대응 메시지를, 제2 채팅 클라이언트 시스템(예를들어 채팅 클라이언트 시스템(104-2))으로 전송하는 것을 지원할 수 있다. 일부 실시예에 의하면, 상기 대응 메시지는, 상기 대응 메시지를 상기 제2 채팅 클라이어트 시스템(예를들어, 104-2)으로 중계할 수 있는, 채팅 호스트 시스템(112)으로 전송될 수 있다. 상기 방법(500)은 이후 종료될 수 있다.
일부 실시예에서, 상기 변환 모듈(208)은, 대응 메시지가 채팅 호스트 시스템(112)으로 전송되기 전에, 제2 언어로 된 대응메시지를 변환하기 위하여 활용될 수 있다. 여기서 설명된 바와 같이, 상기 대응 메시지는, 제2 채팅 클라이언트 시스템(104-2)의 사용자를 위하여 번역을 더 정제하기 위해서, 추가적인 변환 처리를 위하여, 제출될 수 있다. 예를들어, 만약 초기 메시지가 제1 언어(예를들어, 영어)로 된 채팅용어를 포함하면, 추가적인 변환 처리는, 가능한 범위까지, 제2 언어로 된 채팅용어를 더할 수 있다.
비록 상기의 단계들의 방법은, 특정의 순서로, 설명되고 묘사되었으나, 당업자는, 수행된 단계들의 순서들은 실시예들 사이에서 변화할 수 있음을 인정할 것이다. 추가적으로, 당업자는, 방법(500)과 관련하여, 위에서 설명된 구성요소는 단지 상기 방법에서 사용될 수 있는 구성요소의 예시이고, 일부 실시예에서는 다른 구성요소도 일부 실시예로서 활용될 수 있음을 인정할 수 있다.
도 6은, 다양한 실시예에 따른, 통신을 변환하는 예시적인 방법(600)을 나타내는 순서도이다. 후술하는 바와 같이, 일부 실시예에서, 방법(600)은 (예를 들어, CCT 시스템(114)의) 변환 모듈(209)과 관련되어 동작을 수행한다.
방법은, 동작(602)에서 시작하는데, 변환 처리를 위해 초기 메시지가 변환 모듈(208)에 수신된다. 일부 실시예에 기초하여, 변환 모듈(208)은, 번역 데이터 저장부(210)에서 메시지를 식별하는데 실패한 뒤에 변환을 위해 초기 메시지를 수신할 수 있고, 초기 메시지가 제 3자 또는 소유주 번역 프로세스(proprietary translation process)(예를 들어, 클라우드 기반 서비스로 제공될 수 있는 번역 모듈(116))에 의해 기계 번역되기 전에 초기 메시지를 수신하는 것도 가능할 수 있다. 여기서 설명하는 바와 같이, 변환 모듈(208)은 텍스트 번역을 용이하기 하기 위해 또는 개선하기 위해, 다양한 실시예에 사용될 수 있다. 이때 텍스트는 최소의 문맥, 간단한 문장 구조, 전문적/분야에 한정된 용어(예를 들어, 인터넷 기반 채팅을 위한 채팅 용어) 약어, 두문자어, 구어체, 고유명사, 보통명사, 비속어 또는 이들의 조합을 포함할 수 있다. 번역 모듈(208)의 동작으로부터 이득을 볼 수 있는 텍스트 번역은, 대화(예를 들어, 트랜스크립트(transcript)), 오프라인 또는 온라인 인터넷 기반 채팅(예를 들어, 인스턴트 메시징) 그리고 모바일 폰 메시징(예를 들어, SMS 또는 MMS)으로부터 비롯된 텍스트의 번역을 포함할 수 있으나 여기에 제한되지 않는다.
동작(604)에서, 채팅용어 모듈(302)은, 초기 메시지에서 채팅 용어(chat jargon)(즉 chatspeak)와 관련된 하나 또는 그 이상의 단어 또는 구절을 식별할 수 있고, 그 식별된 단어 또는 구절에 대한 대체(예를 들어, 대응하는 공식적인/즉, 비채팅용어) 단어 또는 구절을 더 제안할 수 있다. 일부 실시예에서, 채팅용어 모듈(302)은 그 식별된 단어 또는 구절이 그 다음의 기계 번역(예를 들어, 번역 모듈(116)에 의해) 동안에 생략되도록 또는 무시되도록 표시할 수 있다. 추가적으로, 일부 실시예에서, 그 식별된 채팅용어 단어 또는 구절은, 운영자(예를 들어, CTT 시스템(114)의 관리자)에 의한 차후의 검토(review) 및 처분(disposition)를 위해 표시될 수 있다. 채팅용어 단어 또는 구절 및/또는 그것의 대응하는 (공식적인) 단어 또는 구절을 식별하기 위해, 일부 실시예는, 채팅용어 단어 또는 구절, 및/또는 채팅용어 단어 또는 구절과 그들의 대응하는 단어 또는 구절 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다. 데이터세트는 훈련 또는 학습 시스템의 방법으로 형성된 것일 수 있으며, 소유주가 있는 것일 수 있으며(예를 들어, CTT 시스템(114)의 관리자에 의해 수동으로 수집된 “내부용(in-house)”), 상업적으로 획득된 것일 수도 있고, 또는 공개적으로 이용 가능한 인터넷 지식으로부터 유래될 수도 있다. 동작(604)의 결과인 메시지(이하, '제 1 중간 메시지'라 함)는, 채팅용어 모듈(302)에 의해 표시되어 무시될 채팅용어 단어 또는 구절, 제안된 치환, 또는 채팅용어 모듈(302)에 의해 초기 메시지에 삽입된(예를 들어, 그 식별된 채팅용어 단어 또는 구절을 대신해서) 비 채팅용어 단어 또는 구절을 포함할 수 있다. 일부 실시예에서, 제 1 중간 메시지는 초기 메시지와 같을 수 있다(예를 들어, 채팅용어 모듈(302)에 의해 어떠한 치환도 수행되지 않을 때). 그 실시예에 따르면, 채팅용어 모듈(302)로부터 생성된 제 1 중간 메시지는, 추가적인 처리를 위해 다른 변환 모듈(변환 모듈(208)에 있는)로 제공될 수 있고, 또는 제안된 치환은, 채팅용어 모듈(302)에 의해 변환된 메시지가 데이터 저장부(302)에 있는지 여부를 결정하기 위해 CTT 제어모듈(202)로 제공될 수 있다. 동작(604)의 후에, 제 1 중간 메시지는 처리를 위해 변환 모듈(208)의 다음 동작(예를 들어 동작(606))에 제공될 수 있다.
동작(606)에서, 두문자어 모듈(304)은, 채팅 메시지에서 하나 또는 그 이상의 두문자어를 식별할 수 있고, 그 두문자어(에 의해 대표되는)에 대응하는 대체 단어 또는 구절을 더 제안할 수 있다. 일부 실시예에서, 두문자어 모듈(304)은, 그 식별된 두문자어가 그 다음의 기계 번역(예를 들어, 번역 모듈(116)에 의해) 동안에 생략되거나 무시되도록 표시될 수 있다. 추가적으로, 일부 실시예에서, 그 식별된 두문자어는, 운영자(예를 들어, CTT 시스템(114)의 관리자)에 의한 차후의 검토(review) 및 처분(disposition)을 위해 표시될 수 있다. 두문자어 및/또는 그것의 대응하는 단어 또는 구절을 식별하기 위해, 일부 실시예에서는, 두음자어 및/또는 두음자어와 그들의 대응하는 단어 및 구절들 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다. 데이터세트는 훈련 또는 학습 시스템을 통해 구축될 수 있고, 전용일 수 있으며(예를 들어, CTT 시스템(114)의 관리자에 의해 수동으로 수집된 '내부용'), 상업적으로 획득된 것일 수도 있고, 또는 공개적으로 이용 가능한 인터넷 지식으로부터 유래될 수도 있다. 동작(606)의 결과인 메시지(이하, '제 2 중간 메시지'라 함)는, 두문자어 모듈(304)에 의해 표시되어 무시될 두문자어, 제안된 치환, 또는 두문자어 모듈(304)에 의해 메시지에 삽입된(예를 들어, 그 식별된 두문자어를 대신해서) 단어 또는 구절을 포함할 수 있다. 일부 실시예에서, 제 2 중간 메시지는 제 1 중간 메시지와 같을 수 있다(예를 들어, 두문자어 모듈(304)에 의해 어떠한 치환도 수행되지 않을 때). 그 실시예에 따르면, 두문자어 모듈(304)로부터 생성된 제 2 중간 메시지는, 추가적인 처리를 위해 다른 변환모듈(변환모듈(208)에 있는)로 제공될 수 있고, 또는 제안된 치환은, 두문자어 모듈(304)에 의해 변환된 메시지가 데이터 저장부(210)에 있는지 여부를 결정하기 위해 CTT 제어모듈(202)로 제공될 수 있다. 동작(606)의 후에, 제 2 중간 메시지는 처리를 위해 변환모듈(208)의 다음 동작(예를 들어 동작(608))에 제공될 수 있다.
동작(608)에서, 고유명사 모듈(306)은, 채팅 메시지에서 하나 또는 그 이상의 고유명사를 식별할 수 있고, 또한 그 고유명사에 대응하는(예를 들어, 대표되는) 대체 단어 또는 구절을 더 제안할 수 있다. 일부 실시예에서, 고유명사 모듈(306)은, 그 식별된 고유명사가 그 다음의 기계 번역(예를 들어, 번역 모듈(116)에 의해) 동안에 생략되거나 무시되도록 표시될 수 있다. 추가적으로, 일부 실시예에서, 그 식별된 고유명사는, 운영자(예를 들어, CTT 시스템(114)의 관리자) 에 의한 차후의 검토 및 처분을 위해 표시될 수 있다. 고유명사 및/또는 그것의 대응하는 단어 또는 구절을 식별하기 위해, 일부 실시예에서는, 고유명사 및/또는 고유명사와 그들의 대응하는 단어 및 구절들 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다(예를들어, Disneyland®와 같이 잘 알려진 고유명사 또는 개인들의 흔한 이름). 데이터세트는 훈련 또는 학습 시스템을 통해 구축될 수 있고, 전용일 수 있으며(예를 들어, CTT 시스템(114)의 관리자에 의해 수동으로 수집된 '내부용'), 상업적으로 획득된 것일 수도 있고, 또는 공개적으로 이용 가능한 인터넷 지식으로부터 유래될 수도 있다. 동작(608)의 결과인 메시지(이하, '제 3 중간 메시지'라 함)는, 고유명사 모듈(306)에 의해 표시되어 무시될 고유명사, 제안된 치환, 또는 고유명사 모듈(306)에 의해 메시지에 삽입된(예를 들어, 그 식별된 고유명사를 대신해서) 단어 또는 구절을 포함할 수 있다. 일부 실시예에서, 제 3 중간 메시지는 제 2 중간 메시지와 같을 수 있다(예를 들어, 고유명사 모듈(306)에 의해 어떠한 치환도 수행되지 않을 때). 그 실시예에 따르면, 고유명사 모듈(306)로부터 생성된 제 3 중간 메시지는, 추가적인 처리를 위해 다른 변환모듈(변환모듈(208)에 있는)로 제공될 수 있고, 또는 제안된 치환은, 고유명사 모듈(306)에 의해 변환된 메시지가 데이터 저장부(210)에 있는지 여부를 결정하기 위해 CTT 제어모듈(202)로 제공될 수 있다. 동작(608)의 후에, 제 3 중간 메시지는 처리를 위해 변환모듈(208)의 다음 동작(예를 들어 동작(610))에 제공될 수 있다.
동작(610)에서, 보통명사 모듈(308)은, 채팅 메시지에서 하나 또는 그 이상의 보통명사를 식별할 수 있고, 또한 그 보통명사에 대응하는(예를 들어, 대표되는) 대체 단어 또는 구절을 더 제안할 수 있다. 일부 실시예에서, 보통명사 모듈(308)은, 그 식별된 보통명사가 그 다음의 기계 번역(예를 들어, 번역 모듈(116)에 의해) 동안에 생략되거나 무시되도록 표시될 수 있다. 추가적으로, 일부 실시예에서, 그 식별된 보통명사는, 운영자(예를 들어, CTT 시스템(114)의 관리자) 에 의한 차후의 검토 및 처분을 위해 표시될 수 있다. 보통명사 및/또는 그것의 대응하는 단어 또는 구절을 식별하기 위해, 일부 실시예에서는, 보통명사 및/또는 보통명사와 그들의 대응하는 단어 및 구절들 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다. 데이터세트는 훈련 또는 학습 시스템을 통해 구축될 수 있고, 전용일 수 있으며(예를 들어, CTT 시스템(114)의 관리자에 의해 수동으로 수집된 '내부용'), 상업적으로 획득된 것일 수도 있고, 또는 공개적으로 이용 가능한 인터넷 지식으로부터 유래될 수도 있다. 동작(610)의 결과인 메시지(이하, '제 4 중간 메시지'라 함)는, 보통명사 모듈(308)에 의해 표시되어 무시될 보통명사, 제안된 치환, 또는 보통명사 모듈(308)에 의해 메시지에 삽입된(예를 들어, 그 식별된 보통명사를 대신해서) 단어 또는 구절을 포함할 수 있다. 일부 실시예에서, 제 4 중간 메시지는 제 3 중간 메시지와 같을 수 있다(예를 들어, 보통명사 모듈(308)에 의해 어떠한 치환도 수행되지 않을 때). 그 실시예에 따르면, 보통명사 모듈(308)로부터 생성된 제 4 중간 메시지는, 추가적인 처리를 위해 다른 변환모듈(변환모듈(208)에 있는)로 제공될 수 있고, 또는 제안된 치환은, 보통명사 모듈(308)에 의해 변환된 메시지가 데이터 저장부(210)에 있는지 여부를 결정하기 위해 CTT 제어모듈(202)로 제공될 수 있다. 동작(610)의 후에, 제 4 중간 메시지는 처리를 위해 변환모듈(208)의 다음 동작(예를 들어 동작(612))에 제공될 수 있다.
동작(612)에서, 구어체 모듈(310)은, 채팅 메시지에서 하나 또는 그 이상의 구어체 단어 또는 구절을 식별할 수 있고, 또한 그 식별된 단어 또는 구절의 대체(예를 들어, 대응하는 공식적인/즉, 비구어체) 단어 또는 구절을 더 제안할 수 있다. 일부 실시예에서, 구어체 모듈(310)은, 그 식별된 구어체 단어 또는 구절이 그 다음의 기계 번역(예를 들어, 번역 모듈(116)에 의해) 동안에 생략되거나 무시되도록 표시될 수 있다. 추가적으로, 일부 실시예에서, 그 식별된 구어체 단어 또는 구절은, 운영자(예를 들어, CTT 시스템(114)의 관리자) 에 의한 차후의 검토 및 처분을 위해 표시될 수 있다. 구어체 단어 또는 구절 및/또는 그것의 대응하는 단어 또는 구절을 식별하기 위해, 일부 실시예에서는, 구어체 단어 또는 구절 및/또는, 구어체 단어 또는 구절과 그들의 대응하는 단어 및 구절들 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다. 데이터세트는 훈련 또는 학습 시스템을 통해 구축될 수 있고, 전용일 수 있으며(예를 들어, CTT 시스템(114)의 관리자에 의해 수동으로 수집된 '내부용'), 상업적으로 획득된 것일 수도 있고, 또는 공개적으로 이용 가능한 인터넷 지식으로부터 유래될 수도 있다. 동작(612)의 결과인 메시지(이하, '제 5 중간 메시지'라 함)는, 구어체 모듈(310)에 의해 표시되어 무시될 구어체 단어 또는 구절, 제안된 치환, 또는 구어체 모듈(310)에 의해 메시지에 삽입된(예를 들어, 그 식별된 구어체 단어 또는 구절을 대신해서) 비구어체 단어 또는 구절을 포함할 수 있다. 일부 실시예에서, 제 5 중간 메시지는 제 4 중간 메시지와 같을 수 있다(예를 들어, 구어체 모듈(310)에 의해 어떠한 치환도 수행되지 않을 때). 그 실시예에 따르면, 구어체 모듈(310)로부터 생성된 제 5 중간 메시지는, 추가적인 처리를 위해 다른 변환모듈(변환모듈(208)에 있는)로 제공될 수 있고, 또는 제안된 치환은, 구어체 모듈(310)에 의해 변환된 메시지가 데이터 저장부(210)에 있는지 여부를 결정하기 위해 CTT 제어모듈(202)로 제공될 수 있다. 동작(612)의 후에, 제 5 중간 메시지는 처리를 위해 변환모듈(208)의 다음 동작(예를 들어 동작(614))에 제공될 수 있다.
동작(614)에서, 맞춤법 검사 모듈(312)은, 채팅 메시지에서 하나 또는 그 이상의 철자가 틀린 단어 또는 구절을 식별할 수 있고, 또한 그 식별된 단어 또는 구절의 대체(예를 들어, 정정된) 단어 또는 구절을 더 제안할 수 있다. 예를 들어, 맞춤법 검사 모듈(312)은 단어 또는 구절을 자동으로 그 제안된 교체 단어 또는 문구로 정정할 수 있다. 일부 실시예에서, 맞춤법 검사 모듈(312)은, 그 식별된 맞춤법이 틀린 단어 또는 구절이 그 다음의 기계 번역(예를 들어, 번역 모듈(116)에 의해) 동안에 생략되거나 무시되도록 표시될 수 있다. 추가적으로, 일부 실시예에서, 그 식별된 맞춤법이 틀린 단어 또는 구절은, 운영자(예를 들어, CTT 시스템(114)의 관리자)에 의한 차후의 검토 및 처분을 위해 표시될 수 있다. 맞춤법이 틀린 단어 또는 구절 및/또는 그것의 대응하는(정정된) 단어 또는 구절을 식별하기 위해, 일부 실시예에서는, 맞춤법이 틀린 단어 또는 구절 및/또는, 맞춤법이 틀린 단어 또는 구절과 그들의 대응하는 단어 및 구절들 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다. 데이터세트는 훈련 또는 학습 시스템을 통해 구축될 수 있고, 전용일 수 있으며(예를 들어, CTT 시스템(114)의 관리자에 의해 수동으로 수집된 '내부용'), 상업적으로 획득된 것일 수도 있고, 또는 공개적으로 이용 가능한 인터넷 지식으로부터 유래될 수도 있다. 동작(614)의 결과인 메시지(이하, '제 6 중간 메시지'라 함)는, 맞춤법 검사 모듈(312)에 의해 표시되어 무시될 맞춤법이 틀린 단어 또는 구절, 제안된 치환, 또는 맞춤법 검사 모듈(312)에 의해 메시지에 삽입된(예를 들어, 그 철자가 틀린 단어 또는 구절을 대신해서) 정정된 단어 또는 구절을 포함할 수 있다. 일부 실시예에서, 제 6 중간 메시지는 제 5 중간 메시지와 같을 수 있다(예를 들어, 맞춤법 검사 모듈(312)에 의해 어떠한 치환도 수행되지 않을 때). 그 실시예에 따르면, 맞춤법 검사 모듈(312)로부터 생성된 제 6 중간 메시지는, 추가적인 처리를 위해 다른 변환모듈(변환모듈(208)에 있는)로 제공될 수 있고, 또는 제안된 치환은, 맞춤법 검사 모듈(312)에 의해 변환된 메시지가 데이터 저장부(210)에 있는지 여부를 결정하기 위해 CTT 제어모듈(202)로 제공될 수 있다. 동작(614)의 후에, 제 6 중간 메시지는 처리를 위해 변환모듈(208)의 다음 동작(예를 들어 동작(616))에 제공될 수 있다.
동작(616)에서, 약어 모듈(314)은, 채팅 메시지에서 하나 또는 그 이상의 약어를 식별할 수 있고, 또한 그 약어에 대응하는(예를 들어, 대표되는) 대체 단어 또는 구절을 더 제안할 수 있다. 일부 실시예에서, 약어 모듈(314)은, 그 식별된 약어가 그 다음의 기계 번역(예를 들어, 번역 모듈(116)에 의해) 동안에 생략되거나 무시되도록 표시될 수 있다. 추가적으로, 일부 실시예에서, 그 식별된 약어는, 운영자(예를 들어, CTT 시스템(114)의 관리자)에 의한 차후의 검토 및 처분을 위해 표시될 수 있다. 약어 및/또는 그것의 대응하는 단어 또는 구절을 식별하기 위해, 일부 실시예에서는, 약어 및/또는, 약어와 그들의 대응하는 단어 및 구절들 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다. 데이터세트는 훈련 또는 학습 시스템을 통해 구축될 수 있고, 전용일 수 있으며(예를 들어, CTT 시스템(114)의 관리자에 의해 수동으로 수집된 '내부용'), 상업적으로 획득된 것일 수도 있고, 또는 공개적으로 이용 가능한 인터넷 지식으로부터 유래될 수도 있다. 동작(616)의 결과인 메시지(이하, '제 7 중간 메시지'라 함)는, 약어 모듈(314)에 의해 표시되어 무시될 약어, 제안된 치환, 또는 약어 모듈(314)에 의해 메시지에 삽입된(예를 들어, 그 식별된 약어를 대신해서) 단어 또는 구절을 포함할 수 있다. 일부 실시예에서, 제 7 중간 메시지는 제 6 중간 메시지와 같을 수 있다(예를 들어, 약어 모듈(314)에 의해 어떠한 치환도 수행되지 않을 때). 그 실시예에 따르면, 약어 모듈(314)로부터 생성된 제 7 중간 메시지는, 추가적인 처리를 위해 다른 변환모듈(변환모듈(208)에 있는)로 제공될 수 있고, 또는 제안된 치환은, 약어 모듈(314)에 의해 변환된 메시지가 데이터 저장부(210)에 있는지 여부를 결정하기 위해 CTT 제어모듈(202)로 제공될 수 있다. 동작(616)의 후에, 제 7 중간 메시지는 처리를 위해 변환모듈(208)의 다음 동작(예를 들어 동작(618))에 제공될 수 있다.
동작(618)에서, 비속어 모듈(316)은, 채팅 메시지에서 하나 또는 그 이상의 비속어 단어 또는 구절(이하, '비속어'라 함)을 식별할 수 있고, 또한 그 비속어에 대응하는 대체 단어 또는 구절(예를 들어, 적절한 대체)을 더 제안할 수 있다(예를 들어, 부드러운 완곡어구). 일부 실시예에서, 비속어 모듈(316)은, 그 식별된 비속어가 그 다음의 기계 번역(예를 들어, 번역 모듈(116)에 의해) 동안에 생략되거나 무시되도록 표시될 수 있다. 추가적으로, 일부 실시예에서, 그 식별된 비속어는, 운영자(예를 들어, CTT 시스템(114)의 관리자)에 의한 차후의 검토 및 처분을 위해 표시될 수 있다. 비속어 및/또는 그것의 대응하는 단어 또는 구절을 식별하기 위해, 일부 실시예에서는, 비속어 및/또는, 비속어와 그들의 대응하는 단어 및 구절들 사이의 매핑(mapping)를 포함하는, 데이터세트(dataset, 예를들어 데이터 저장부에 저장된)를 활용할 수 있다. 데이터세트는 훈련 또는 학습 시스템을 통해 구축될 수 있고, 전용일 수 있으며(예를 들어, CTT 시스템(114)의 관리자에 의해 수동으로 수집된 '내부용'), 상업적으로 획득된 것일 수도 있고, 또는 공개적으로 이용 가능한 인터넷 지식으로부터 유래될 수도 있다. 동작(618)의 결과인 메시지(이하, '제 8 중간 메시지'라 함)는, 비속어 모듈(316)에 의해 표시되어 무시될 비속어, 제안된 치환, 또는 비속어 모듈(316)에 의해 메시지에 삽입된(예를 들어, 그 식별된 비속어를 대신해서) 단어 또는 구절을 포함할 수 있다. 일부 실시예에서, 제 8 중간 메시지는 제 7 중간 메시지와 같을 수 있다(예를 들어, 비속어 모듈(316)에 의해 어떠한 치환도 수행되지 않을 때). 그 실시예에 따르면, 비속어 모듈(316)로부터 생성된 제 8 중간 메시지는, 추가적인 처리를 위해 다른 변환모듈(변환모듈(208)에 있는)로 제공될 수 있고, 또는 제안된 치환은, 비속어 모듈(316)에 의해 변환된 메시지가 데이터 저장부(210)에 있는지 여부를 결정하기 위해 CTT 제어모듈(202)로 제공될 수 있다. 동작(618)의 후에, 제 8 중간 메시지는 처리를 위해 변환모듈(208)의 다음 동작에 제공될 수 있다. 그리고 나서 방법(600)은 종료한다.
일부 실시예에 따르면, 변환 모듈(208)로부터 궁극적으로 생성된 메시지(예를 들어, 동작(618)의 결과로 생성된 제 8 중간 메시지)는, 나중에, 그 결과 메시지에 대한 번역으로서 역할을 할 수 있는 대응 메시지를 번역 데이터 저장부(210)로 질의하는 데 사용될 수 있다. 일부 예에서, 변환 모듈(208)로부터 생성된 메시지(예를 들어, 나중에 번역 데이터 저장부(210)로 질의하는데 사용된 메시지)는, 어떤 변환도 초기 메시지에 적용되지 않았을 때(예를 들어, 초기 메시지가 어떤 변환도 적용되지 않고 동작(604-618)을 거침) 수신된(예를 들어, 동작(602)) 초기 메시지와 같을 수 있다는 것은, 당업자에게 자명하다.
다양한 실시예들은, 설명된 것보다 더 많이 또는 더 적은 동작을 수행할 수 있고, 설명된 것과 다른 동작을 수행할 수도 있으며, 다른 순서로 동작을 수행할 수도 있음은 당업자에게 자명하다. 일반적으로, 수행되는 변환 동작의 종류와, 그 수행되는 순서는, 실시예에서 채용하는 변환 전략에 의존할 수 있다. 여기에서 언급하는 바와 같이, 다양한 실시예는 각각의 번역을 달성하는데 있어서 다른 변형/번역 전략을 구현할 수 있는데, 어떤 전략은 특정 번역 어플리케이션 또는 번역 문맥(context)에 적합하다. 채용되는 변환/번역 전략은, 어느 변환 동작이 수행되는지, 변환 동작이 언제 수행되는지, 또는 변환 동작이 수행되는 순서를 결정할 수 있다. 변환/번역 전략은 또한 번역이 번역 데이터 저장부로 이동되는 것 그리고 번역 데이터가 전체 변환/번역 프로세스에서 이용되는 때를 결정할 수 있다.
일부 실시예에서, 방법(600)에서의 동작들의 결과인 중간 메시지는, 방법(600)에서의 다음 동작들의 결과인 메시지에 충격(impact) 및/또는 누적(cascade) 효과를 가할 수 있다. 추가적으로, 일부 실시예에서, 채팅 메시지가 방법(600)에 의해 처리될 때, 순서도(600)의 각 동작이, 방법이 끝나기 전에 채팅 메시지에 수행될 수 있다. 대안으로, 일부 실시예에서, 순서도(600)의 방법은, 도시된 동작의 오직 일부분이 수행되는 즉시 조기에 종료할 수 있다(예를 들어, 적어도 하나의 동작이 채팅 메시지의 변환을 야기한 이후). 일부 실시예에 따르면, 순서도(500)의 각 동작의 수행은, 최근의 결과인 변환된 메시지에 기초하여 원하는 언어의 대응하는 메시지를 번역 데이터 저장부(210)로 질의하는 것으로 이어질 수 있다; 만약 대응하는 메시지가 식별되면, 순서도(500)의 방법은 조기에 종료될 수 있다.
다양한 실시예에서, 방법(600)은 동작(604-612)을 병렬로 수행할 수 있다. 예를 들어, CTT 제어 모듈(202)은, 초기 메시지를 두 개 또는 그 이상의 동작(604-612)으로 병렬로 제공할 수 있고, 그 두 개 또는 그 이상의 동작 각각으로부터 개별 응답을 수신할 수 있다. 각 응답은, 표시된 텍스트 부분, 제안된 치환, 또는 초기 메시지에 삽입된 단어 또는 구절을 포함할 수 있다. 이후, CTT 제어 모듈(202)은 다음의 처리(예를 들어, 번역 데이터 저장부(210) 질의 또는 번역 모듈(116)에 의한 번역)를 위해 그 수신된 응답 중 하나를, 가능한 선택 우선 순위(예를 들어, 추가적인 처리를 위해 그리고 어떤 선례에 따라 어느 변환된 메시지가 선택될 것인지를 결정할 수 있는)에 따라 선택한다.
예를 들어, 방법(600) 동안에, CTT 제어 모듈(202)은, 초기 메시지를, 채팅용어 식별을 처리하는 동작(604), 보통 명사 처리를 위한 동작(610), 약어 처리를 위한 동작(616)으로 제공할 수 있다. 응답으로, 동작(604)은 채팅용어가 변환된 초기 메시지를 회신할 수 있고, 동작(610)은 변경이 없는 초기 메시지를 회신할 수 있으며, 동작(616)은 약어가 변환된 초기 메시지를 회신할 수 있다. 다음으로, 선택 우선 순위에 기초하여, CTT 제어 모듈(202)은, 추가적인 처리를 위해 동작(616)으로부터 회신된 변환된 메시지를 선택할 수 있다.
일부 실시예에서, 시간 제한이 방법(600)의 여러 동작을 수행하는데 적용될 수 있다. 시간 제한은, 응답(Response)/결과(Result)가 그 시간 제한이 만료하기 전에 수신되지 않는다면, 방법(600)의 변환 동작의 수행이 중단되도록 한다. 이와 같이 될 경우, 다양한 실시예는, 어떤 변환 동작은 전체 변환/번역 프로세스를 불필요하게 방해하지 않는다는 것을 보장할 수 있다.
비록 상술한 방법의 동작들이 특정 순서로 도시되고 설명되었지만, 동작들이 수행되는 순서는 실시예들 간에 다를 수 있음은 당업자에게 자명하다. 추가적으로, 순서도(600)의 방법과 관련하여 설명한 구성요소(component)는, 단지 방법에 사용될 수 있는 구성요소들의 예이고, 일부 실시예에서 다른 구성요소들이 또한 사용될 수 있음은 당업자에게 자명하다.
도 7은, 다양한 실시예에 따라, 채팅 클라이언트 시스템(104)(예를 들어, 104-1 및 104-2) 사이의 예시적인 다중 언어 채팅 세션을 나타낸 도면(700)이다. 도시된 바와 같이, 채팅 클라이언트 시스템(104-1)은, 채팅 클라이언트 GUI 모듈(406-1)을 포함하고, 채팅 클라이언트 시스템(104-2)은, 채팅 클라이언트 GUI 모듈(406-2)을 포함한다. 여기에 설명하는 바와 같이, 각 채팅 클라이언트 GUI 모듈(406-1, 406-2)은, 각각 채팅 클라이언트 시스템(104-1, 104-2)의 사용자에게 그들 사이에 공유된 채팅 세션에 대한 그래픽 입력/출력 접근을 제공하도록 구성될 수 있다. 일부 실시예에서, 채팅 클라이언트 GUI 모듈(406-1, 406-2)은, 송수신된 채팅 대화와 관련하여 사용자 상호작용(interaction)을 수신하기 위해 맞춰진 클라이언트 GUI를, 각 사용자에게 제공할 수 있다.
채팅 대화(712)(도 7의 양방향 화살표로 표시됨)가 채팅 클라이언트 시스템(104-1, 104-2) 사이를 지나가듯이, 채팅 클라이언트 GUI 모듈(406-1, 406-2)은 각 채팅 클라이언트 시스템(104-1, 104-2)의 사용자에 의해 선택된 언어(암시적으로 또는 명시적으로)로 채팅 대화(712)를 제공할 수 있다. 도시된 바와 같이, 채팅 클라이언트 GUI 모듈(406-1)은, 출력 영역(708)에 제 1 언어(예, 영어)로 채팅 대화(712)를 제공하고 제 2 영역(710)에서 제 1 언어로 채팅 입력을 수신하도록 구성된 채팅 대화 박스(702)를 포함한다. 채팅 클라이언트 GUI 모듈(406-2)은, 출력 영역(720)에 제 2 언어(예, 불어)로 채팅 대화(712)를 제공하고 제 2 영역(722)에서 제 2 언어로 채팅 입력을 수신하도록 구성된 채팅 대화 박스(714)를 포함한다. 일부 실시예에서, 채팅 대화(712)가 대화 박스(702, 714)에 제공될 경우, 사용자가 채팅 대화(712)에 채팅 메시지를 입력하는 것과 관련된 사용자명(예, 사용자 온라인 식별자)의 표시를 포함할 수 있다.
도 7의 실시예에서, 채팅 클라이언트 시스템(104-1)에서 선택된 언어는, 영어이고 채팅 클라이언트 시스템(104-2)에서 선택된 언어는 불어이다. 따라서, 채팅 메시지(704)(“LOL”) 및 채팅 메시지(706)(“Who u laughin at?”)는, 채팅 클라이언트 GUI 모듈(406-1)의 대화 박스(702)에서 영어로 표시된다. 반면, 이들의 각 대응하는 채팅 메시지(716)(“MDR”) 및 채팅 메시지(718)(“Qui te fair rire?”)는, 채팅 클라이언트 GUI 모듈(406-2)의 대화 박스(714)에서 불어로 표시된다. 채팅 메시지(704, 706, 716 및 718)의 번역은, 여기에 설명된 다양한 시스템들 및 방법들을 통해 달성될 수 있다. 채팅 메시지(704, 706, 716 및 718)와 유사한 메시지들의 번역과 관련된 더 많은 내용은, 도 8 내지 도 10을 참조하여 설명된다.
도 8은 다양한 실시예에 따른, 예시적인 다중 언어 통신 방법(800)의 동작을 설명하는 순서도이다. 후술하는 바와 같이, 일부 실시예에서, 방법(800)은 채팅 클라이언트 시스템(104-1), 채팅 클라이언트 시스템(104-2) 및 CTT 시스템(114)(예, 채팅 서버(108))와 관련되어 동작들을 수행할 수 있다. 특히, 도 8은, 일부 실시예에 따라 텍스트 'LOL'을 포함하는 영어 채팅 메시지를 불어 채팅 메시지로 번역하는 것을 설명한다. 이러한 상황은, 제 1 채팅 클라이언트 시스템(104-1)의 사용자에 의해 사용되는 언어가 영어이고, 제 2 채팅 클라이언트 시스템(104-2)의 사용자에 의해 사용되는 언어가 불어일 때 발생할 수 있다. 일부 실시예에 따라, CTT 시스템(114)은 자동으로 채팅 클라이언트 시스템(104-1, 104-2)의 언어 선택/선호를 감지할 수 있다.
도시된 바와 같이, 동작(802)에서, 제 1 채팅 클라이언트 시스템(104-1)은, 전송하려는 영어 메시지를 제 2 채팅 클라이언트 시스템(104-2)로 제공한다(예를 들어, 채팅 호스트 시스템(112)을 통해). 영어 메시지는, 번역 처리를 위해 CTT 시스템(114) 의 CTT 제어 모듈(202)로 라우팅될 수 있다.
동작(804)에서, CTT 제어 모듈(202)은, 영어 채팅 메시지(“LOL”)에 대응하는 채팅 메시지를, 번역 데이터 저장부(210)로 질의하고, 그것은 불어로 미리 번역(pre-translated)된다. 응답으로, 동작(806)에서, 번역 데이터 저장부(210)는 영어 채팅 메시지(“LOL”)에 대응하는 불어 메시지(“MDR”)를 CTT 제어 모듈(202)로 회신한다. 다음으로, 동작(808)에서, CTT 제어 모듈(202)은, 대응하는 불어 채팅 메시지(“MDR”)를 제 2 채팅 클라이언트 시스템(104-2)으로 전송하는 것을 돕는다(예를 들어, CTT 시스템(114)은, 전송을 위해, 대응하는 불어 채팅 메시지를 채팅 호스트 시스템(112)으로 전달한다).
도 9는 다양한 실시예에 따른, 예시적인 다중 언어(multi-lingual) 통신 방법(900)의 동작을 나타내는 순서도이다. 후술하는 일부 실시예들에서, 상기 순서도를 통해 설명된 상기 방법(900)은 채팅 클라이언트 시스템(104-1), 채팅 클라이언트 시스템(104-2), CTT 시스템(114)(예를 들면, 채팅 서버(108)) 및 번역 모듈(116)(예를 들면, 번역 서버(110))과 관련된 동작을 수행할 수 있다. 특히, 도 9는 일부 실시예들에 따라, 텍스트 "LOL"로 구성된 영어 채팅 메시지를 불어 동의어 채팅 메시지로 번역하는 것을 설명한다. 도시된 도 8의 실시예와 다르게, 도 9는 변환 모듈(208)(예를 들어, CTT 시스템(114)) 및 번역 모듈(116)에 대한 사용을 도시한다.
도시된 바와 같이, 동작(902)에서, 제1 채팅 클라이언트 시스템(104-1)은 불어로 대화하는 사용자가 소지한 제2 채팅 클라이언트 시스템(104-2)으로 (예를 들어, 채팅 호스트 시스템(112)을 통하여) 전송용 영어 채팅 메시지를 제출할 수 있다. 상기 영어 채팅 메시지는 번역 처리를 위해 CTT 시스템(114)의 CTT 제어 모듈(202)로 라우팅된다.
동작(904)에서, 상기 CTT 제어 모듈(202)은 상기 영어 채팅 메시지("LOL")에 해당하는 불어 동의어 채팅 메시지를, 상기 번역 데이터 저장부(210)로 질의할 수 있다. 동작(906)에서, 번역 데이터 저장부(210)는 응답으로서, 상기 영어 채팅 메시지("LOL")와 대응되는 불어 채팅 메시지를 번역 데이터 저장부(210)가 보유하고 않음을 나타내는 질의 실패(query failure)를 CTT 제어 모듈(202)로 회신할 수 있다. 이 경우, 동작(908)에서, CTT 제어 모듈(202)은, 일부 실시예들에 따른 변환 처리를 진행하기 위해, 상기 영어 채팅 메시지를 변환 모듈(208)로 전달할 수 있다. 여기서 설명한 바와 같이, 상기 변환 모듈(208)은, 채팅 메시지를 추가적인 번역 처리를 위하여 보다 적합한 메시지로 변환하도록 구성되는, 다수의 변환 관련 모듈(932)을 포함할 수 있다.
동작(910)에서, 변환 모듈(208)의 채팅용어 모듈(302)은 상기 영어 채팅 메시지("LOL")를 변환된 영어 채팅 메시지("laugh out loud")로 변환할 수 있고, 추가적인 처리를 위해 CTT 제어 모듈(202)로 상기 변환된 영어 채팅 메시지를 회신할 수 있다. 당업자는 일부 실시예들에서, 상기 변환된 영어 채팅 메시지가 CTT 제어 모듈(202)로 회신되기 전에, 상기 영어 채팅 메시지가 상기 변환 모듈(208)의 추가적인 모듈에 의해 처리될 수 있음을 이해할 것이다.
동작(912)에서, CTT 제어 모듈(202)은 상기 변환된 영어 채팅 메시지("laugh out loud)와 대응하는 불어 동의어 채팅 메시지를, 번역 데이터 저장부(210)로 질의할 수 있다. 동작(914)에서, 번역 데이터 저장부(210)는 응답으로서, 상기 변환된 영어 채팅 메시지("laugh out loud")와 대응되는 불어 채팅 메시지를 상기 번역 데이터 저장부(210)가 보유하고 있지 않음을 나타내는 질의 실패를 CTT 제어 모듈(202)로 회신할 수 있다. 이 경우, 동작(916)에서, CTT 제어 모듈(202)은 일부 실시예들에 따른 기계 번역 처리를 위하여, 상기 변환된 영어 채팅 메시지를 번역 모듈(116)로 전송할 수 있다.
동작(918)에서, 상기 번역 모듈(116)은 상기 변환된 영어 채팅 메시지와 대응되는 기계 번역된 불어 채팅 메시지("mort de rire")를 회신할 수 있다. 상기 기계 번역된 결과인 불어 채팅 메시지("mort de rire")는 영어 채팅용어 채팅 메시지("LOL")의 변환된 번역의 예시이다.
동작(920)에서, CTT 제어 모듈(202)은 일부 실시예들에 따라, 상기 기계 번역된 불어 메시지가 추가적인 변환 처리되도록, 기계 번역된 불어 채팅 메시지("mort de rire")를 변환 모듈(208)로 제공할 수 있다. 여기에서 언급된 바와 같이, 상기 기계 번역된 텍스트는 더욱 개선된 불어로 번역하는 추가 변환 처리를 위해 제공될 수 있다. 예를 들어, 원본 영어 채팅 메시지가 영어 채팅용어를 포함하는 경우, 추가 변형 처리가 가능한 범위 내에서 불어 채팅용어를 추가될 수 있다. 따라서, 동작(922)에서, 변환 모듈(208)의 채팅용어 모듈(302)은 상기 기계 번역된 불어 채팅 메시지("mort de rire")를 변환된 불어 채팅 메시지("MDR")로 변환할 수 있고, 추가 처리를 위해 상기 변환된 불어 채팅 메시지를 CTT 제어 모듈(202)로 회신할 수 있다.
결국, 동작(924)에서, CTT 제어 모듈(202)은 불어 채팅 메시지("MDR")를 제2 채팅 클라이언트 시스템(104-2)으로 전송하는 것을 돕는다(예를 들어, CTT 시스템(114)은, 전송을 위해, 대응하는 불어 채팅 메시지를 채팅 호스트 시스템(112)으로 전달한다). 게다가, 동작(926)에서, CTT 제어 모듈(202)은 원본 영어 채팅 메시지("LOL")와 상기 번역된 불어 채팅 메시지("MDR") 간에 변환되고 번역된 번역 매핑(mapping)을 번역 데이터 저장부(210)에 저장할 수 있다. 상기 매핑이 번역 데이터 저장부(210)에 저장되면, 상기 매핑은 예를 들어 도 8에 도시된 바와 같이, 향후의 번역 속도를 향상시키기 위해 번역 엔트리(translation entries)로서 저장되어 이용될 수 있다. 여기서 언급된 바와 같이, 번역 데이터 저장부(210)는 변환되지 않은 번역과 변환된 번역의 매핑을 저장할 수 있다.
일부 실시예에서, CTT 제어 모듈(202)은 방법(900)이 동작하는 동안에, (변환되고 변환되지 않은) 동의어 번역 매핑을 저장할 수도 있다. 일부 실시예에서, 번역 매핑은 번역 데이터 저장부(210)에 원래 저장되지 않은 채팅 메시지(예를 들어, 동작(904)에서 도시된 채팅 메시지와 동작(912)에서 도시된 채팅 메시지)와 번역 데이터 저장부(210)의 검색 후의 동작 동안에 결정된 관련 메시지 간의 매핑(예를 들어, 결과를 회신받지 못한 번역 데이터 저장부(210)로의 질의 및 상기 질의 후에 변환 모듈(208) 및/또는 번역 모듈(116)을 통해 결정된 관련 채팅 메시지 간의 매핑)일 수 있다.
예를 들어, 도 9에 도시된 바와 같이, CTT 제어 모듈(202)은 동작 904에서 오리지널 영어 채팅 메시지("LOL")를 번역 데이터 저장부(210)로 질의하고, 동작 912에서 변환된 영어 채팅 메시지("laugh out loud")를 번역 데이터 저장부(210)로 질의하고, CTT 제어 모듈(202)은 (동작(906), 동작(914) 각각에서) 두 질의에 대해, 번역 데이터 저장부(210)로부터 어떠한 결과도 수신하지 않는다. 그러나 동작(916)에서, CTT 제어 모듈(202)은 결국 기계 번역을 위해, 변환된 영어 메시지("laugh out loud")를 기계 번역 모듈(116)로 전달하고 이에 대한 응답으로 동작(918)에서 기계 번역된 불어 채팅 메시지("mort de rire")를 수신한다. 이에 따라, 동작 928에서, CTT 제어 모듈(202)은 원본 영어 채팅 메시지("LOL")와 기계 번역된 불어 채팅 메시지("mort de rire") 간에 변환되고 번역된 번역 매핑을 저장할 수 있다. 마찬가지로, 동작(930)에서, CTT 제어 모듈(202)은 변환된 영어 채팅 메시지("laugh out loud")와 기계 번역된 불어 채팅 메시지("mort de rire") 간의 변환되고 번역된 번역 매핑을 번역 데이터 저장부(210)에 저장할 수 있다. 이러한 과정을 통해서, 다음 번의 방법(900)은 원본 영어 채팅 메시지("LOL") 또는 변환된 영어 채팅 메시지("laugh out loud")를 번역 데이터 저장부(210)로 질의하고, 번역 데이터 저장부(210)는 해당 메시지와 대응되며 변환된 번역을 제공할 것이다.
도10은 다양한 실시예에 따르는 예시적인 다중 언어 통신 방법의 동작을 나타내는 순서도이다. 후술하는 일부 실시예들에서, 상기 방법(1000)은 채팅 클라이언트 시스템(104-1), 채팅 클라이언트 시스템(104-2), CTT 시스템(114)(예를 들면, 채팅 서버(108)) 및 번역 모듈(116)(예를 들면, 번역 서버(110))와 관련된 동작을 수행할 수 있다. 특히, 도 10은 일부 실시예들에 따라, 텍스트 "Who u laughin at?"로 구성된 영어 채팅 메시지를 불어 채팅 메시지로 번역하는 것을 설명한다.
동작(1002)에서 도시된 바와 같이, 제1 채팅 클라이언트 시스템(104-1)은 제2 채팅 클라이언트 시스템(104-2)으로 (예를 들어, 채팅 호스트 시스템(112)을 통하여) 전송되는 영어 채팅 메시지를 전달할 수 있다. 상기 영어 채팅 메시지는 번역 처리를 위해 CTT 시스템(114)의 CTT 제어 모듈(202)로 라우팅된다.
동작(1004)에서, 상기 CTT 제어 모듈(202)은 상기 영어 채팅 메시지("Who u laughin at?")에 대응하는 불어 동의어 채팅 메시지를, 번역 데이터 저장부(210)로 질의할 수 있다. 동작 1006에서, 번역 데이터 저장부(210)는 응답으로서, 상기 영어 채팅 메시지("Who u laughin at?")와 대응되는 불어 채팅 메시지를 상기 데이터 저장 장치(210)가 보유하고 않음을 나타내는 질의 실패(query failure)를 CTT 제어 모듈(202)로 회신할 수 있다. 이 경우, 동작(1008)에서, CTT 제어 모듈(202)은, 일부 실시예들에 따른 변환 처리를 진행하기 위해, 상기 영어 채팅 메시지를 변환 모듈(208)로 전달할 수 있다. 여기서 설명한 바와 같이, 상기 변환 모듈(208)은, 추가적인 번역 처리를 위하여, 채팅 메시지를 보다 적합한 메시지로 변환하도록 구성되는 다수의 변환 관련 모듈(1036)을 포함할 수 있다.
동작(1010)에서, 변환 모듈(208)의 채팅용어 모듈(302)은 상기 영어 채팅 메시지("Who u laughin at?")를 변환된 영어 채팅 메시지("Who you laughin at?")로 변환할 수 있고, 추가 처리를 위해 맞춤법 검사 모듈(312)과 같은 변환 모듈(208)의 추가적인 모듈로 상기 변환된 영어 채팅 메시지를 전달할 수 있다.
논의된 바와 같이, 채팅용어 모듈(302)을 포함하는 변환 모듈(208)의 다양한 모듈은, 채팅 메시지에서 하나 이상의 단어 또는 구절을 식별하고, 상기 식별된 단어 또는 구절에 대한 대체 단어 또는 구절을 추천하도록 구성될 수 있다. 따라서, 당업자들은 일부 실시예에서, 변환 모듈(208)이 특정 모듈에 의해서 수행된/추천된 변환이, 채팅 메시지의 단어에서 구절 또는 구절에서 구절로의 변환을 포함할 수 있음을 이해할 것이다. 예를 들어, 동작(1010)에서, 채팅 용어 모듈(302)은 (단어 "laughin"을 "laughing"으로 치환하는 치환/추천 다음의) 변환 과정에서 구절 "who u"를 "who are you"로 치환/추천하여 영어 채팅 메시지("Who u laughin at?")를 변환된 영어 채팅 메시지("Who are you laughing at?")로 선택적으로 변환할 수 있다. 이러한 과정을 통해서, 채팅 용어 모듈(302)과 같은 변형 모듈(208)의 다양한 모듈들은, 각각의 변환에 있어서의 문법적인 개선사항을 제공할 것이고, 문법 개선을 실현하기 위하여 변환 모듈(208)에 대한 별도의 모듈에 대한 필요성을 제거할 수 있을 것이다.
일부 실시예에서, 영어 채팅 메시지가 변환 모듈(208)의 추가적인 모듈로 전달되기 전에, 채팅용어 모듈(302)은 동작(1010)에서 CTT 제어 모듈(202)로 상기 변환된 영어 채팅 메시지를 전달할 수 있다. 결국, CTT 제어 모듈(202)은 (동작(1012)에서) 번역 데이터 저장부(210)로 상기 변환된 영어 채팅 메시지(“Who you laughin at?")와 대응되는 불어 동의어 채팅 메시지를 질의할 수 있다. 동작 1014에서, 번역 데이터 저장부(210)는 응답으로서, 상기 변환된 영어 채팅 메시지("Who you laughin at?")와 대응되는 불어 채팅 메시지를 번역 데이터 저장부(210)가 보유하지 않음을 나타내는 질의 실패(query failure)를 CTT 제어 모듈(202)로 회신할 수 있다.
동작(1016)에서, 맞춤법 검사 모듈(312)은 동작(1018)에서 변환된 영어 채팅 메시지("Who you laughin at?")에 대한 맞춤법 검사 처리를 수행할 수 있다. 상기 맞춤법 검사 처리를 수행하는 동안에, 맞춤법 검사 모듈(312)은 상기 변환된 영어 채팅 메시지를 정정된 영어 채팅 메시지("Who you laughing at?")로 정정할 수 있고, 상기 정정된 영어 채팅 메시지를 CTT 제어 모듈(202)로 회신할 수 있다. 당업자는 일부 실시예에서, 상기 변환된 영어 채팅 메시지가 CTT 제어 모듈(202)로 회신되기 전에 변환 모듈(208)의 추가적인 모듈이 상기 정정된 영어 채팅 메시지를 처리할 수 있음을 이해할 것이다.
동작(1020)에서, CTT 제어 모듈(202)은 상기 정정된 영어 채팅 메시지(“Who you laughing at?")와 대응되는 불어 동의어 채팅 메시지를 번역 데이터 저장부(210)로 질의할 수 있다. 동작(1022)에서, 번역 데이터 저장부(210)는 응답으로서, 상기 정정된 영어 채팅 메시지("Who you laughing at?")와 대응되는 불어 채팅 메시지를 번역 데이터 저장부(210)가 보유하고 있지 않음을 나타내는 질의 실패를 CTT 제어 모듈(202)로 회신할 수 있다. 이 경우, 동작(1024)에서, CTT 제어 모듈(202)은 일부 실시예들에 따른 기계 번역 처리를 위하여, 상기 정정된 영어 채팅 메시지를 번역 모듈(116)로 전송할 수 있다.
동작(1026)에서, 상기 번역 모듈(116)은 상기 정정된 영어 채팅 메시지와 대응되는 기계 번역된 불어 채팅 메시지("Qui te fait rire?")를 회신할 수 있다. 동작(1028)에서, CTT 제어 모듈(202)은 일부 실시예들에 따라, 상기 기계 번역된 불어 메시지의 추가적인 변환 처리를 위해, 기계 번역된 불어 채팅 메시지("Qui te fait rire?")를 변환 모듈(208)로 제공할 수 있다.
여기서 언급된 바와 같이, 상기 기계 번역된 텍스트는 더욱 개선된 불어로 번역하는 추가 변환 처리를 위해 제공될 수 있다. 예를 들어, 원본 영어 채팅 메시지가 영어 채팅용어를 포함하는 경우, 추가 변형 처리가 가능한 범위 내에서 불어 채팅용어를 추가될 수 있다. 동작(1030)에서, 변환 모듈(208)은 (예를 들어, 변환 모듈(208)의 모듈이 상기 기계 번역된 불어 채팅 메시지에 어떠한 변경도 적용하지 않은 경우) 추가 처리를 위해, 상기 기계 번역되고 변경되지 않은 불어 채팅 메시지("Qui te fait rire?")를 CTT 제어 모듈(202)로 회신할 수 있다.
동작(1032)에서, CTT 제어 모듈(202)은 불어 채팅 메시지("Qui te fait rire?")를 제2 채팅 클라이언트 시스템(104-2)로 전송하는 것을 돕는다(예를 들어, CTT 시스템(114)은, 전송하고자 하는 상기 대응하는 불어 채팅 메시지를 채팅 호스트 시스템(112)으로 전달한다). 게다가, 동작(1034)에서, CTT 제어 모듈(202)은 원본 영어 채팅 메시지("Who u laughin at?")와 상기 번역된 불어 채팅 메시지("Qui te fait rire?") 간의 번역 매핑을 번역 데이터 저장부(210)에 저장할 수 있다. 여기서 설명한 바와 같이, 추가적인 동작들(도면에 도시되지 않음)에서, CTT 제어 모듈(202)은, 이전에 번역 데이터 저장부(210)에 실패한 질의 및 이 질의(예를 들어, 도 9의 동작 928 및 930과 유사한) 이후에 결정된 대응 메시지에 기초한, 동의어 번역 매핑도 번역 데이터 저장부(210)에 저장할 수 있다.
일부 실시예에 따르면, 변환 모듈(208)이 수행하는 변환 동작은 병렬적으로 소정의 변환 동작을 수행하는 것을 포함할 수 있고, 직렬적으로 소정의 변환 동작을 수행하는 것을 포함할 수 있다. 병렬적이고 직렬적으로 수행되는 변환 동작의 순서는 다양한 실시예들 사이에서 달라질 수 있다. 여기서 설명한 바와 같이, 변환 동작이 병렬적으로 수행되는 일부 실시예들은, 변환된 메시지가 어떠한 선례에 따르고 추가적인 처리를 위해 선택되는 것을 결정하기 위하여, 선택의 우선순위를 채택할 수 있다.
도11은 다양한 실시예에 따르는 예시적인 다중 언어 통신 방법의 동작을 나타내는 순서도이다. 후술하는 일부 실시예들에서, 상기 방법(1100)은 채팅 클라이언트 시스템(104-1), 채팅 클라이언트 시스템(104-2), (예를 들어, 채팅 서버(108)의) CTT 시스템(114) 및 (예를 들어, 번역 서버(110)의) 번역 모듈(116)과 관련된 동작을 수행할 수 있다. 특히, 도 1은 일부 실시예들에 따라, 텍스트 "Who u laughin at?"로 구성된 영어 채팅 메시지를 병렬적인 변환 동작을 통해 불어 채팅 메시지로 번역하는 것을 설명한다.
동작(1102)에서 도시된 바와 같이, 제1 채팅 클라이언트 시스템(104-1)은 제2 채팅 클라이언트 시스템(104-2)으로 (예를 들어, 채팅 호스트 시스템(112)을 통하여) 전송하고자 하는 영어 채팅 메시지를 전달할 수 있다. 상기 영어 채팅 메시지는 번역 처리를 위해 CTT 시스템(114)의 CTT 제어 모듈(202)로 라우팅될 수 있다.
동작(1104)에서, 상기 CTT 제어 모듈(202)은 상기 영어 채팅 메시지("Who u laughin at?")에 대응하는 불어 동의어 채팅 메시지를, 상기 번역 데이터 저장부(210)로 질의할 수 있다. 동작 1106에서, 번역 데이터 저장부(210)는 응답으로서, 상기 영어 채팅 메시지("Who u laughin at?")와 대응되는 불어 채팅 메시지를 번역 데이터 저장부(210)가 보유하고 않음을 나타내는 질의 실패(query failure)를 CTT 제어 모듈(202)로 회신할 수 있다.
이 경우, CTT 제어 모듈(202)은 일부 실시예들에 따른 변환 처리를 진행하기 위해, 변환 모듈(208)로 상기 영어 채팅 메시지를 전달할 수 있다. 여기서 설명한 바와 같이, 상기 변환 모듈(208)은, 채팅 메시지를 추가적인 번역 처리를 위한 보다 적합한 메시지로 변환하도록 구성되는 다수의 변환 관련 모듈(1130)을 포함할 수 있다. 도 11에 도시된 바와 같이, 동작(1108) 동안에, CTT 제어 모듈(202)은 상기 영어 채팅 메시지를 병렬적으로, 변환 모듈(208)에 포함된 둘 이상의 변환 관련 모듈들(1130)로 전달할 수 있다. 게다가, 동작(1108) 동안에, CTT 제어 모듈(202)은 병렬적으로 상기 변환 관련 모듈들(1130)로부터 결과를 수신하고, 변환 결과에 기초하여 번역 데이터 저장부(210)로 질의를 전달할 수 있다.
이에 따라, 동작(1110a)에서 CTT 제어 모듈(202)은 변환 처리를 위해, 상기 영어 채팅 메시지("Who u laughin at?")를 채팅용어 모듈(302)로 전달할 수 있다. 동작(1110b)에서, CTT 제어 모듈(202)은 변환 처리를 위해, 병렬적으로 상기 영어 채팅 메시지("Who u laughin at?")를 맞춤법 검사 모듈(312)로 전달할 수 있다. 이어서, CTT 제어 모듈(202)은 동작(1112a)에서 제1 변환 영어 채팅 메시지("Who you laughin at?")를 채팅용어 모듈(302)로부터 수신할 수 있고, 동시적으로 동작(1112b)에서 CTT 제어 모듈(202)은 맞춤법 검사 모듈(312)로부터 제2 변환 영어 채팅 메시지("Who u laughing at?")를 수신할 수 있다. 각각의 변환 처리 시간에 따라, 채팅용어 모듈(320), 맞춤법 검사 모듈(312) 및 다른 변환 모듈(1130)은 서로에 대해, 직렬적 또는 병렬적으로 CTT 제어 모듈(202)로 응답할 수 있다.
이어서, 동작(1114a)에서, CTT 제어 모듈(202)은 상기 제1 변환 영어 채팅 메시지("Who you laughin at?")와 대응하는 불어 동의어 채팅 메시지를 번역 데이터 저장부(210)로 질의할 수 있다. 동작(1114b)에서, CTT 제어 모듈(202)은 상기 제2 변환 영어 채팅 메시지("Who u laughing at?")와 대응하는 불어 동의 채팅 메시지를 번역 데이터 저장부(210)로 질의할 수 있다. 일부 실시예를 위해서, 동작(1114a) 동안에, CTT 제어 모듈(202)은 직렬적으로 또는 병렬적으로 번역 데이터 저장부(210)로 질의할 수 있다. 일부 실시예에서, 질의 타이밍은 변환 모듈(208)의 변환 관련 모듈들(1130) 각각이 응답을 회신한 시기에 의존될 수 있다. 도 11에 도시된 바와 같이, 번역 데이터 저장부(210)는 동작(1116a) 및 동작(1116b)에서 상기 질의에 대한 질의 실패(예컨대, <FAIL>)를 회신할 수 있다.
결국, CTT 제어 모듈(202)은 추가 처리를 위해, 병렬적으로 동작(1108)로부터 회신된 두 개 이상의 메시지에서 하나의 변환 메시지를 선택할 수 있다. 변환 관련 모듈들(1130)의 어느 하나가 변환된 메시지를 생성한 경우, CTT 제어 모듈(202)은 추가 처리를 위해 그 특정 변환된 메시지를 선택할 수 있다. 여기서 언급한 바와 같이, CTT 제어 모듈(202)은 선택 우선순위에 기초하여 변환된 메시지를 선택할 수 있고, 상기 선택 우선순위는 실시예들에 의해 선택된 변환/번역 전략에 따라 결정될 수 있다. 일부 실시예에서, 상기 선택의 우선순위는, 변환된 메시지가 가장 정식적인 내용(formal content)을 가지는지 여부, 변환된 메시지가 가장 변환된 것인지 여부, 또는 변환된 메시지가 기계 번역에 적합한 변환된 메시지를 생성할 높은 가능성을 가지는 것으로 알려진 변환 관련 모듈에 의해 변환한 결과인지 여부에 기초할 수 있다.
어느 한 변환된 메시지가 선택되면, 동작(1118)에서, CTT 제어 모듈(202)은 일부 실시예에 따른 기계 번역 처리를 위하여 상기 변환된 영어 채팅 메시지를 번역 모듈(116)로 전달할 수 있다. 예를 들어, 도 11에 도시된 바와 같이, CTT 제어 모듈(202)은 상기 번역 모듈(116)로 전달하기 위해, 채팅용어 모듈(302)에서 생성된 제1 변환 영어 채팅 메시지("Who you laughin at?")를 선택할 수 있다.
동작(1120)에서, 번역 모듈(116)은 (맞춤법이 틀린된 단어 "laughin"을 포함하고 있음에도 불구하고) 상기 제1 변환 영어 채팅 메시지와 대응되는 기계 번역된 불어 채팅 메시지("Qui te fait rire?")를 회신할 수 있다. 동작(1122)에서, CTT 제어 모듈(202)은 일부 실시예에 따라 기계 번역된 불어 채팅 메시지의 추가 변환 처리를 위해 상기 기계 번역된 불어 채팅 메시지("Qui te fait rire?")를 변환 모듈(208)로 전달할 수 있다.
여기서 설명한 바와 같이, 상기 기계 번역된 텍스트는, 더욱 개선된 텍스트 번역을 위하여, 추가적인 변환 처리로 제공될 수 있다. 예를 들어, 원본 영어 채팅 메시지가 영어 채팅용어를 포함하는 경우, 추가 변형 처리가 가능한 범위 내에서 불어 채팅용어를 추가할 수 있다. 동작(1124)에서, 변환 모듈(208)은 (예를 들어, 변환 모듈(208)의 모듈이 상기 기계 번역된 불어 채팅 메시지에 어떠한 변경도 적용하지 않은 경우) 추가 처리를 위해, 상기 기계 번역되고 변경되지 않은 불어 채팅 메시지("Qui te fait rire?")를 CTT 제어 모듈(202)로 회신할 수 있다.
동작(1126)에서, CTT 제어 모듈(202)은 불어 채팅 메시지("Qui te fait rire?")를 제2 채팅 클라이언트 시스템(104-2)로 전송하는 것을 돕는다(예를 들어, CTT 시스템(114)은, 전송하고자 하는 상기 대응하는 불어 채팅 메시지를 채팅 호스트 시스템(112)으로 전달한다). 게다가, 동작(1034)에서, CTT 제어 모듈(202)은 원본 영어 채팅 메시지("Who u laughin at?")와 상기 번역된 불어 채팅 메시지("Qui te fait rire?") 간의 번역 매핑을 번역 데이터 저장부(210)에 저장할 수 있다. 여기서 설명한 바와 같이, 추가적인 동작들(도면에 도시되지 않음)에서, CTT 제어 모듈(202)은 이전에 번역 데이터 저장부(210)로 실패한 질의 및 이 질의(예를 들어, 도 9의 동작 928 및 930과 유사한) 이후에 결정된 대응 메시지에 기초하는 동의어 번역 매핑도 번역 데이터 저장부(210)에 저장할 수 있다.
일부 실시예에서, 일부 변환 동작들은 병렬적으로 수행되고 다른 변환 동작들은 직렬적으로 수행되게 하는, 혼합된 직렬/병렬 방식으로 변환 동작들이 수행될 수 있다. 예를 들어, 도 11에 도시된 바와 같이, 영어 채팅 메시지("Who u laughin at?")는 동작(1110a) 및 동작(1110b)에서 병렬적으로, 채팅용어 모듈(302)과 철자 검사 모듈(312)로 전달될 수 있다. 이어서, (예를 들어, 선택 우선순위에 기초하여) 변환된 메시지들 중에서 어느 하나가 선택되면, 변환 모듈(208)의 다른 변환 관련 모듈들(1130)(예를 들어, 두문자어 모듈(304), 고유명사 모듈(306), 보통명사 모듈(308))은, 상기 선택된 변환 메시지를 병렬적으로 처리할 수 있다.
도 12는 디지털 장치(1200)의 예시적인 블록도이다. 상기 디지털 장치(1200)는, 버스(bus, 1214)를 통해 통신가능하게 연결되는, 프로세서(1202), 메모리 시스템(1204), 저장 시스템(1206), 통신 네트워크 인터페이스(1208), I/O 인터페이스(1210) 및 디스플레이 인터페이스(1212)를 포함한다. 상기 프로세서(1202)는 실행 가능한 명령어들(instructions)(예컨대, 프로그램들)을 실행하도록 구성된다. 일부 실시예에서, 상기 프로세서(1202)는 상기 실행 가능한 명령어들을 처리할 수 있는 임의의 프로세서 또는 회로를 포함한다.
상기 메모리 시스템(1204)은 데이터를 저장하도록 구성되는 임의의 메모리이다. 상기 메모리 시스템(1204)의 예로는, RAM 또는 ROM과 같은 저장 기기이다. 상기 메모리 시스템(1204)은 램 캐시(ram cache)를 포함할 수 있다. 다양한 실시예에서, 메모리 시스템(1204) 내에 저장된 데이터가 저장된다. 메모리 시스템(1204) 내에 저장된 데이터는 삭제되거나 궁극적으로 상기 저장 시스템(1206)으로 전송될 수 있다.
상기 저장 시스템(1206)은 데이터를 검색하고 저장하도록 구성된 임의의 저장매체이다. 상기 저장 시스템(1206)의 예로서, 플래시 드라이브(flash drive), 하드 드라이브(hard drive), 광 드라이브(optical drive) 및/또는 마그네틱 테이프(magnetic tape)이다. 일부 실시예에서, 상기 디지털 기기(1200)는 RAM으로 형성된 메모리 시스템(1204) 및 플래시 데이터로 형성되는 저장 시스템(1206)을 포함한다. 상기 메모리 시스템(1204) 및 저장 시스템(1206) 모두, 상기 프로세서(1202)를 포함하는 컴퓨터 프로세서가 실행할 수 있는 명령어 또는 프로그램을 저장하는 컴퓨터 판독 가능 매체를 포함할 수 있다.
상기 통신 네트워크 인터페이스(1208)(com. network interface)는 링크(1216)를 경유하여 네트워크(예컨대, 상기 컴퓨터 네트워크(106))와 결합될 수 있다. 상기 통신 네트워크 인터페이스(1208)는 예를 들어 이더넷 접속, 시리얼 접속, 병렬 접속 또는 ATA 접속을 통한 통신을 지원할 수 있다. 또한, 상기 통신 네트워크 인터페이스(1208)는 무선 통신(예를 들어, 802.11 a/b/g/n, 와이맥스)를 지원할 수 있다. 상기 통신 네트워크 인터페이스(1208)가 많은 유선 또는 무선 규격을 지원할 수 있음을 당업자에게 명확할 것이다.
선택적인(optional) 입출력(I/O) 인터페이스(1210)는 사용자로부터 입력을 수신하고 데이터를 출력하는 임의의 기기이다. 상기 선택적인 입출력 인터페이스(1210)는 디스플레이하는 그래픽과 데이터를 출력하도록 구성되는 임의의 기기이다. 일례로서, 상기 입출력 인터페이스(1210)는 그래픽 어댑터이다.
당업자는 상기 디지털 장치(1200)의 하드웨어 구성요소가 도 12에 도시된 것에 한정되지 않음을 이해할 것이다. 디지털 장치(1200)는 도시된 것보다, 더 많거나 더 적은 하드웨어 구성요소를 포함할 수 있다. 또한, 하드웨어 구성요소들은 여기에 설명된 다양한 실시예들의 범위 내에서 유지되고, 기능을 공유할 수 있다. 일례로서, 인코딩 및/또는 디코딩은 상기 프로세서(1202) 및/또는 CPU에 위치하는 보조 프로세서(예컨대, Nvidia®)가 수행할 수 있다.
상술한 기능들 및 구성요소들은, 컴퓨터 판독 매체와 같은 저장 매체에 저장된 명령어들로 구성될 수 있다. 상기 명령어들은 프로세서에 의해 검색되고 실행될 수 있다. 명령어들의 몇 가지 예로서, 소프트웨어, 프로그램 코드 및 펌웨어가 있다. 저장 매체의 몇 가지 예로서, 메모리 기기, 테이프, 디스크, 집적 회로 및 서버가 있다. 상기 명령어들은 일부 실시예에 따라 프로세서에 의해 실행될 때에 동작하여, 상기 프로세서로 해당 동작을 지시한다. 당업자들은 명령어들, 프로세서 및 저장 매체에 대해서 잘 알고 있다.
다양한 실시예가 예로서 본원에 설명된다. 본 발명의 벗어나지 않은 범위에서, 다양한 변형이 나타날 수 있고 다른 실시예들이 사용될 수 있음을 당업자에게 명백할 것이다. 예시적인 실시예에 따른 다양한 변형은 본 발명에 속한 것으로 이해되어야 한다.

Claims (33)

  1. 제1 언어와 제2 언어를 식별하는 단계;
    제1 채팅 클라이언트 시스템에서 상기 제1 언어로 통신하는 제1 인물로부터, 상기 제1 언어로 된 초기메시지(initial message)를 수신하는 단계;
    데이터 저장부로 상기 제2 언어로 된 제1 대응 메시지를 질의하는 것으로, 상기 제1 대응 메시지는 상기 제1 언어의 상기 초기 메시지에 기반하는 단계;
    상기 데이터 저장부가 상기 제1 대응 메시지를 포함하면, 제2 채팅 클라이언트 시스템에서 상기 제2 언어로 통신하는 제2 인물에 대한, 상기 제1 대응 메시지의 전송을 지원(assist)하는 단계;
    상기 데이터 저장부가 상기 제1 대응 메시지를 포함하지 않으면:
    상기 초기 메시지의 적어도 일 부분을, 상기 제1 언어로 된 변환된 메시지로 변환하기 위한 시도를 수행하기 위하여, 변환엔진(transformation engine)을 활용하는 단계; 및
    상기 데이터 저장부로 상기 제2 언어로 된 제2 대응 메시지를 질의하는 것으로, 상기 제2 대응 메시지는 상기 제1 언어로 된 상기 변환된 메시지에 기반하는 단계를 포함하는 방법.
  2. 제1항에 있어서,
    상기 초기 메시지 또는 상기 변환된 메시지를, 상기 제2 언어로 된 제3 대응 메시지로의 번역하는 것을 지원하는 단계를 더 포함하는 방법.
  3. 제2항에 있어서,
    상기 데이터 저장부가 상기 제2 대응 메시지를 포함하지 않으면, 상기 변환된 메시지는 상기 제2 언어로 된 상기 제3 대응 메시지로 번역되는 방법.
  4. 제2항에 있어서,
    상기 변환 엔진이 상기 초기메시지의 적어도 일부분을 변환하지 못하면, 상기 초기메시지는 상기 제2 언어로 된 상기 제3 대응메시지로 번역되는 방법.
  5. 제1항에 있어서, 상기 초기 메시지의 일 부분을 변환하는 것은,
    상기 초기 메시지 내의 채팅용어(chatspeak) 단어 또는 구절을, 식별하는 단계; 및
    상기 채팅용어 단어 또는 구절을, 채팅용어가 아닌(non-chatspeak) 단어 또는 구절로 치환하는 단계를 포함하는 방법.
  6. 제1항에 있어서, 상기 초기 메시지의 일 부분을 변환하는 것은,
    상기 초기 메시지의 일 부분에 대한 맞춤법 검사를 수행하는 단계를 포함하는 방법.
  7. 제1항에 있어서, 상기 초기 메시지의 일 부분을 변환하는 것은,
    상기 초기 메시지의 일 부분에 포함된 약어(abbreviation)를 식별하는 단계; 및
    상기 약어를, 상기 약어에 대응하는 단어 또는 구절로 치환하는 단계를 포함하는 방법.
  8. 제1항에 있어서, 상기 초기 메시지의 일부분을 변환하는 것은,
    상기 초기 메시지의 일 부분에 포함된 두문자어(acronym)을 식별하는 단계; 및
    상기 두문자어를, 상기 두문자어에 대응하는 단어 또는 구절로 치환하는 단계를 포함하는 방법.
  9. 제1항에 있어서, 상기 초기 메시지의 일부분을 변환하는 것은,
    상기 초기 메시지의 일 부분에 포함된 구어체(colloquial)의 단어 또는 구절을 식별하는 단계; 및
    상기 구어체의 단어 또는 구절을, 상기 구어체의 단어 또는 구절이 나타내는 단어 또는 구절로 치환하는 단계를 포함하는 방법.
  10. 제1항에 있어서, 상기 초기 메시지의 일 부분을 변환하는 것은,
    상기 초기 메시지의 일 부분에 포함된 비속어(profane)의 단어 또는 구절을 식별하는 단계; 및
    상기 비속어의 단어 또는 구절을, 비속어가 아닌 단어 또는 구절로 치환하거나, 상기 비속어의 단어 또는 구절을 삭제하는 단계를 포함하는 방법.
  11. 제1항에 있어서, 상기 초기 메시지는 텍스트(text)를 포함하는 방법.
  12. 제1항에 있어서, 상기 초기 메시지는 이모티콘(emoticon)을 포함하는 방법.
  13. 제1항에 있어서, 상기 초기 메시지는 더 큰 메시지의 일부분인 방법.
  14. 제1항에 있어서, 상기 초기 메시지의 일부분을 변환하는 것은, 번역하지 않도록 상기 초기 메시지의 일 부분에 표시하는 것을 포함하는 방법.
  15. 제14항에 있어서, 상기 표시된 부분은, 고유명사(proper noun), 보통명사(common noun), 지소사(diminutive), 약어(abbreviation) 또는 두문자어(acronym)를 포함하는 방법.
  16. 제1항에 있어서, 상기 데이터 저장부는, 변환되지 않은 번역 또는 변환된 번역을 포함하는 방법.
  17. 제1 채팅 클라이언트 시스템에서 제1 언어로 통신하는 제1 인물에 의하여 사용되는 제1 언어를 식별하고, 제2 채팅 클라이언트 시스템에서 제2 언어로 통신하는 제2 인물에 의하여 사용되는 제2 언어를 식별하는 언어 모듈(language module);
    상기 제1 채팅 클라이언트 시스템으로부터 메시지들을 수신하는 통신 모듈(communication module);
    메시지들 사이의 매핑(mapping)를 저장하는 데이터 저장부(data store);
    메시지들을 변환하는 변환모듈(transform module); 및
    상기 시스템에 영향을 주는 제어부(controller)를 포함하고,
    상기 제어부는
    상기 제1 언어와 제2 언어를 식별하기 위하여 상기 언어모듈을 활용하고,
    상기 제1 채팅 클라이언트 시스템으로부터 제1 언어로 된 초기 메시지를 수신하기 위하여 상기 통신모듈을 활용하며,
    상기 데이터 저장부에 상기 제2 언어로 된 1 대응 메시지를 질의하는 것으로, 상기 제1 대응 메시지는 제1 언어로 된 상기 초기 메시지에 기반하며,
    상기 데이터 저장부에 상기 제1 대응 메시지가 포함되면, 상기 제2 채팅 클라이언트 시스템에 상기 제1 대응 메시지를 전송하는 것을 지원하고,
    상기 데이터 저장부에 상기 제1 대응 메시지가 포함되지 않으면:
    상기 초기 메시지의 적어도 일부분을, 상기 제1 언어로 된 변환된 메시지로 변환하기 위한 시도를 수행하기 위하여, 상기 변환 모듈을 활용하고,
    상기 제2 언어로 된 제2 대응 메시지를 상기 데이터 저장부에 질의하며, 상기 제2 대응 메시지는 상기 제1 언어로 된 상기 변환된 메시지에 기반하는 것인 시스템.
  18. 제17항에 있어서,
    상기 초기 메시지 또는 상기 변환된 메시지를, 상기 제2 언어로 된 제3 대응메시지로 번역하는 것을 지원하는 번역 모듈을 더 포함하는 시스템.
  19. 제18항에 있어서, 상기 데이터 저장부가 상기 제2 대응 메시지를 포함하지 않으면, 상기 변환된 메시지는 상기 제2 언어로 된 상기 제3 대응 메시지로 번역되는 시스템.
  20. 제18항에 있어서, 상기 변환 엔진이 상기 초기 메시지의 적어도 일 부분을 변환하지 못하면, 상기 초기 메시지는 상기 제2 언어로 된 제3 대응 메시지로 번역되는 시스템.
  21. 제17항에 있어서, 상기 초기 메시지의 일 부분을 변환하는 것은:
    상기 초기 메시지 내의 채팅용어(chatspeak) 단어 또는 구절을 식별하고,
    상기 채팅 용어 단어 또는 구절을, 채팅용어가 아닌(non-chatspeak) 단어 또는 구절로 치환하는 것을 포함하는 시스템.
  22. 제17항에 있어서, 상기 초기 메시지의 일 부분을 변환하는 것은,
    상기 초기 메시지의 일 부분에 대한 맞춤법 검사를 포함하는 시스템.
  23. 제17항에 있어서, 상기 초기 메시지의 일 부분을 변환하는 것은,
    상기 초기 메시지의 일 부분에 포함된 약어(abbreviation)를 식별하고,
    상기 약어를, 상기 약어에 대응하는 단어 또는 구절로 치환하는 시스템.
  24. 제17항에 있어서, 상기 초기 메시지의 일 부분을 변환하는 것은,
    상기 초기 메시지의 일 부분에 포함된 두문자어(acronym)를 식별하고,
    상기 두문자어를, 상기 두문자어에 대응하는 단어 또는 구절로 치환하는 시스템.
  25. 제17항에 있어서, 상기 초기 메시지의 일 부분을 변환하는 것은,
    상기 초기 메시지의 일 부분에 포함된 구어체(colloquial)의 단어 또는 구절을 식별하고,
    상기 구어체의 단어 또는 구절을, 상기 구어체의 단어 또는 구절이 나타내는 단어 또는 구절로 치환하는 시스템.
  26. 제17항에 있어서, 상기 초기 메시지의 일 부분을 변환하는 것은,
    상기 초기 메시지의 일 부분에 포함된 비속어(profane)의 단어 또는 구절을 식별하고,
    상기 비속어의 단어 또는 구절을, 비속어가 아닌 단어 또는 구절로 치환하거나, 상기 비속어 단어 또는 구절을 삭제하는 시스템.
  27. 제17항에 있어서, 상기 초기 메시지는 텍스트(text)를 포함하는 시스템.
  28. 제17항에 있어서, 상기 초기 메시지는 이모티콘(emoticon)을 포함하는 시스템.
  29. 제17항에 있어서, 상기 초기 메시지는 더 큰 메시지의 일 부분인 시스템.
  30. 제17항에 있어서, 상기 초기 메시지의 일 부분을 변환하는 것은, 번역하지 않도록 상기 초기 메시지의 일 부분에 표시하는 것을 포함하는 시스템.
  31. 제30항에 있어서, 상기 표시된 부분은, 고유명사(proper noun), 보통명사(common noun), 지소사(diminutive), 약어(abbreviation) 또는 두문자어(acronym)를 포함하는 시스템.
  32. 제30항에 있어서, 상기 데이터 저장부는 변환되지 않은 번역 또는 변환된 번역을 포함하는 시스템.
  33. 제1 언어와 제2 언어를 식별하는 수단;
    제1 채팅 클라이언트 시스템에서 상기 제1 언어로 통신하는 제1 인물로부터 상기 제1 언어로 된 초기 메시지를 수신하는 수단;
    데이터 저장부로 상기 제2 언어로 된 제1 대응 메시지를 질의하는 것으로, 상기 제1 대응 메시지는 상기 제1 언어의 상기 초기 메시지에 기반하는 것인 수단;
    상기 데이터 저장부가 상기 제1 대응 메시지를 포함하면, 상기 제1 대응 메시지를, 제2 채팅 클라이언트 시스템에서 상기 제2 언어로 통신하는 제2 인물에게 전송하는 것을 지원하는 수단;
    상기 데이터 저장부가 상기 제1 대응 메시지를 포함하지 않으면, 상기 초기 메시지의 적어도 일 부분을, 상기 제1 언어로 된 변환된 메시지로 변환을 시도하기 위하여, 변환엔진을 활용하는 수단; 및
    상기 데이터 저장부가 상기 제1 대응 메시지를 포함하지 않으면, 상기 데이터 저장부로 상기 제2 언어로 된 제2 대응 메시지를 질의하는 것으로서, 상기 제2 대응 메시지는 상기 제1 언어로 된 상기 변환된 메시지에 기반하는 수단을 포함하는 시스템.
KR1020157024532A 2013-02-08 2014-02-10 다중 사용자 다중 언어 통신 시스템 및 방법 KR20150119048A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/763,565 US9600473B2 (en) 2013-02-08 2013-02-08 Systems and methods for multi-user multi-lingual communications
US13/763,565 2013-02-08
PCT/US2014/015632 WO2014124397A1 (en) 2013-02-08 2014-02-10 Systems and methods for multi-user multi-lingual communications

Publications (1)

Publication Number Publication Date
KR20150119048A true KR20150119048A (ko) 2015-10-23

Family

ID=51298057

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157024532A KR20150119048A (ko) 2013-02-08 2014-02-10 다중 사용자 다중 언어 통신 시스템 및 방법

Country Status (13)

Country Link
US (6) US9600473B2 (ko)
EP (2) EP2954522B1 (ko)
JP (2) JP6224735B2 (ko)
KR (1) KR20150119048A (ko)
CN (2) CN110046360A (ko)
AU (2) AU2014214652B2 (ko)
BR (1) BR112015019162A2 (ko)
CA (1) CA2900639A1 (ko)
HK (1) HK1212090A1 (ko)
IL (1) IL240424A0 (ko)
RU (1) RU2015138140A (ko)
SG (2) SG10201900496TA (ko)
WO (1) WO2014124397A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210098142A (ko) * 2020-01-31 2021-08-10 대구대학교 산학협력단 실시간 채팅 장치

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US7904595B2 (en) 2001-01-18 2011-03-08 Sdl International America Incorporated Globalization management system and method therefor
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US10657540B2 (en) 2011-01-29 2020-05-19 Sdl Netherlands B.V. Systems, methods, and media for web content management
US9547626B2 (en) 2011-01-29 2017-01-17 Sdl Plc Systems, methods, and media for managing ambient adaptability of web applications and web services
US10580015B2 (en) 2011-02-25 2020-03-03 Sdl Netherlands B.V. Systems, methods, and media for executing and optimizing online marketing initiatives
US10140320B2 (en) 2011-02-28 2018-11-27 Sdl Inc. Systems, methods, and media for generating analytical data
US9984054B2 (en) 2011-08-24 2018-05-29 Sdl Inc. Web interface including the review and manipulation of a web document and utilizing permission based control
US9773270B2 (en) 2012-05-11 2017-09-26 Fredhopper B.V. Method and system for recommending products based on a ranking cocktail
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US11308528B2 (en) 2012-09-14 2022-04-19 Sdl Netherlands B.V. Blueprinting of multimedia assets
US10452740B2 (en) 2012-09-14 2019-10-22 Sdl Netherlands B.V. External content libraries
US11386186B2 (en) 2012-09-14 2022-07-12 Sdl Netherlands B.V. External content library connector systems and methods
US9916306B2 (en) 2012-10-19 2018-03-13 Sdl Inc. Statistical linguistic analysis of source content
US9231898B2 (en) 2013-02-08 2016-01-05 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9298703B2 (en) 2013-02-08 2016-03-29 Machine Zone, Inc. Systems and methods for incentivizing user feedback for translation processing
US9031829B2 (en) 2013-02-08 2015-05-12 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8996352B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US9600473B2 (en) 2013-02-08 2017-03-21 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8990068B2 (en) 2013-02-08 2015-03-24 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US10650103B2 (en) 2013-02-08 2020-05-12 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
US9342503B1 (en) * 2013-03-12 2016-05-17 Amazon Technologies, Inc. Correlation across languages
US9313284B2 (en) 2013-03-14 2016-04-12 International Business Machines Corporation Smart posting with data analytics and semantic analysis to improve a message posted to a social media service
US9183195B2 (en) * 2013-03-15 2015-11-10 Disney Enterprises, Inc. Autocorrecting text for the purpose of matching words from an approved corpus
US9477375B1 (en) * 2014-08-18 2016-10-25 Google Inc. Techniques for insertion of content into chat communication
US9922015B2 (en) 2014-10-09 2018-03-20 International Business Machines Corporation System for handling abbreviation related text using profiles of the sender and the recipient
US10162811B2 (en) 2014-10-17 2018-12-25 Mz Ip Holdings, Llc Systems and methods for language detection
EP3207465A1 (en) * 2014-10-17 2017-08-23 Machine Zone, Inc. System and method for language detection
US9372848B2 (en) 2014-10-17 2016-06-21 Machine Zone, Inc. Systems and methods for language detection
JP6373198B2 (ja) * 2015-01-28 2018-08-15 日本電信電話株式会社 テキスト変換装置、方法、及びプログラム
US10354006B2 (en) * 2015-10-26 2019-07-16 International Business Machines Corporation System, method, and recording medium for web application programming interface recommendation with consumer provided content
US10614167B2 (en) 2015-10-30 2020-04-07 Sdl Plc Translation review workflow systems and methods
JP6728950B2 (ja) * 2015-12-07 2020-07-22 株式会社リコー 情報処理システム、端末装置及びプログラム
US10765956B2 (en) 2016-01-07 2020-09-08 Machine Zone Inc. Named entity recognition on chat data
US9805030B2 (en) * 2016-01-21 2017-10-31 Language Line Services, Inc. Configuration for dynamically displaying language interpretation/translation modalities
CN105763424B (zh) * 2016-03-22 2019-05-07 网易有道信息技术(北京)有限公司 一种文字信息处理方法和装置
WO2018040062A1 (en) * 2016-09-02 2018-03-08 Baidu.Com Times Technology (Beijing) Co., Ltd. Method and system for generating phrase blacklist to prevent certain content from appearing in search result in response to search queries
US10210147B2 (en) 2016-09-07 2019-02-19 International Business Machines Corporation System and method to minimally reduce characters in character limiting scenarios
RU2660600C2 (ru) * 2016-10-10 2018-07-06 Федеральное государственное бюджетное образовательное учреждение высшего образования "Казанский национальный исследовательский технический университет им. А.Н. Туполева-КАИ" (КНИТУ-КАИ) Способ общения глухих (слабослышащих) со слышащими
CN112215016A (zh) * 2017-01-17 2021-01-12 乐夫兰度株式会社 多语言沟通系统及多语言沟通提供方法
KR20190134736A (ko) * 2017-04-05 2019-12-04 티스트리트 피티와이 리미티드 언어 번역 지원기
US11468234B2 (en) 2017-06-26 2022-10-11 International Business Machines Corporation Identifying linguistic replacements to improve textual message effectiveness
WO2019060353A1 (en) 2017-09-21 2019-03-28 Mz Ip Holdings, Llc SYSTEM AND METHOD FOR TRANSLATION OF KEYBOARD MESSAGES
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US11314937B2 (en) * 2017-12-14 2022-04-26 Yahoo Assets Llc Controlling a graphical user interface to present a message comprising a representation of an item
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US20190260694A1 (en) 2018-02-16 2019-08-22 Mz Ip Holdings, Llc System and method for chat community question answering
US10803257B2 (en) * 2018-03-22 2020-10-13 Microsoft Technology Licensing, Llc Machine translation locking using sequence-based lock/unlock classification
JP6372947B1 (ja) * 2018-05-14 2018-08-15 Jeインターナショナル株式会社 チャットシステム、チャット方法、およびプログラム
US11151186B2 (en) * 2018-06-18 2021-10-19 Disney Enterprises, Inc. Systems and methods for presenting an interactive narrative
CN110619126A (zh) * 2018-06-20 2019-12-27 钉钉控股(开曼)有限公司 消息处理方法、装置、终端设备
US10664656B2 (en) * 2018-06-20 2020-05-26 Vade Secure Inc. Methods, devices and systems for data augmentation to improve fraud detection
JP2019219891A (ja) * 2018-06-20 2019-12-26 Kotozna株式会社 メッセージ送受信システム
US11030413B2 (en) * 2018-06-27 2021-06-08 International Business Machines Corporation Recommending message wording based on analysis of prior group usage
US11115302B1 (en) * 2018-09-17 2021-09-07 Amazon Technologies, Inc. Self-service metric publication in a computer network
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
JP6739811B2 (ja) * 2019-01-22 2020-08-12 株式会社インタラクティブソリューションズ 発言禁止用語に対し注意を喚起するためのプレゼンテーション支援装置
US20200257544A1 (en) * 2019-02-07 2020-08-13 Goldmine World, Inc. Personalized language conversion device for automatic translation of software interfaces
JP2019215876A (ja) * 2019-07-03 2019-12-19 エム・ゼット・アイ・ピィ・ホールディングス・リミテッド・ライアビリティ・カンパニーMz Ip Holdings, Llc 言語検出を行うためのシステムおよび方法
US11475226B2 (en) * 2020-09-21 2022-10-18 International Business Machines Corporation Real-time optimized translation
CN114650267A (zh) * 2020-12-21 2022-06-21 全星泌 用于预防层间噪音纠纷的层间邻居通信方法及通信设备
US12026465B2 (en) 2020-12-22 2024-07-02 Direct Cursus Technology L.L.C Method and system for classifying word as obscene word
US12052392B2 (en) * 2021-03-16 2024-07-30 Lenovo (Singapore) Pte. Ltd. Resolving bad audio during conference call
CN113160827A (zh) * 2021-04-07 2021-07-23 深圳鱼亮科技有限公司 一种基于多语言模型的语音转写系统及方法
CN113591460B (zh) * 2021-07-02 2024-06-18 中译语通科技股份有限公司 一种基于迭代知识迁移的机器翻译风格迁移性能提升方法
CN113609870B (zh) * 2021-07-23 2024-06-07 深圳市元征科技股份有限公司 翻译方法、装置、服务器及可读存储介质
CN113609368B (zh) * 2021-07-26 2023-09-01 腾讯科技(深圳)有限公司 游戏帐号的查询结果显示方法、装置、设备和存储介质
KR20230016398A (ko) * 2021-07-26 2023-02-02 삼성전자주식회사 부적절한 대답을 관리하는 전자 장치 및 이의 동작 방법
CN114124864B (zh) * 2021-09-28 2023-07-07 维沃移动通信有限公司 消息处理方法、装置
US11973611B2 (en) * 2022-07-14 2024-04-30 Lenovo (Singapore) Pte. Ltd. Methods, systems, and program products for identifying location of problems of delivered audio

Family Cites Families (297)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4706212A (en) 1971-08-31 1987-11-10 Toma Peter P Method using a programmed digital computer system for translation between natural languages
JPS5748159A (en) 1980-09-03 1982-03-19 Sharp Corp Electronic interpreter
JPS57201958A (en) 1981-06-05 1982-12-10 Hitachi Ltd Device and method for interpretation between natural languages
US5289375A (en) 1990-01-22 1994-02-22 Sharp Kabushiki Kaisha Translation machine
JP2836159B2 (ja) * 1990-01-30 1998-12-14 株式会社日立製作所 同時通訳向き音声認識システムおよびその音声認識方法
FR2681750A1 (fr) 1991-09-20 1993-03-26 Thomson Csf Procede de compression d'images.
US6278967B1 (en) 1992-08-31 2001-08-21 Logovista Corporation Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
US5603031A (en) 1993-07-08 1997-02-11 General Magic, Inc. System and method for distributed computation based upon the movement, execution, and interaction of processes in a network
US6304841B1 (en) 1993-10-28 2001-10-16 International Business Machines Corporation Automatic construction of conditional exponential models from elementary features
US6292769B1 (en) 1995-02-14 2001-09-18 America Online, Inc. System for automated translation of speech
JP3161942B2 (ja) 1995-06-14 2001-04-25 シャープ株式会社 訳振り機械翻訳装置
WO1998015894A1 (en) * 1996-10-09 1998-04-16 At & T Corp. Method to produce application oriented languages
US6182029B1 (en) 1996-10-28 2001-01-30 The Trustees Of Columbia University In The City Of New York System and method for language extraction and encoding utilizing the parsing of text data in accordance with domain parameters
US5884246A (en) 1996-12-04 1999-03-16 Transgate Intellectual Properties Ltd. System and method for transparent translation of electronically transmitted messages
GB9625284D0 (en) 1996-12-04 1997-01-22 Canon Kk A data processing method and apparatus for identifying a classification to which data belongs
US6292770B1 (en) 1997-01-22 2001-09-18 International Business Machines Corporation Japanese language user interface for messaging system
US5991710A (en) 1997-05-20 1999-11-23 International Business Machines Corporation Statistical translation system with features based on phrases or groups of words
US6415250B1 (en) 1997-06-18 2002-07-02 Novell, Inc. System and method for identifying language using morphologically-based techniques
US6157905A (en) 1997-12-11 2000-12-05 Microsoft Corporation Identifying language and character set of data representing text
US6424983B1 (en) 1998-05-26 2002-07-23 Global Information Research And Technologies, Llc Spelling and grammar checking system
TW463503B (en) 1998-08-26 2001-11-11 United Video Properties Inc Television chat system
US6285978B1 (en) 1998-09-24 2001-09-04 International Business Machines Corporation System and method for estimating accuracy of an automatic natural language translation
US6167369A (en) 1998-12-23 2000-12-26 Xerox Company Automatic language identification using both N-gram and word information
US6269189B1 (en) 1998-12-29 2001-07-31 Xerox Corporation Finding selected character strings in text and providing information relating to the selected character strings
US6770572B1 (en) 1999-01-26 2004-08-03 Alliedsignal Inc. Use of multifunctional si-based oligomer/polymer for the surface modification of nanoporous silica films
WO2000057320A2 (en) 1999-03-19 2000-09-28 Trados Gmbh Workflow management system
US7475343B1 (en) * 1999-05-11 2009-01-06 Mielenhausen Thomas C Data processing apparatus and method for converting words to abbreviations, converting abbreviations to words, and selecting abbreviations for insertion into text
WO2000074240A1 (en) 1999-05-27 2000-12-07 America Online Keyboard system with automatic correction
US9053500B2 (en) 1999-06-30 2015-06-09 Blackboard Inc. Internet-based education support system and method with multi-language capability
US6278969B1 (en) 1999-08-18 2001-08-21 International Business Machines Corp. Method and system for improving machine translation accuracy using translation memory
US6722989B1 (en) 1999-10-07 2004-04-20 Sony Computer Entertainment Inc. Virtual pet game in which the virtual pet can converse with the player and learn new words and phrases from these conversations
US7165019B1 (en) 1999-11-05 2007-01-16 Microsoft Corporation Language input architecture for converting one text form to another text form with modeless entry
US6848080B1 (en) 1999-11-05 2005-01-25 Microsoft Corporation Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors
US20010029455A1 (en) 2000-03-31 2001-10-11 Chin Jeffrey J. Method and apparatus for providing multilingual translation over a network
AU2001261506A1 (en) 2000-05-11 2001-11-20 University Of Southern California Discourse parsing and summarization
US7865358B2 (en) * 2000-06-26 2011-01-04 Oracle International Corporation Multi-user functionality for converting data from a first form to a second form
JP3982736B2 (ja) 2000-06-30 2007-09-26 沖電気工業株式会社 翻訳システム
JP4011268B2 (ja) 2000-07-05 2007-11-21 株式会社アイアイエス 多言語翻訳システム
JP2002041432A (ja) 2000-07-25 2002-02-08 Oki Electric Ind Co Ltd チャットシステム,端末装置,サーバ装置及び媒体
US20020037767A1 (en) 2000-08-17 2002-03-28 Steven Ebin Gambling system and method through a computer network
US6704699B2 (en) 2000-09-05 2004-03-09 Einat H. Nir Language acquisition aide
JP2002082987A (ja) 2000-09-06 2002-03-22 Seiko Epson Corp 文書情報閲読支援装置、ディジタルコンテンツ作成システム、ディジタルコンテンツ配信システム及び記憶媒体
US20040205671A1 (en) 2000-09-13 2004-10-14 Tatsuya Sukehiro Natural-language processing system
US6922809B2 (en) 2001-01-25 2005-07-26 International Business Machines Corporation Method and apparatus providing capitalization recovery for text
US8874431B2 (en) 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US20020169592A1 (en) 2001-05-11 2002-11-14 Aityan Sergey Khachatur Open environment for real-time multilingual communication
US6993474B2 (en) 2001-05-17 2006-01-31 Curry David G Interactive conversational speech communicator method and system
AU2002314933A1 (en) 2001-05-30 2002-12-09 Cameronsound, Inc. Language independent and voice operated information management system
US20020198699A1 (en) 2001-06-21 2002-12-26 International Business Machines Corporation Apparatus, system and method for providing open source language translation
JP2003006255A (ja) 2001-06-22 2003-01-10 Fujitsu Ltd Hdl自動修正装置およびhdl自動修正プログラム並びに同プログラムを記録したコンピュータ読取可能な記録媒体
JP2003022265A (ja) 2001-07-06 2003-01-24 Nec Corp 言語自動翻訳システム
JP2003054841A (ja) 2001-08-10 2003-02-26 Toray Ind Inc 未延伸糸の交絡繋ぎ方法
US6993473B2 (en) 2001-08-31 2006-01-31 Equality Translation Services Productivity tool for language translators
US20030046350A1 (en) * 2001-09-04 2003-03-06 Systel, Inc. System for transcribing dictation
US20030101044A1 (en) 2001-11-28 2003-05-29 Mark Krasnov Word, expression, and sentence translation management tool
US20030125927A1 (en) 2001-12-28 2003-07-03 Microsoft Corporation Method and system for translating instant messages
EP1483687A4 (en) 2002-03-11 2008-08-06 Univ Southern California TRANSLATION OF CALLED ENTITIES
JP3959453B2 (ja) 2002-03-14 2007-08-15 沖電気工業株式会社 翻訳仲介システム及び翻訳仲介サーバ
US8856236B2 (en) * 2002-04-02 2014-10-07 Verizon Patent And Licensing Inc. Messaging response system
US20050165642A1 (en) 2002-05-07 2005-07-28 Gabriel-Antoine Brouze Method and system for processing classified advertisements
US20040044517A1 (en) * 2002-08-30 2004-03-04 Robert Palmquist Translation system
US8972266B2 (en) 2002-11-12 2015-03-03 David Bezar User intent analysis extent of speaker intent analysis system
AU2003291049A1 (en) 2002-11-22 2004-06-18 Transclick, Inc. System and method for speech translation using remote devices
US7209875B2 (en) 2002-12-04 2007-04-24 Microsoft Corporation System and method for machine learning a confidence metric for machine translation
US7945674B2 (en) 2003-04-02 2011-05-17 Aol Inc. Degrees of separation for handling communications
US8392173B2 (en) 2003-02-10 2013-03-05 At&T Intellectual Property I, L.P. Message translations
US8027438B2 (en) 2003-02-10 2011-09-27 At&T Intellectual Property I, L.P. Electronic message translations accompanied by indications of translation
JP2004252881A (ja) 2003-02-21 2004-09-09 Mitsubishi Paper Mills Ltd テキストデータ修正方法
US20040210443A1 (en) 2003-04-17 2004-10-21 Roland Kuhn Interactive mechanism for retrieving information from audio and multimedia files containing speech
CA2426496A1 (en) 2003-04-24 2004-10-24 Ibm Canada Limited - Ibm Canada Limitee Processing fixed-format data in a unicode environment
JP3768205B2 (ja) 2003-05-30 2006-04-19 沖電気工業株式会社 形態素解析装置、形態素解析方法及び形態素解析プログラム
US20040267527A1 (en) * 2003-06-25 2004-12-30 International Business Machines Corporation Voice-to-text reduction for real time IM/chat/SMS
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US7539619B1 (en) 2003-09-05 2009-05-26 Spoken Translation Ind. Speech-enabled language translation system and method enabling interactive user supervision of translation and speech recognition accuracy
CA2554890A1 (en) * 2003-12-17 2005-06-30 Speechgear, Inc. Translation tool
US7480696B2 (en) 2004-01-07 2009-01-20 International Business Machines Corporation Instant messaging priority filtering based on content and hierarchical schemes
JP3790825B2 (ja) 2004-01-30 2006-06-28 独立行政法人情報通信研究機構 他言語のテキスト生成装置
US7424421B2 (en) 2004-03-03 2008-09-09 Microsoft Corporation Word collection method and system for use in word-breaking
US7478033B2 (en) 2004-03-16 2009-01-13 Google Inc. Systems and methods for translating Chinese pinyin to Chinese characters
JP2005301817A (ja) 2004-04-14 2005-10-27 Ricoh Co Ltd 翻訳支援システム
US7783476B2 (en) 2004-05-05 2010-08-24 Microsoft Corporation Word extraction method and system for use in word-breaking using statistical information
JP4384939B2 (ja) 2004-05-31 2009-12-16 株式会社インパルスジャパン 言語判別装置、翻訳装置、翻訳サーバ、言語判別方法並びに翻訳処理方法
US7389124B2 (en) 2004-06-02 2008-06-17 Research In Motion Limited Handheld electronic device with text disambiguation
US7669135B2 (en) 2004-07-15 2010-02-23 At&T Mobility Ii Llc Using emoticons, such as for wireless devices
FI20041159A0 (fi) 2004-09-07 2004-09-07 Nokia Corp Menetelmä viestien suodattamiseksi tietoverkossa
US7603353B2 (en) 2004-10-27 2009-10-13 Harris Corporation Method for re-ranking documents retrieved from a multi-lingual document database
US7711781B2 (en) 2004-11-09 2010-05-04 International Business Machines Corporation Technique for detecting and blocking unwanted instant messages
US7827026B2 (en) 2004-12-21 2010-11-02 Xerox Corporation Bilingual authoring assistant for the “tip of the tongue” problem
US7451188B2 (en) 2005-01-07 2008-11-11 At&T Corp System and method for text translations and annotation in an instant messaging session
US8027832B2 (en) 2005-02-11 2011-09-27 Microsoft Corporation Efficient language identification
US8087068B1 (en) 2005-03-08 2011-12-27 Google Inc. Verifying access to a network account over multiple user communication portals based on security criteria
JP2006277103A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd 文書翻訳方法および文書翻訳装置
US20060242232A1 (en) 2005-03-31 2006-10-26 International Business Machines Corporation Automatically limiting requests for additional chat sessions received by a particula user
JP2006302091A (ja) 2005-04-22 2006-11-02 Konica Minolta Photo Imaging Inc 翻訳装置及びそのプログラム
US7548849B2 (en) 2005-04-29 2009-06-16 Research In Motion Limited Method for generating text that meets specified characteristics in a handheld electronic device and a handheld electronic device incorporating the same
US8249854B2 (en) 2005-05-26 2012-08-21 Microsoft Corporation Integrated native language translation
JP2006350628A (ja) 2005-06-15 2006-12-28 Movida Holdings株式会社 コミュニケーションシステム及びコミュニケーション方法
US20070011132A1 (en) 2005-06-17 2007-01-11 Microsoft Corporation Named entity translation
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US8886517B2 (en) * 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US20060287848A1 (en) 2005-06-20 2006-12-21 Microsoft Corporation Language classification with random feature clustering
GB0514031D0 (en) 2005-07-08 2005-08-17 Nokia Corp Multi-user services in a communications system
US20070016399A1 (en) 2005-07-12 2007-01-18 International Business Machines Corporation Method and apparatus for detecting data anomalies in statistical natural language applications
US8024349B1 (en) * 2005-07-25 2011-09-20 Shao Henry K String-based systems and methods for searching for real estate properties
CN100488139C (zh) 2005-08-10 2009-05-13 华为技术有限公司 建立聊天室数据传输通道实现聊天消息传送的方法
US20070077975A1 (en) * 2005-08-15 2007-04-05 Roswitha Warda Software application for conducting online knowledge-based competitions
US7653531B2 (en) 2005-08-25 2010-01-26 Multiling Corporation Translation quality quantifying apparatus and method
US20090276500A1 (en) 2005-09-21 2009-11-05 Amit Vishram Karmarkar Microblog search engine system and method
CN100483399C (zh) * 2005-10-09 2009-04-29 株式会社东芝 训练音译模型、切分统计模型的方法和装置
US20070088793A1 (en) 2005-10-17 2007-04-19 Landsman Richard A Filter for instant messaging
US8180625B2 (en) * 2005-11-14 2012-05-15 Fumitaka Noda Multi language exchange system
US20070124202A1 (en) 2005-11-30 2007-05-31 Chintano, Inc. Systems and methods for collecting data and measuring user behavior when viewing online content
US20070130258A1 (en) 2005-12-06 2007-06-07 John Almberg Web-based public messaging system
WO2007070558A2 (en) 2005-12-12 2007-06-21 Meadan, Inc. Language translation using a hybrid network of human and machine translators
US20070143410A1 (en) * 2005-12-16 2007-06-21 International Business Machines Corporation System and method for defining and translating chat abbreviations
DE602006011436D1 (de) 2006-01-11 2010-02-11 Huawei Tech Co Ltd Verfahren und system zur benachrichtugung unter verwendung einer instant-messaging-blocknachricht
US7849144B2 (en) 2006-01-13 2010-12-07 Cisco Technology, Inc. Server-initiated language translation of an instant message based on identifying language attributes of sending and receiving users
US8065286B2 (en) * 2006-01-23 2011-11-22 Chacha Search, Inc. Scalable search system using human searchers
CN101030198A (zh) * 2006-03-02 2007-09-05 王启亨 在网络应用中实现跨语种交流的方法和系统
US7949538B2 (en) 2006-03-14 2011-05-24 A-Life Medical, Inc. Automated interpretation of clinical encounters with cultural cues
US8170868B2 (en) 2006-03-14 2012-05-01 Microsoft Corporation Extracting lexical features for classifying native and non-native language usage style
US9931571B2 (en) 2006-03-17 2018-04-03 Nintendo Co., Ltd. Systems, methods and techniques for safely and effectively coordinating video game play and other activities among multiple remote networked friends and rivals
CN100452069C (zh) 2006-03-17 2009-01-14 腾讯科技(深圳)有限公司 一种网络游戏中防止作弊的方法及系统
US8185376B2 (en) 2006-03-20 2012-05-22 Microsoft Corporation Identifying language origin of words
US8510109B2 (en) 2007-08-22 2013-08-13 Canyon Ip Holdings Llc Continuous speech transcription performance indication
US8380488B1 (en) 2006-04-19 2013-02-19 Google Inc. Identifying a property of a document
US8688451B2 (en) 2006-05-11 2014-04-01 General Motors Llc Distinguishing out-of-vocabulary speech from in-vocabulary speech
US20080005319A1 (en) 2006-05-16 2008-01-03 Anderholm Eric J Monitoring computer use through a calendar interface
US8166418B2 (en) 2006-05-26 2012-04-24 Zi Corporation Of Canada, Inc. Device and method of conveying meaning
US20080005325A1 (en) 2006-06-28 2008-01-03 Microsoft Corporation User communication restrictions
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US7899816B2 (en) 2006-08-24 2011-03-01 Brian Kolo System and method for the triage and classification of documents
US8010474B1 (en) 2006-09-05 2011-08-30 Aol Inc. Translating paralinguisitic indicators
US8626486B2 (en) 2006-09-05 2014-01-07 Google Inc. Automatic spelling correction for machine translation
US8423908B2 (en) 2006-09-08 2013-04-16 Research In Motion Limited Method for identifying language of text in a handheld electronic device and a handheld electronic device incorporating the same
US8548795B2 (en) * 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
US7885807B2 (en) 2006-10-18 2011-02-08 Hierodiction Software Gmbh Text analysis, transliteration and translation method and apparatus for hieroglypic, hieratic, and demotic texts from ancient Egyptian
JP4259564B2 (ja) 2006-10-24 2009-04-30 セイコーエプソン株式会社 サーバ装置、サーバ装置における方法、および、コンピュータプログラム
US8972268B2 (en) 2008-04-15 2015-03-03 Facebook, Inc. Enhanced speech-to-speech translation system and methods for adding a new word
US7895576B2 (en) 2006-11-10 2011-02-22 International Business Machines Corporation Method for automating internationalization software testing
US9462070B2 (en) 2006-11-17 2016-10-04 Synchronica Plc Protecting privacy in group communications
US8010338B2 (en) 2006-11-27 2011-08-30 Sony Ericsson Mobile Communications Ab Dynamic modification of a messaging language
US7552045B2 (en) 2006-12-18 2009-06-23 Nokia Corporation Method, apparatus and computer program product for providing flexible text based language identification
US8204182B2 (en) 2006-12-19 2012-06-19 Nuance Communications, Inc. Dialect translator for a speech application environment extended for interactive text exchanges
US20080177528A1 (en) 2007-01-18 2008-07-24 William Drewes Method of enabling any-directional translation of selected languages
US20080176655A1 (en) 2007-01-19 2008-07-24 James Terry L System and Method for Implementing an Interactive Online Community Utilizing an Activity Monitor
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8140322B2 (en) 2007-01-31 2012-03-20 Translations.Com Method of managing error risk in language translation
US8078978B2 (en) 2007-10-19 2011-12-13 Google Inc. Method and system for predicting text
US7912847B2 (en) * 2007-02-20 2011-03-22 Wright State University Comparative web search system and method
TWI502380B (zh) 2007-03-29 2015-10-01 Nokia Corp 配合預測式本文輸入使用之方法、裝置、伺服器、系統及電腦程式產品
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8601386B2 (en) 2007-04-20 2013-12-03 Ingenio Llc Methods and systems to facilitate real time communications in virtual reality
US20080274694A1 (en) 2007-05-01 2008-11-06 William David Castell System and Method for Multi-Channel Blocking
US9141607B1 (en) 2007-05-30 2015-09-22 Google Inc. Determining optical character recognition parameters
WO2008144964A1 (en) 2007-06-01 2008-12-04 Google Inc. Detecting name entities and new words
US20080320086A1 (en) * 2007-06-20 2008-12-25 Sean Callanan System and method for updating instant message transcripts
US20090234635A1 (en) 2007-06-29 2009-09-17 Vipul Bhatt Voice Entry Controller operative with one or more Translation Resources
US8145644B2 (en) * 2007-07-31 2012-03-27 Interfix, Llc Systems and methods for providing access to medical information
JP5017013B2 (ja) 2007-08-08 2012-09-05 株式会社コナミデジタルエンタテインメント ネットワークゲームシステム、ネットワークゲームシステムの制御方法及びプログラム
US20110219084A1 (en) 2007-08-17 2011-09-08 MTV Networks, a division of Viacom International, Inc. Parental control for multiple virtual environments of a user
US20090049513A1 (en) 2007-08-17 2009-02-19 Root Jason E System and method for controlling a virtual environment of a user
US20090068984A1 (en) 2007-09-06 2009-03-12 Burnett R Alan Method, apparatus, and system for controlling mobile device use
CN101414294A (zh) * 2007-10-18 2009-04-22 英业达股份有限公司 使用远端翻译记忆库的翻译系统及其方法
US7890525B2 (en) * 2007-11-14 2011-02-15 International Business Machines Corporation Foreign language abbreviation translation in an instant messaging system
JP5205658B2 (ja) 2007-11-14 2013-06-05 シャープ株式会社 電子機器、制御プログラム、記録媒体および制御方法
JP5340584B2 (ja) 2007-11-28 2013-11-13 インターナショナル・ビジネス・マシーンズ・コーポレーション 電子メッセージの読解を支援する装置及び方法
JP2009140073A (ja) 2007-12-04 2009-06-25 Nippon Telegr & Teleph Corp <Ntt> 用語難易度変換装置および用語難易度変換プログラム
KR100911621B1 (ko) 2007-12-18 2009-08-12 한국전자통신연구원 한영 자동번역 방법 및 장치
US8935147B2 (en) * 2007-12-31 2015-01-13 Sap Se Runtime data language selection in object instance
US8000956B2 (en) 2008-02-08 2011-08-16 Xerox Corporation Semantic compatibility checking for automatic correction and discovery of named entities
US20090204407A1 (en) * 2008-02-08 2009-08-13 Shields T Russell System and method for processing a spoken request from a user
US20090221372A1 (en) 2008-02-29 2009-09-03 Molly Casey Footpad-based game and gaming system
WO2009129315A1 (en) 2008-04-15 2009-10-22 Mobile Technologies, Llc System and methods for maintaining speech-to-speech translation in the field
US20090271212A1 (en) 2008-04-29 2009-10-29 City 17, Llc Method, system, and storage device for user matching and communication facilitation
US8270606B2 (en) 2008-05-01 2012-09-18 International Business Machines Corporation Open architecture based domain dependent real time multi-lingual communication service
US7912852B1 (en) 2008-05-02 2011-03-22 Amazon Technologies, Inc. Search-caching and threshold alerting for commerce sites
US8107671B2 (en) 2008-06-26 2012-01-31 Microsoft Corporation Script detection service
CA2671722A1 (en) 2008-07-15 2010-01-15 Nue Echo Inc. Methods and systems for providing grammar services
US20100015581A1 (en) * 2008-07-16 2010-01-21 Delaurentis Semina Language arts game
US8731588B2 (en) 2008-10-16 2014-05-20 At&T Intellectual Property I, L.P. Alert feature for text messages
US8548797B2 (en) 2008-10-30 2013-10-01 Yahoo! Inc. Short text language detection using geographic information
JP2010129057A (ja) * 2008-12-01 2010-06-10 Ricoh Co Ltd 情報処理装置、表示データ翻訳方法、及びプログラム
US8494835B2 (en) 2008-12-02 2013-07-23 Electronics And Telecommunications Research Institute Post-editing apparatus and method for correcting translation errors
US8364766B2 (en) 2008-12-04 2013-01-29 Yahoo! Inc. Spam filtering based on statistics and token frequency modeling
US8442563B2 (en) * 2008-12-11 2013-05-14 Avaya Inc. Automated text-based messaging interaction using natural language understanding technologies
JP2010152785A (ja) 2008-12-26 2010-07-08 Dainippon Printing Co Ltd 専門用語の置換編集方法、システム、プログラム、記録媒体
US8244567B2 (en) 2008-12-31 2012-08-14 Synnex Corporation Business goal incentives using gaming rewards
US8442813B1 (en) 2009-02-05 2013-05-14 Google Inc. Methods and systems for assessing the quality of automatically generated text
US8326601B2 (en) 2009-02-11 2012-12-04 Microsoft Corporation Queue based mechanism to support multi-language chat rooms
US8095893B2 (en) 2009-03-16 2012-01-10 Xennsoft Llc Providing an interactive and customizable organization tree having communication options
KR20100113749A (ko) 2009-04-14 2010-10-22 한국전자통신연구원 클라이언트 단말기, 게임 서비스 장치 및 게임 서비스 시스템 및 그 방법
US8473555B2 (en) 2009-05-12 2013-06-25 International Business Machines Corporation Multilingual support for an improved messaging system
US8326602B2 (en) 2009-06-05 2012-12-04 Google Inc. Detecting writing systems and languages
US20170300453A1 (en) 2009-06-12 2017-10-19 Google Inc. System and method of providing notification of suspicious access attempts
US9547642B2 (en) 2009-06-17 2017-01-17 Empire Technology Development Llc Voice to text to voice processing
US8352244B2 (en) 2009-07-21 2013-01-08 International Business Machines Corporation Active learning systems and methods for rapid porting of machine translation systems to new language pairs or new domains
US8990064B2 (en) * 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US20110035210A1 (en) 2009-08-10 2011-02-10 Benjamin Rosenfeld Conditional random fields (crf)-based relation extraction system
US8473501B2 (en) 2009-08-25 2013-06-25 Ontochem Gmbh Methods, computer systems, software and storage media for handling many data elements for search and annotation
KR101263332B1 (ko) 2009-09-11 2013-05-20 한국전자통신연구원 모바일 기기에서 사용자 상호작용을 이용한 자동 번역 장치 및 그 방법
US8832204B1 (en) 2009-09-24 2014-09-09 Sprint Communication Company L.P. Text message spam solutions
US20110071817A1 (en) 2009-09-24 2011-03-24 Vesa Siivola System and Method for Language Identification
US8364463B2 (en) 2009-09-25 2013-01-29 International Business Machines Corporation Optimizing a language/media translation map
US8655644B2 (en) 2009-09-30 2014-02-18 International Business Machines Corporation Language translation in an environment associated with a virtual application
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
WO2011041672A1 (en) 2009-10-02 2011-04-07 Massachusetts Institute Of Technology Translating text to, merging, and optimizing graphical user interface tasks
US8775433B2 (en) * 2009-10-16 2014-07-08 Oracle International Corporation Self-indexing data structure
US9292493B2 (en) 2010-01-07 2016-03-22 The Trustees Of The Stevens Institute Of Technology Systems and methods for automatically detecting deception in human communications expressed in digital form
US20110184736A1 (en) 2010-01-26 2011-07-28 Benjamin Slotznick Automated method of recognizing inputted information items and selecting information items
US8566078B2 (en) 2010-01-29 2013-10-22 International Business Machines Corporation Game based method for translation data acquisition and evaluation
CN102725790B (zh) 2010-02-05 2014-04-16 三菱电机株式会社 识别词典制作装置及声音识别装置
US8949128B2 (en) 2010-02-12 2015-02-03 Nuance Communications, Inc. Method and apparatus for providing speech output for speech-enabled applications
JP5014449B2 (ja) 2010-02-26 2012-08-29 シャープ株式会社 会議システム、情報処理装置、会議支援方法、情報処理方法、及びコンピュータプログラム
US20110238406A1 (en) * 2010-03-23 2011-09-29 Telenav, Inc. Messaging system with translation and method of operation thereof
US8606297B1 (en) 2010-03-24 2013-12-10 Grindr LLC Systems and methods for providing location-based cascading displays
JP4940325B2 (ja) 2010-03-29 2012-05-30 株式会社東芝 文書校正支援装置、方法およびプログラム
US8311800B1 (en) 2010-04-01 2012-11-13 Symantec Corporation Systems and methods for detecting incorrect translations of terms in a computing string
WO2011131785A1 (en) * 2010-04-21 2011-10-27 Université Catholique de Louvain Normalisation of noisy typewritten texts
WO2011133812A1 (en) 2010-04-22 2011-10-27 Kirk Lanciani Data mining system
US9082140B2 (en) * 2010-06-09 2015-07-14 Ebay Inc. Systems and methods to extract and utilize textual semantics
US8527521B2 (en) 2010-06-09 2013-09-03 One Hour Translation, Inc. System and method for evaluating the quality of human translation through the use of a group of human reviewers
US20110313779A1 (en) 2010-06-17 2011-12-22 Microsoft Corporation Augmentation and correction of location based data through user feedback
US8543374B2 (en) * 2010-08-12 2013-09-24 Xerox Corporation Translation system combining hierarchical and phrase-based models
US8688435B2 (en) 2010-09-22 2014-04-01 Voice On The Go Inc. Systems and methods for normalizing input media
US8965751B2 (en) 2010-11-01 2015-02-24 Microsoft Corporation Providing multi-lingual translation for third party content feed applications
WO2012064759A1 (en) 2010-11-09 2012-05-18 Myusic, Inc. Displaying, exploring, discovering, recommending, and playing back media files based on user preferences
JP5672487B2 (ja) 2010-11-11 2015-02-18 株式会社国際電気通信基礎技術研究所 音声言語識別装置の学習装置、音声言語の識別装置、及びそれらのためのプログラム
US8682918B2 (en) * 2010-11-22 2014-03-25 Salesforce.Com, Inc. Method and system for making content-based recommendations
US20120156668A1 (en) * 2010-12-20 2012-06-21 Mr. Michael Gregory Zelin Educational gaming system
US8738355B2 (en) * 2011-01-06 2014-05-27 Qualcomm Incorporated Methods and apparatuses for providing predictive translation information services to mobile stations
US8112497B1 (en) 2011-01-11 2012-02-07 Social IT Pty Ltd Online educational software
US8990065B2 (en) 2011-01-11 2015-03-24 Microsoft Technology Licensing, Llc Automatic story summarization from clustered messages
US9552353B2 (en) 2011-01-21 2017-01-24 Disney Enterprises, Inc. System and method for generating phrases
US9558267B2 (en) 2011-02-11 2017-01-31 International Business Machines Corporation Real-time data mining
US8671019B1 (en) * 2011-03-03 2014-03-11 Wms Gaming, Inc. Controlling and rewarding gaming socialization
US20120240039A1 (en) 2011-03-15 2012-09-20 Walker Digital, Llc Systems and methods for facilitating translation of documents
US8938670B2 (en) 2011-03-27 2015-01-20 Brian Andrew Kolo Methods and systems for automated language identification
US9098488B2 (en) 2011-04-03 2015-08-04 Microsoft Technology Licensing, Llc Translation of multilingual embedded phrases
US8849628B2 (en) 2011-04-15 2014-09-30 Andrew Nelthropp Lauder Software application for ranking language translations and methods of use thereof
US20120277003A1 (en) 2011-04-28 2012-11-01 Nichola Eliovits Platform-independent international gaming framework
US20120290288A1 (en) 2011-05-09 2012-11-15 Xerox Corporation Parsing of text using linguistic and non-linguistic list properties
US8538742B2 (en) 2011-05-20 2013-09-17 Google Inc. Feed translation for a social network
US8762128B1 (en) 2011-05-20 2014-06-24 Google Inc. Back-translation filtering
US20120303355A1 (en) * 2011-05-27 2012-11-29 Robert Bosch Gmbh Method and System for Text Message Normalization Based on Character Transformation and Web Data
US9195652B2 (en) * 2011-06-08 2015-11-24 Accenture Global Services Limited Automated systems and methods for integrated multi-platform communication including real-time language translation
US8825467B1 (en) 2011-06-28 2014-09-02 Google Inc. Translation game
US8838437B1 (en) 2011-06-30 2014-09-16 Google Inc. Language classifiers for language detection
US9298698B2 (en) 2011-06-30 2016-03-29 Google Inc. Language detection based upon a social graph
US8788259B1 (en) 2011-06-30 2014-07-22 Google Inc. Rules-based language detection
US20150161114A1 (en) 2011-06-30 2015-06-11 Google Inc. Rules-based language detection
US8928591B2 (en) 2011-06-30 2015-01-06 Google Inc. Techniques for providing a user interface having bi-directional writing tools
US8713037B2 (en) 2011-06-30 2014-04-29 Xerox Corporation Translation system adapted for query translation via a reranking framework
US9104744B2 (en) 2011-06-30 2015-08-11 Google Inc. Cluster-based language detection
US8825469B1 (en) * 2011-08-04 2014-09-02 Google Inc. Techniques for translating documents including tags
US8510328B1 (en) * 2011-08-13 2013-08-13 Charles Malcolm Hatton Implementing symbolic word and synonym English language sentence processing on computers to improve user automation
US9785628B2 (en) 2011-09-29 2017-10-10 Microsoft Technology Licensing, Llc System, method and computer-readable storage device for providing cloud-based shared vocabulary/typing history for efficient social communication
US20130084976A1 (en) 2011-10-01 2013-04-04 Microsoft Corporation Game paradigm for language learning and linguistic data generation
US8924853B2 (en) 2011-10-07 2014-12-30 Blackberry Limited Apparatus, and associated method, for cognitively translating media to facilitate understanding
US8954315B2 (en) 2011-10-10 2015-02-10 Ca, Inc. System and method for mixed-language support for applications
US9501759B2 (en) 2011-10-25 2016-11-22 Microsoft Technology Licensing, Llc Search query and document-related data translation
US8494838B2 (en) 2011-11-10 2013-07-23 Globili Llc Systems, methods and apparatus for dynamic content management and delivery
US8983825B2 (en) 2011-11-14 2015-03-17 Amadou Sarr Collaborative language translation system
US9656169B2 (en) * 2011-11-17 2017-05-23 Disney Enterprises, Inc. Characterization of player type by visual attributes
US8862462B2 (en) 2011-12-09 2014-10-14 Chrysler Group Llc Dynamic method for emoticon translation
WO2013102052A1 (en) 2011-12-28 2013-07-04 Bloomberg Finance L.P. System and method for interactive automatic translation
US8990066B2 (en) 2012-01-31 2015-03-24 Microsoft Corporation Resolving out-of-vocabulary words during machine translation
US9330082B2 (en) 2012-02-14 2016-05-03 Facebook, Inc. User experience with customized user dictionary
US8832092B2 (en) 2012-02-17 2014-09-09 Bottlenose, Inc. Natural language processing optimized for micro content
US9465797B2 (en) 2012-02-23 2016-10-11 Google Inc. Translating text using a bridge language
US8744771B2 (en) * 2012-03-26 2014-06-03 Navteq B.V. Reverse natural guidance
US9141606B2 (en) 2012-03-29 2015-09-22 Lionbridge Technologies, Inc. Methods and systems for multi-engine machine translation
US8818791B2 (en) * 2012-04-30 2014-08-26 Google Inc. Techniques for assisting a user in the textual input of names of entities to a user device in multiple different languages
US8903726B2 (en) 2012-05-03 2014-12-02 International Business Machines Corporation Voice entry of sensitive information
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US8918308B2 (en) * 2012-07-06 2014-12-23 International Business Machines Corporation Providing multi-lingual searching of mono-lingual content
US20140142917A1 (en) 2012-11-19 2014-05-22 Lindsay D'Penha Routing of machine language translation to human language translator
US20140163951A1 (en) 2012-12-07 2014-06-12 Xerox Corporation Hybrid adaptation of named entity recognition
US8914395B2 (en) * 2013-01-03 2014-12-16 Uptodate, Inc. Database query translation system
US8682529B1 (en) 2013-01-07 2014-03-25 Ford Global Technologies, Llc Methods and apparatus for dynamic embedded object handling
US9235567B2 (en) 2013-01-14 2016-01-12 Xerox Corporation Multi-domain machine translation model adaptation
US9241245B2 (en) 2013-01-15 2016-01-19 Apple Inc. Management of unwanted calls and/or text messages
US9298703B2 (en) 2013-02-08 2016-03-29 Machine Zone, Inc. Systems and methods for incentivizing user feedback for translation processing
US9031829B2 (en) 2013-02-08 2015-05-12 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8990068B2 (en) 2013-02-08 2015-03-24 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9600473B2 (en) 2013-02-08 2017-03-21 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9231898B2 (en) 2013-02-08 2016-01-05 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8996352B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US8996353B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8996355B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for reviewing histories of text messages from multi-user multi-lingual communications
GB2513644A (en) 2013-05-02 2014-11-05 Rolonews Lp Content distribution
CN104239286A (zh) 2013-06-24 2014-12-24 阿里巴巴集团控股有限公司 同义短语的挖掘方法和装置及搜索相关内容的方法和装置
US20150006148A1 (en) 2013-06-27 2015-01-01 Microsoft Corporation Automatically Creating Training Data For Language Identifiers
US9471561B2 (en) 2013-12-26 2016-10-18 International Business Machines Corporation Adaptive parser-centric text normalization
RU2665239C2 (ru) 2014-01-15 2018-08-28 Общество с ограниченной ответственностью "Аби Продакшн" Автоматическое извлечение именованных сущностей из текста
US9444773B2 (en) 2014-07-31 2016-09-13 Mimecast North America, Inc. Automatic translator identification
US9372848B2 (en) 2014-10-17 2016-06-21 Machine Zone, Inc. Systems and methods for language detection

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210098142A (ko) * 2020-01-31 2021-08-10 대구대학교 산학협력단 실시간 채팅 장치

Also Published As

Publication number Publication date
US20140229156A1 (en) 2014-08-14
US20170199869A1 (en) 2017-07-13
CN105103151B (zh) 2019-06-28
US10417351B2 (en) 2019-09-17
JP6653301B2 (ja) 2020-02-26
JP2016509312A (ja) 2016-03-24
EP2954522B1 (en) 2019-07-31
US9031828B2 (en) 2015-05-12
JP6224735B2 (ja) 2017-11-01
US20190050397A1 (en) 2019-02-14
CA2900639A1 (en) 2014-08-14
US20190370340A1 (en) 2019-12-05
AU2019216613A1 (en) 2019-08-29
US20180075024A1 (en) 2018-03-15
BR112015019162A2 (pt) 2017-07-18
US20140229154A1 (en) 2014-08-14
AU2014214652B2 (en) 2019-05-16
EP3579122A1 (en) 2019-12-11
RU2015138140A (ru) 2017-03-15
SG10201900496TA (en) 2019-02-27
EP2954522A4 (en) 2016-10-05
JP2018041474A (ja) 2018-03-15
US9836459B2 (en) 2017-12-05
US10685190B2 (en) 2020-06-16
CN110046360A (zh) 2019-07-23
EP2954522A1 (en) 2015-12-16
SG11201506209XA (en) 2015-09-29
IL240424A0 (en) 2015-09-24
HK1212090A1 (en) 2016-06-03
US10146773B2 (en) 2018-12-04
US9600473B2 (en) 2017-03-21
WO2014124397A1 (en) 2014-08-14
CN105103151A (zh) 2015-11-25
AU2014214652A1 (en) 2015-09-17

Similar Documents

Publication Publication Date Title
JP6653301B2 (ja) マルチユーザ多言語通信のためのシステムおよび方法
US10346543B2 (en) Systems and methods for incentivizing user feedback for translation processing
CA2779117C (en) Automated systems and methods for integrated multi-platform communication including real-time language translation
KR101344177B1 (ko) 인스턴트 메시징에서 텍스트를 번역하는 방법, 인스턴트 메시징 텍스트의 번역을 디스플레이하기 위한 시스템, 및 컴퓨터 판독가능 매체
AU2017205328A1 (en) Named entity recognition on chat data
NZ725675A (en) Systems and methods for multi-user multi-lingual communications
US10650103B2 (en) Systems and methods for incentivizing user feedback for translation processing
KR101870729B1 (ko) 휴대용 단말기의 번역 트리구조를 이용한 번역장치 및 방법
WO2018075190A1 (en) Systems and methods for handling formality in translations of text

Legal Events

Date Code Title Description
N231 Notification of change of applicant
E902 Notification of reason for refusal
E601 Decision to refuse application