EA002989B1 - Способ и аппаратура для перевода с одного языка на другой - Google Patents

Способ и аппаратура для перевода с одного языка на другой Download PDF

Info

Publication number
EA002989B1
EA002989B1 EA199900377A EA199900377A EA002989B1 EA 002989 B1 EA002989 B1 EA 002989B1 EA 199900377 A EA199900377 A EA 199900377A EA 199900377 A EA199900377 A EA 199900377A EA 002989 B1 EA002989 B1 EA 002989B1
Authority
EA
Eurasian Patent Office
Prior art keywords
words
parsed
parsed words
dictionary
individual
Prior art date
Application number
EA199900377A
Other languages
English (en)
Other versions
EA199900377A1 (ru
Inventor
Джулиус Черни
Original Assignee
Джеданкен Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Джеданкен Корпорейшн filed Critical Джеданкен Корпорейшн
Publication of EA199900377A1 publication Critical patent/EA199900377A1/ru
Publication of EA002989B1 publication Critical patent/EA002989B1/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)
  • Crystals, And After-Treatments Of Crystals (AREA)
  • Document Processing Apparatus (AREA)

Abstract

Представляются способы и аппаратура для осуществления перевода с языка на язык. Настоящее изобретение включает в себя систему перевода, которая осуществляет перевод, имеющий повышенную точность, благодаря обеспечению трехмерной тематической двуязычной базы данных. Тематическая база данных включает в себя набор переводов с исходного языка на конечный для каждой тематики, для которой используется база данных. Согласно одному варианту реализации пользователь в начале выбирает тематику разговора, затем слова, произнесенные по телефону, переводятся и создаются как синтезированные голосовые сигналы с другого телефона с тем, чтобы двое людей, говорящие на разных языках, могли поддерживать разговор в режиме, близком к режиму реального времени. Дополнительный признак настоящего изобретения состоит в добавлении компьютерного терминала, который отображает вводимые и выводимые фразы с тем, чтобы каждый пользователь мог редактировать вводимые фразы или указывать на нечеткость перевода и запрашивать перефразирование материала.

Description

Настоящее изобретение относится к переводу с одного языка на другой. Конкретно, настоящее изобретение относится к обеспечению перевода с одного языка на другой, базирующегося, по крайней мере частично, на пользовательском выборе конкретной тематики, на которой концентрируется перевод.
Перевод с одного языка на другой широко известен. В основном, перевод осуществляется вручную людьми, которые хорошо владеют как исходным, так и конечным языками. Людипереводчики способны почти мгновенно с очень высокой степенью точности переводить написанный или произносимый текст. Кроме того, перевод, выполненный человеком, зачастую более точен из-за того, что переводчик обладает знаниями, касающимися тематики или предмета, на котором базируется общение.
Хотя переводы, выполненные человеком, зачастую весьма точны, они в то же время очень дорого стоят, поскольку для их выполнения требуются люди со специальным образованием. Помимо основных расходов, которые могут быть непомерно высокими, во многих случаях требуется перевод, для которого нужны люди, имеющие дополнительные знания, что еще больше увеличивает стоимость работы. Например, если двое ученых-биотехнолога, говорящих на разных языках, нуждаются в общении, переводчик, помимо хорошего владения обоими языками, должен обладать знаниями по биотехнологии, дабы правильно передавать значение многочисленных «технических терминов».
Дополнительная проблема перевода, выполняемого человеком, состоит в недостатке квалифицированных специалистов, способных выполнять подобные задания. Было предпринято немало попыток решения проблемы интенсификации труда переводчика. Многие из этих попыток сводились к привлечению электронных устройств для перевода написанного текста с одного языка на другой.
Например, в патенте США № 4,393,460 Масузавы (Μα5ΐιζα\να) и др. рассматривается электронный переводчик, в котором используется схема, реагирующая на голос, чтобы вводить слова на одном языке, обрабатывающая схема, которая переводит слова на второй язык, и схема синтеза голоса, чтобы «произносить» переведенные слова на втором языке. Перевод базируется на работе трех «анализаторов», которые анализируют символы слова, синтаксис и частоту слов. Один недостаток системы, описанной Масузавой, состоит в том, что она опирается на единственный набор правил и «трудных для понимания» фраз для каждого языка. Это неизменно влечет за собой ошибки перевода, особенно когда предметом перевода является специализированная тематика.
Другая система перевода описана в патенте США № 4,805,732, Окамото (ОкатоЮ) и др. В па тенте Окамото рассматривается машина, имеющая участок ввода, участок словаря, где хранится лингвистическая информация, участок обработки и участок вывода. Участок вывода включает в себя дисплей и оборудование, позволяющее пользователю редактировать как вводимый текст, так и переведенный текст. Однако, изобретение Окамото страдает, по крайней мере, тем же недостатком, что и изобретение Масузавы, а именно тем, что перевод базируется на единственном наборе правил для данного языка.
В патенте США № 5,299,124 Фукумочи (РикитосЫ) и др. описана машина для перевода, особым предназначением которой является синтаксический анализ предложения. Вводимое предложение разделяется на слова словарноморфемным анализатором. Переведенное слово приводится в соответствие с грамматической информацией для каждого слова, чтобы получить информацию о времени, лице и числе (т. е. единственное или множественное). Синтаксический анализатор формирует структурноанализирующее дерево на основании словарного перевода и грамматических правил для предложения. Если дерево не удается, предложение разбивается на более мелкие куски и подвергается повторной обработке до тех пор, пока не произойдет успешный перевод. Однако Фукумочи также применяет единственный набор правил для каждого языка.
В патенте США № 5,437,319 Чонга (С1юп§) и др. (и публикации \УО 92/12494 эквивалента РСТ) описана другая система, которая автоматически переводит вводимый текст на исходном языке в выводимый текст на конечном языке. Чонг применяет словарную базу данных, которая содержит словари основного языка для обычных слов, диалектические словари для специализированных слов и пользовательские словари. Чонг, как и во многих других системах перевода, осуществляет переводы, сначала пытаясь согласовать исходный язык с конечным языком, используя «нормальный» двуязычный словарь. Если согласование не найдено, применяется специализированный словарь, после чего пользователю предлагается дополнить перевод.
В патенте США № 4,507,750 Франц (Ρταηΐζ) и др. пытаются разрешить некоторые из описанных выше трудностей. Отмечая, что для точного перевода пословного перевода недостаточно, Франц описывает систему, которая анализирует контекст внутри данного предложения, чтобы преодолеть различные проблемы, например касающиеся омонимов, которые испытывают другие устройства перевода. Несмотря на то, что Францу удается решить простые проблемы, например различения слов «ΐο, ΐοο и 1\\ό». Франц, тем не менее, опирается на единственный набор правил для языка.
По меньшей мере, по вышеперечисленным причинам задача настоящего изобретения со стоит в том, чтобы предоставить систему перевода, которая переводила бы с одного языка на другой в зависимости от тематики переводимой информации.
Задача настоящего изобретения состоит также в том, чтобы предоставить систему перевода, которая опиралась бы на множественные базы правил для данного языка с целью повышения точности перевода.
Еще одна задача настоящего изобретения состоит в том, чтобы предоставить систему перевода, которая применяла бы множественные словари для перевода с первого языка на второй.
Краткое содержание изобретения
Вышеприведенные и иные задачи настоящего изобретения решаются посредством описанных здесь систем и способов, в которых перевод с одного языка на другой базируется, по крайней мере частично, на выборе тематики, на которой базируется общение. Система перевода и способ, отвечающие настоящему изобретению, включают в себя то, что можно назвать «трехмерной» базой данных, которая строится для каждой пары языков. Три измерения включают в себя исходный язык, конечный язык и тематику (или предмет, на котором базируется общение). Каждая ячейка базы данных включает в себя информацию по каждой тематике, касающейся, например, частоты связи, синонимов и словарного определения, относящегося к тематике.
Принципы настоящего изобретения могут применяться к разнообразным системам и способам, чтобы автоматически осуществлять высокоточные переводы. Согласно одному варианту реализации тематические словари конструируются путем сканирования (или другими общепринятыми средствами) различных документов материала. Например, чтобы установить уровень базы данных (т.е. один уровень трехмерной базы данных), относящийся к микробиологии, следует сканировать различные статьи из профессиональных публикаций по микробиологии. Сканированный материал можно пропустить через синтаксический анализатор, который присваивает слова классам слов. Затем к вводимому материалу применяется общепринятый двуязычный словарь, который создает переводы на конечном языке.
Наряду со сканированием материала исходного языка аналогичный процесс выполняется над конечным языком с использованием различных документов на конечном языке (относящихся к той же тематике). Конечный результат представляет собой два файла слов на одном языке со связанными с ними переводами. Затем эти два файла обрабатываются посредством нескольких программ распознавания образов с целью вычисления прямой и обратной частоты связи между двумя файлами. Этот процесс создает один уровень трехмерной тематической базы данных (т.е. для выбранной тематики).
Как только трехмерная тематическая база данных для данной темы установлена, система может использоваться многими способами. Один вариант реализации представляет собой систему, в которой два человека, которые говорят на разных языках, могут разговаривать друг с другом по телефону при помощи системы, обеспечивающей почти синхронный перевод (каждый абонент, закончив говорить, должен сделать небольшую паузу.) Схема распознавания голоса преобразует аналоговые сигналы, принимаемые от микрофона (или оцифрованный вариант этих сигналов), в сигналы для обработки. Схема обработки преобразует сигналы в слова, к которым затем применяется тематическая база данных и общепринятая двуязычная база данных, чтобы переводить текст. Переведенный текст синтезируется и передается другому абоненту.
Краткое описание чертежей
Вышеозначенные и иные задачи и преимущества настоящего изобретения будут очевидны при рассмотрении нижеследующего подробного описания, приведенного в сочетании с прилагаемыми чертежами, снабженными сквозными обозначениями одинаковых деталей, где:
фиг. 1 является блок-схемой, изображающей один вариант реализации системы перевода, сконструированной в соответствии с принципами настоящего изобретения;
фиг. 2 является блок-схемой, иллюстрирующей различные возможные системы ввода для системы перевода, изображенной на фиг .1;
фиг. 3 является блок-схемой, иллюстрирующей различные возможные системы вывода для системы перевода, изображенной на фиг. 1;
фиг. 4 является блок-схемой процесса построения трехмерной тематической базы данных с использованием той системы перевода, что изображена на фиг. 1, в соответствии с принципами настоящего изобретения;
фиг. 5 является схематической диаграммой, демонстрирующей иллюстративный пример части процедуры, изображенной на фиг. 4, используемой при построении трехмерной базы данных; и фиг. 6 является блок-схемой, которая иллюстрирует работу системы перевода, изображенной на фиг. 1, в соответствии с принципами настоящего изобретения.
Подробное описание чертежей
Отвечающие настоящему изобретению системы и способы перевода с одного языка на другой включают в себя систему обработки, в которой применяется трехмерная база данных (для множественных тематик), с целью обеспечения высокоточного перевода. Каждый «уровень» базы данных обеспечивает перевод с одного языка на другой для данной тематики (например, биотехнологии, высокочастотных электронных схем, медицинской технологии и т.д.). Также включаются общепринятые двуязычные словари (т.е. не тематические), которые используются для дополнения перевода, осуществляемого процессором, использующим тематический словарь.
Фиг. 1 в общих чертах представляет систему для осуществления перевода с одного языка на другой в соответствии с принципами настоящего изобретения. Система перевода 100 включает в себя системы ввода 102 и 112, системы вывода 104 и 114, процессор 106 и память 108. Память 108 может включать в себя возможности постоянного хранения (например, жесткие диски или магнитооптические диски), а также временного хранения, например, ДОЗУ (динамическое оперативное запоминающее устройство). По меньшей мере, часть памяти 108 является устройством временного хранения, которое включает в себя разделы для тематических словарей 120, двуязычных словарей 122, правил синтаксиса 124 и правил грамматики 126. Каждая из частей 120-126 может храниться в устройстве постоянного хранения, пока система 100 не действует, и загружаться в устройство временного хранения в виде части процедуры запуска системы 100.
Система перевода 100 может использоваться для создания или модификации тематических словарей 120 или двуязычных словарей 122 при предоставлении системе 100 дополнительной информации через системы ввода 102 и 112. На фиг. 2 показаны некоторые из разнообразных способов ввода информации в систему 100 через систему ввода 102. Специалистам легко понять, что, хотя на фиг. 2 изображены три конкретных варианта реализации схемы устройств ввода, принципы настоящего изобретения могут осуществляться системой, которая включает в себя любое(ую) из устройств/схем ввода, любую комбинацию этих устройств, а также другие известные устройства, которые могут принимать языковую информацию, и схему, которая преобразует эту информацию в сигналы для компьютерной обработки (например, простой микрофон и схема распознавания голоса).
Система ввода 102 может, например, включать в себя телефон 202 для приема входных голосовых сигналов и схему распознавания голоса 204 для преобразования этих входных голосовых сигналов в сигналы, которые процессор 106 может обрабатывать как «текст». Система ввода 102 может также включать в себя сканнер 206 (или система ввода 102 может включать в себя сканнер 206 вместо телефона 202) для ввода в систему 100 напечатанного текста. В сочетании со сканнером 206 предусматривается программное обеспечение 208 схемы распознавания оптических символов (РОС) для преобразования сигналов сканнера в «текст». РОС 208 может располагаться внутри сканнера 206, может являться независимым аппаратным обеспечением или может находиться внутри процессора 106 (несколько менее желательно по причине дополнительной нагрузки, оказываемой на процессор 106).
Другой вариант системы ввода 102 представляет собой видеоэкран/клавиатуру 210, которые могут представлять собой специализиро ванный персональный компьютер, автономный сенсорный видеоэкран, позволяющий выбирать варианты ввода путем прикосновения к экрану, или терминал, подключенный к серверу или главному компьютеру.
Видео/клавиатура 210 позволяет пользователю непосредственно вводить информацию в систему 100 и при использовании в качестве части систем вывода 104 и 114 может позволять пользователю редактировать введенный текст, переведенный текст или оба, что более подробно описано ниже. Кроме того, хотя фиг. 2 описана применительно к системе ввода 102, специалистам очевидно, что те же самые принципы можно применить к системе ввода 112, не выходя за рамки объема настоящего изобретения.
Система вывода 104, с другой стороны, может также включать в себя телефон 302, присоединенный к схеме синтеза голоса 304, которая преобразует переведенный текст в голосовые сигналы на языке перевода. Конечно, в зависимости от конфигурации телефоны 202 и 302 могут быть единственным телефоном, в зависимости от того, используется ли телефон в качестве устройства ввода или устройства вывода. Когда телефоны 202 и 302 являются единственным телефоном, схема распознавания голоса 204 и схема синтеза голоса 304 также предпочтительно являются единым электронным устройством, которое осуществляет обе функции. Система вывода 104 может также включать в себя принтер 206 (или система вывода 104 может включать в себя принтер 306 вместо телефона 302), чтобы распечатывать текст, переведенный системой 100.
Система вывода 104 можете взамен включать в себя видеоэкран/клавиатуру 310, которые могут представлять собой специализированный персональный компьютер, автономный сенсорный видеоэкран, позволяющий пользователю выбирать варианты ввода путем прикосновения к экрану, или терминал, подключенный к серверу или главному компьютеру.
Видео/клавиатура 310 позволяет пользователю принимать информацию перевода от системы 100, что при использовании в сочетании с системами ввода 102 и 112 может позволить пользователю редактировать вводимый текст, переведенный текст или оба, что подробно описано ниже. Кроме того, хотя фиг. 3 была описана применительно к системе вывода 104, специалистам очевидно, что те же самые принципы можно применить к системе вывода 114, не выходя за рамки объема настоящего изобретения.
Фиг. 4 является блок-схемой, которая иллюстрирует, как может строиться трехмерный тематический словарь 120 в соответствии с принципами настоящего изобретения. Процедура, показанная на фиг. 4, включает в себя две главные ветви 402 и 412, которые могут исполняться параллельно, последовательно или в любой их комбинации, в зависимости от конкрет ной конфигурации системы перевода 100. Каждая из ветвей 402 и 412 включает в себя четыре этапа (т.е. ветвь 402 включает в себя этапы 404410, а ветвь 412 включает в себя этапы 414-420, которые в сущности идентичны этапам 404-410 и по этой причине отдельно не рассматриваются ниже), результатом чего является база данных, имеющая один или несколько переводов на конечный язык, связанных с каждым вводимым словом на исходном языке.
Процедура, показанная на фиг. 4, подлежит исполнению для каждой тематики, в которой может нуждаться перевод. Таким образом, когда пользователь использует эту систему, что полнее описывается ниже, пользователь выбирает отдельную тематику, которую система перевода 100 использует, чтобы концентрироваться на ней при переводе, дабы перевод создавался более точным образом. Первый этап создания одного тематического уровня тематического словаря 120 состоит в том, чтобы ввести материал в систему (т.е. этап 404). Как описано выше, этап 404 может исполняться несколькими способами. Например, материал можно вводить в систему 100 через телефон 202, позволяющий устно зачитывать документы или использовать сканнер 206 и схему/программное обеспечение РОС 208 для быстрого ввода многочисленных документов. Альтернативно, материал можно набирать при помощи видеоэкрана/клавиатуры 210.
После ввода материала в систему 100, процессор 106 на этапе 406 обрабатывает вводимую информацию с целью разбора вводимого материала на отдельные слова. Разбор является широко известной процедурой для преобразования отдельных вводимых символов в слова (т.е. построения слова путем включения всех символов между двумя пробелами). За разбором следует соотнесение слов с классами слов (т.е. этап 408). Эти классы базируются, по меньшей мере частично, на такой информации, как грамматическая функция (например, играет ли слово роль подлежащего, определения или дополнения), грамматическая форма (например, падеж существительного или глагол в каком-то времени) и значение. После того, как классы слов присвоены, процессор 106 на этапе 410 обрабатывает вводимые слова с помощью двуязычного словаря 122, чтобы создать один или несколько переводов на конечный язык для каждого вводимого слова.
После выполнения ветвей 402 и 412 для всех имеющихся материалов (или, по меньшей мере, для количества материалов, достаточного для устойчивого поведения системы), процессор 106 на этапе 422 обрабатывает связи слова. Например, процессор 106 может применять связи слова из каждой ветви для формирования нейронной сети, которая определяет двустороннюю частоту связи для каждого слова. Это показано на фиг. 5, где предполагается, что слово исходного языка (например, английского) имеет пять переводов (ПЕРЕВ.1 - ПЕРЕВ.5) на конечный язык (например, японский), а японское слово имеет четыре английских перевода (ПЕРЕВ.А ПЕРЕВ.Э). В этом примере ПЕРЕВ.3 является в точности тем же словом, что и КОНЕЧНОЕ, а ПЕРЕВ. А является в точности тем же словом, что и ИСХОДНОЕ. Однако, если нейронная сеть находит, что для выбранной тематики ИСХОДНОЕ имеет значительно более высокую частотность, будучи переведенным как ПЕРЕВ.4, то тематический словарь 120 включит перевод ИСХОДНОГО как ПЕРЕВ.4, вместо того, чтобы использовать ПЕРЕВОД. 3, как могли бы делать общепринятые переводчики.
Двусторонние частоты связи используются процессором 106 в ходе применения способа Маркова во время обработки перевода. Способ Маркова может использоваться, например, для определения переходной вероятности появления одного слова после того, как было определено первое слово. Кроме того, в соответствии с принципами настоящего изобретения результаты способа Маркова могут варьироваться в зависимости от выбранной пользователем тематики. Один вариант этого способа показан ниже в таблице, в которой группа английских слов (показанных просто в виде комбинаций букв) коррелируется группой японских слов (изображенных в виде группы чисел).
японский
126 254 367 476 597
АВО | . 1 .5 .1 0 .3
1 геи 1 .2 .2 . 1 0 .5
английский икз 1 1 о 0 . б .2 .2
озъ 1 1 о 0 .2 .8 0
ρπσ 1 1 .7 .3 0 0 0
Для каждого слова на английском матрица Маркова, приведенная в таблице, задает вероятность перехода для каждого японского слова, которое может служить переводом этого английского слова. Например, ΑΒΌ можно перевести четырьмя различными японскими словами (т.е. 126, 254, 367 и 597), однако для выбранной тематики наиболее высока вероятность того, что ΑΒΌ следует переводить как 254 (вероятность 50%). Каждое слово в каждой строке и каждом столбце имеет полную вероятность 100% (например, слово 367 имеет четыре вероятности, которые в сумме дают 1- .1 + .1 + .6 + .2 = 1), что отражает тот факт, что каждое слово можно переводить в каждом направлении (т.е. с английского на японский или с японского на английский).
Как только все слова обработаны с использованием нейронной сети, процессор 106 на этапе 424 обновляет тематический словарь 120, чтобы включить тематический уровень для вы бранной тематики. Процесс, представленный на фиг. 4, может также использоваться для обновления любого слоя тематического словаря. В таком случае этапы 410 и 420 выполнялись бы путем применения к словам существующего уровня тематического словаря 120 до применения должного двуязычного словаря 122. Таким образом, можно было бы дополнительно повысить точность тематического словаря для выбранной тематики.
На фиг. 6 изображена блок-схема, которая иллюстрирует работу системы перевода 100 в соответствии с принципами настоящего изобретения. Способ, представленный на фиг. 6, можно использовать в разнообразных целях, хотя в целях иллюстрации предмет обсуждения сводится к телефонному разговору между двумя людьми, говорящими на разных языках. Кроме того, в порядке обсуждения, предполагается, что система перевода 100, используемая при выполнении этапов, показанных на фиг. 6, включает в себя комбинированные системы ввода/вывода 102/104 и 112/114, которые включают в себя телефон 202/302 (включающий в себя схему 204/304, необходимую для обработки голосовых данных) и видеоэкран/клавиатуру 210/310 для каждой стороны.
Первый этап происходит, когда человек, инициирующий вызов, на этапе 602 выбирает тематику разговора (например, если двое ученых намереваются обсудить химический состав нового лекарства против СПИДа, вызывающий абонент может выбрать химию, фармацевтические препараты или СПИД, в зависимости от тематической широты используемой системы). Вызов проходит общепринятым способом, и оба пользователя вступают в диалог (этап не показан). Каждый абонент говорит на этапе 604 в телефонную трубку, и голосовые сигналы обрабатываются, пока процессор 106 принимает сигналы, представляющие подвергнутые разбору вводимые слова на исходном языке. На этапе 606 процессор 106 присваивает классы словам наподобие того, что было описано выше в отношении этапов 408 и 418. Кроме того, вводимые слова можно обрабатывать с использованием, например, модели Маркова, чтобы выявить связь между каждым вводимым словом и окружающими словами. Модель Маркова позволяет системе 100 различать синонимы (например, ΐο, ΐοο и 1\\ό). а также вставлять пропущенные слова в тех случаях, когда произносятся словосочетания и незаконченные или неполные предложения.
На этапе 608 процессор 106 применяет к вводимым словам тематический словарь 120, чтобы выработать первоначальный перевод на конечный язык. На этапе 610 процессор 106 конструирует предложения путем применения к вводимым словам правил синтаксиса 124 исходного языка. Любой дополнительный перевод (например, любых других пропущенных слов) выполняется на этапе 612 путем обработки информации с применением двуязычного словаря
122, а также путем применения к вводимым словам правил грамматики 126. На этапе 614 процессор 106 обрабатывает вводимые слова и связанные с ними переводы по правилам синтаксиса 124 для конечного языка, в результате чего, получается переведенное сообщение, которое сохраняется в памяти 108. На этапе 616 информация выводится получателю в виде текста, произносимого на конечном языке посредством телефона 202/302.
Кроме того, по мере того, как человек на протяжении этапа 604 говорит по телефону 202/302, вводимые слова отображаются на видеоэкране/клавиатуре 210/310 (как только процессор 106 принимает их в проанализированном состоянии). Тем самым, человек получает возможность прерывать процессор 106 с целью проверки, по мере необходимости, вводимого сообщения (например, если в процессе распознавания голоса обнаруживаются ошибки). В то время, как слова синтезируются на конечном языке, получатель может также просматривать переведенное сообщение на видеоэкране/клавиатуре 210/310 и обеспечивать мгновенную обратную связь, если перевод непонятен. Например, если предложение, по большей части, понятно, за исключением одного-двух слов, человек может выбрать неясные слова на видеоэкране/клавиатуре 210/310, например, используя мышь или систему ввода сенсорного экрана (не показана). Вводимое слово предоставляется обратно инициатору, который может предоставить измененный текст на исходном языке, который затем переводится по-другому.
Таким образом, специалистам будет ясно, что настоящее изобретение может осуществляться на практике в вариантах реализации, отличных от описанных, которые представлены в целях иллюстрации, но не ограничения, и что настоящее изобретение ограничивается только нижеследующей формулой изобретения. Например, два человека, говорящие на разных языках, могли бы иметь полный разговор в режиме диалога, используя только пару видеоэкран/клавиатура 210/310 вместо телефонов 202/302, или система перевода настоящего изобретения может использоваться для перевода технической или иной специализированной документации на основе использования тематического словаря.

Claims (15)

  1. ФОРМУЛА ИЗОБРЕТЕНИЯ
    1. Способ создания тематического двуязычного словаря для использования в системе тематического двуязычного перевода, включающий этапы ввода первого множества документов на первом языке в систему перевода, выполнения разбора первого множества документов на первое множество отдельных слов, соотнесения с классами первого множества разобранных слов из первого множества документов, приложения первого множества разобранных слов к тематическому двуязычному словарю для выполнения перевода, по меньшей мере, некоторых слов из первого множества разобранных слов, приложения непереведенных разобранных слов из первого множества разобранных слов к обычному двуязычному словарю для выполнения перевода непереведенного первого множества разобранных слов, ввода второго множества документов на втором языке в систему перевода, выполнения разбора второго множества документов на второе множество отдельных слов, соотнесения с классами второго множества разобранных слов из второго множества документов, приложения второго множества разобранных слов к тематическому двуязычному словарю для выполнения перевода, по меньшей мере, некоторых слов из второго множества разобранных слов, приложения непереведенных разобранных слов из второго множества разобранных слов к обычному двуязычному словарю для выполнения перевода непереведенного второго множества разобранных слов, обработки связей слов между первым и вторым множествами переведенных слов для создания прямой и обратной частоты связи и обновления тематического словаря на основе частоты связи.
  2. 2. Способ по п.1, при котором этап ввода первого множества документов содержит этапы приема словесных голосовых сигналов по телефону и обработки голосовых сигналов с использованием схемы распознавания голоса для создания электронных сигналов, представляющих голосовые сигналы.
  3. 3. Способ по п.1, при котором этап ввода множества документов содержит этапы приема сигналов от сканера и обработки сигналов сканера с использованием схемы распознавания оптических символов для преобразования сигналов сканера в текстовую информацию.
  4. 4. Способ по п.1, при котором этап ввода первого множества документов содержит этап приема текстовой информации посредством клавиатуры компьютера.
  5. 5. Способ по п.1, при котором этап соотнесения с классами первого множества разобранных слов содержит этап определения грамматической функции, по меньшей мере, большинства отдельных слов.
  6. 6. Способ по п.1, при котором этап соотнесения с классами первого множества разобранных слов содержит этап определения граммати ческой формы, по меньшей мере, большинства отдельных слов.
  7. 7. Способ по п.1, при котором этап соотнесения с классами первого множества разобранных слов содержит этап определения значения, по меньшей мере, большинства отдельных слов.
  8. 8. Способ по п.1, при котором этап соотнесения с классами первого множества разобранных слов содержит этапы определения грамматической функции, по меньшей мере, большинства отдельных слов, определения грамматической формы, по меньшей мере, большинства отдельных слов и определения значения, по меньшей мере, большинства отдельных слов.
  9. 9. Способ по п.1, дополнительно содержащий этап приложения отдельных слов к модели Маркова, которая связывает каждое отдельное слово с отдельными словами, окружающими каждое отдельное слово, по меньшей мере, для снижения частотности синонимов.
  10. 10. Система для создания тематического двуязычного словаря для использования в системе тематического двуязычного перевода, содержащая схему ввода, принимающую вводимые документы, схему обработки, выполненную с возможностью
    - осуществления разбора первого множества документов на первое множество отдельных слов и соотнесения с классами первого множества разобранных слов,
    - осуществления приложения первого множества разобранных слов к тематическому двуязычному словарю для выполнения перевода, по меньшей мере, некоторых слов из первого множества разобранных слов и приложения непереведенных разобранных слов из первого множества разобранных слов к обычному двуязычному словарю для выполнения перевода непереведенных слов первого множества разобранных слов,
    - выполнения грамматического разбора второго множества документов на второе множество отдельных слов и соотнесения с классами второго множества разобранных слов,
    - осуществления приложения второго множества разобранных слов к тематическому двуязычному словарю для выполнения перевода, по меньшей мере, некоторых слов второго множества разобранных слов и приложения непереведенных разобранных слов из второго множества разобранных слов к обычному двуязычному словарю для выполнения перевода непереведенного второго множества разобранных слов и
    - обработки связи слов между первым и вторым множеством переведенных слов для создания прямой и обратной частоты связи, причем тематический словарь на основе частоты связи обновляется.
  11. 11. Система по п.10, в которой схема ввода содержит телефон и схему распознавания голоса.
  12. 12. Система по п.10, в которой схема ввода содержит сканер и схему распознавания оптических символов.
  13. 13. Система по п.10, в которой схема ввода содержит компьютерный терминал, включающий в себя видеоэкран и клавиатуру.
  14. 14. Система по п.13, в которой видеоэкран отображает вводимые сообщения, а компьютер- ный терминал дополнительно содержит средство исправления вводимого сообщения.
  15. 15. Система по п.13, в которой компьютерный терминал дополнительно содержит средство указания пользователю, что одно или несколько слов переведенного сообщения неясны.
EA199900377A 1996-10-18 1997-10-16 Способ и аппаратура для перевода с одного языка на другой EA002989B1 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/733,808 US6085162A (en) 1996-10-18 1996-10-18 Translation system and method in which words are translated by a specialized dictionary and then a general dictionary
PCT/US1997/018597 WO1998018085A1 (en) 1996-10-18 1997-10-16 Methods and apparatus for translating between languages

Publications (2)

Publication Number Publication Date
EA199900377A1 EA199900377A1 (ru) 1999-10-28
EA002989B1 true EA002989B1 (ru) 2002-12-26

Family

ID=24949189

Family Applications (1)

Application Number Title Priority Date Filing Date
EA199900377A EA002989B1 (ru) 1996-10-18 1997-10-16 Способ и аппаратура для перевода с одного языка на другой

Country Status (16)

Country Link
US (2) US6085162A (ru)
EP (1) EP0932871B1 (ru)
JP (1) JP2001502828A (ru)
CN (1) CN1204514C (ru)
AT (1) ATE216790T1 (ru)
AU (1) AU720794B2 (ru)
CA (1) CA2269084A1 (ru)
DE (1) DE69712216T2 (ru)
DK (1) DK0932871T3 (ru)
EA (1) EA002989B1 (ru)
ES (1) ES2173424T3 (ru)
IL (1) IL129524A (ru)
NZ (1) NZ335767A (ru)
PT (1) PT932871E (ru)
TW (1) TW432320B (ru)
WO (1) WO1998018085A1 (ru)

Families Citing this family (185)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US6085162A (en) * 1996-10-18 2000-07-04 Gedanken Corporation Translation system and method in which words are translated by a specialized dictionary and then a general dictionary
CA2242065C (en) * 1997-07-03 2004-12-14 Henry C.A. Hyde-Thomson Unified messaging system with automatic language identification for text-to-speech conversion
ITUD980032A1 (it) * 1998-03-03 1998-06-03 Agostini Organizzazione Srl D Sistema di traduzione a macchina e rispettivo tradsistema di traduzione a macchina e rispettivo traduttore che comprende tale sistema uttore che comprende tale sistema
FR2781963A1 (fr) * 1998-07-28 2000-02-04 Sylvie Massoni Pythoud Procede par circuit electronique integre et/ou ajoute pour traduire instantanement une communication telephonique
FR2781964A1 (fr) * 1998-07-28 2000-02-04 Sylvie Massoni Pythoud Dispositif comprenant un systeme emetteur-recepteur a fibres optiques memorisees et numerisees permettant la traduction electronique automatique et instantanee autant sur support oral que supports ecrits par exemples telephonie, fax
KR100681989B1 (ko) * 1998-08-31 2007-02-15 소니 가부시끼 가이샤 자연 언어 처리 장치 및 방법
US6282507B1 (en) 1999-01-29 2001-08-28 Sony Corporation Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6356865B1 (en) * 1999-01-29 2002-03-12 Sony Corporation Method and apparatus for performing spoken language translation
US6442524B1 (en) 1999-01-29 2002-08-27 Sony Corporation Analyzing inflectional morphology in a spoken language translation system
US6278968B1 (en) 1999-01-29 2001-08-21 Sony Corporation Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6243669B1 (en) 1999-01-29 2001-06-05 Sony Corporation Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6266642B1 (en) 1999-01-29 2001-07-24 Sony Corporation Method and portable apparatus for performing spoken language translation
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US6374224B1 (en) 1999-03-10 2002-04-16 Sony Corporation Method and apparatus for style control in natural language generation
US8438038B2 (en) * 1999-04-16 2013-05-07 Cardiocom, Llc Weight loss or weight management system
US20070021979A1 (en) * 1999-04-16 2007-01-25 Cosentino Daniel L Multiuser wellness parameter monitoring system
US7577475B2 (en) * 1999-04-16 2009-08-18 Cardiocom System, method, and apparatus for combining information from an implanted device with information from a patient monitoring apparatus
US8419650B2 (en) 1999-04-16 2013-04-16 Cariocom, LLC Downloadable datasets for a patient monitoring system
US7945451B2 (en) * 1999-04-16 2011-05-17 Cardiocom, Llc Remote monitoring system for ambulatory patients
US20060030890A1 (en) * 1999-04-16 2006-02-09 Cosentino Daniel L System, method, and apparatus for automated interactive verification of an alert generated by a patient monitoring device
US6290646B1 (en) * 1999-04-16 2001-09-18 Cardiocom Apparatus and method for monitoring and communicating wellness parameters of ambulatory patients
US6755783B2 (en) * 1999-04-16 2004-06-29 Cardiocom Apparatus and method for two-way communication in a device for monitoring and communicating wellness parameters of ambulatory patients
JP3711411B2 (ja) * 1999-04-19 2005-11-02 沖電気工業株式会社 音声合成装置
AU6405900A (en) * 1999-06-21 2001-01-09 Cleverlearn.Com Language teaching and translation system and method
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
JP2001101185A (ja) * 1999-09-24 2001-04-13 Internatl Business Mach Corp <Ibm> 辞書の自動切り換えが可能な機械翻訳方法および装置並びにそのような機械翻訳方法を実行するためのプログラムを記憶したプログラム記憶媒体
JP2001101187A (ja) * 1999-09-30 2001-04-13 Sony Corp 翻訳装置および翻訳方法、並びに記録媒体
US6587818B2 (en) * 1999-10-28 2003-07-01 International Business Machines Corporation System and method for resolving decoding ambiguity via dialog
US6848080B1 (en) * 1999-11-05 2005-01-25 Microsoft Corporation Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors
US7403888B1 (en) * 1999-11-05 2008-07-22 Microsoft Corporation Language input user interface
US20030033534A1 (en) * 1999-11-29 2003-02-13 Rand Ricky C System and method for dual key card dual database access control and identification
US6522889B1 (en) 1999-12-23 2003-02-18 Nokia Corporation Method and apparatus for providing precise location information through a communications network
US20010056342A1 (en) * 2000-02-24 2001-12-27 Piehn Thomas Barry Voice enabled digital camera and language translator
US7047493B1 (en) 2000-03-31 2006-05-16 Brill Eric D Spell checker with arbitrary length string-to-string transformations to improve noisy channel spelling correction
JP2003529845A (ja) * 2000-03-31 2003-10-07 アミカイ・インコーポレイテッド ネットワーク経由の多言語翻訳を提供する方法と装置
JP2001292234A (ja) * 2000-04-07 2001-10-19 Nec Corp 翻訳サービス提供方法
US7069222B1 (en) * 2000-06-23 2006-06-27 Brigido A Borquez Method and system for consecutive translation from a source language to a target language via a simultaneous mode
JP2002041432A (ja) * 2000-07-25 2002-02-08 Oki Electric Ind Co Ltd チャットシステム,端末装置,サーバ装置及び媒体
US6704699B2 (en) * 2000-09-05 2004-03-09 Einat H. Nir Language acquisition aide
DE10048069A1 (de) * 2000-09-28 2002-04-25 Global Language Comm Systems E Elektronische Textübertragungsvorrichtung
US7155517B1 (en) 2000-09-28 2006-12-26 Nokia Corporation System and method for communicating reference information via a wireless terminal
JP4089148B2 (ja) 2000-10-17 2008-05-28 株式会社日立製作所 通訳サービス方法および通訳サービス装置
US6885985B2 (en) * 2000-12-18 2005-04-26 Xerox Corporation Terminology translation for unaligned comparable corpora using category based translation probabilities
US7904595B2 (en) 2001-01-18 2011-03-08 Sdl International America Incorporated Globalization management system and method therefor
JP3379090B2 (ja) * 2001-03-02 2003-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム
US20030083860A1 (en) * 2001-03-16 2003-05-01 Eli Abir Content conversion method and apparatus
US20030093261A1 (en) * 2001-03-16 2003-05-15 Eli Abir Multilingual database creation system and method
US7483828B2 (en) 2001-03-16 2009-01-27 Meaningful Machines, L.L.C. Multilingual database creation system and method
US20030135357A1 (en) * 2001-03-16 2003-07-17 Eli Abir Multilingual database creation system and method
US7711547B2 (en) * 2001-03-16 2010-05-04 Meaningful Machines, L.L.C. Word association method and apparatus
US8744835B2 (en) * 2001-03-16 2014-06-03 Meaningful Machines Llc Content conversion method and apparatus
US8874431B2 (en) * 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US7860706B2 (en) 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US6542200B1 (en) 2001-08-14 2003-04-01 Cheldan Technologies, Inc. Television/radio speech-to-text translating processor
US20070265834A1 (en) * 2001-09-06 2007-11-15 Einat Melnick In-context analysis
US7286993B2 (en) * 2002-01-31 2007-10-23 Product Discovery, Inc. Holographic speech translation system and method
US6952691B2 (en) * 2002-02-01 2005-10-04 International Business Machines Corporation Method and system for searching a multi-lingual database
US20030154069A1 (en) * 2002-02-14 2003-08-14 International Business Machines Corporation Computerized system and method for converting selected text between languages
GB0204056D0 (en) * 2002-02-21 2002-04-10 Mitel Knowledge Corp Voice activated language translation
US7361881B2 (en) * 2002-03-13 2008-04-22 Oy Ajat Ltd Ganged detector pixel, photon/pulse counting radiation imaging device
US8856236B2 (en) * 2002-04-02 2014-10-07 Verizon Patent And Licensing Inc. Messaging response system
US7382868B2 (en) * 2002-04-02 2008-06-03 Verizon Business Global Llc Telephony services system with instant communications enhancements
US7917581B2 (en) 2002-04-02 2011-03-29 Verizon Business Global Llc Call completion via instant communications client
EP1576586A4 (en) * 2002-11-22 2006-02-15 Transclick Inc LANGUAGE TRANSLATION SYSTEM AND METHOD
AU2003274592A1 (en) 2002-11-28 2004-06-18 Koninklijke Philips Electronics N.V. Method to assign word class information
JP4398144B2 (ja) * 2002-12-24 2010-01-13 インターナショナル・ビジネス・マシーンズ・コーポレーション 辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体
US7260537B2 (en) * 2003-03-25 2007-08-21 International Business Machines Corporation Disambiguating results within a speech based IVR session
JP2004294816A (ja) * 2003-03-27 2004-10-21 Yamaha Corp 携帯端末装置
US7283949B2 (en) * 2003-04-04 2007-10-16 International Business Machines Corporation System, method and program product for bidirectional text translation
US6999758B2 (en) * 2003-05-06 2006-02-14 Ocmc, Inc. System and method for providing communications services
US8050906B1 (en) * 2003-06-01 2011-11-01 Sajan, Inc. Systems and methods for translating text
US7854009B2 (en) * 2003-06-12 2010-12-14 International Business Machines Corporation Method of securing access to IP LANs
US8014997B2 (en) 2003-09-20 2011-09-06 International Business Machines Corporation Method of search content enhancement
US20050065774A1 (en) * 2003-09-20 2005-03-24 International Business Machines Corporation Method of self enhancement of search results through analysis of system logs
US7310605B2 (en) * 2003-11-25 2007-12-18 International Business Machines Corporation Method and apparatus to transliterate text using a portable device
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US20060136629A1 (en) * 2004-08-18 2006-06-22 King Martin T Scanner having connected and unconnected operational behaviors
US7812860B2 (en) 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US20050192487A1 (en) * 2004-02-27 2005-09-01 Cosentino Louis C. System for collection, manipulation, and analysis of data from remote health care devices
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
TWI253590B (en) * 2004-03-11 2006-04-21 Pixart Imaging Inc Method for detecting the position of a digitizer on a display
CN100371928C (zh) * 2004-03-31 2008-02-27 摩托罗拉公司 为文语转换合成选取用于确定发音波形的语音标识符
US20060081714A1 (en) 2004-08-23 2006-04-20 King Martin T Portable scanning device
US8146156B2 (en) 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US20060098900A1 (en) 2004-09-27 2006-05-11 King Martin T Secure data gathering from rendered documents
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US8081849B2 (en) 2004-12-03 2011-12-20 Google Inc. Portable scanning and memory device
US9008447B2 (en) 2004-04-01 2015-04-14 Google Inc. Method and system for character recognition
US8036895B2 (en) * 2004-04-02 2011-10-11 K-Nfb Reading Technology, Inc. Cooperative processing for portable reading machine
US8713418B2 (en) 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
US8219907B2 (en) * 2005-03-08 2012-07-10 Microsoft Corporation Resource authoring with re-usability score and suggested re-usable data
US20060206797A1 (en) * 2005-03-08 2006-09-14 Microsoft Corporation Authorizing implementing application localization rules
JP2006252049A (ja) * 2005-03-09 2006-09-21 Fuji Xerox Co Ltd 翻訳システム、翻訳方法およびプログラム
WO2006133571A1 (en) * 2005-06-17 2006-12-21 National Research Council Of Canada Means and method for adapted language translation
US7643985B2 (en) * 2005-06-27 2010-01-05 Microsoft Corporation Context-sensitive communication and translation methods for enhanced interactions and understanding among speakers of different languages
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US7822596B2 (en) * 2005-12-05 2010-10-26 Microsoft Corporation Flexible display translation
US7840406B2 (en) * 2006-02-07 2010-11-23 Samsung Electronics Co., Ltd. Method for providing an electronic dictionary in wireless terminal and wireless terminal implementing the same
EP3534277B1 (en) * 2006-02-17 2021-10-06 Google LLC Encoding and adaptive, scalable accessing of distributed models
TWI317489B (en) * 2006-03-27 2009-11-21 Inventec Appliances Corp Apparatus and method for image recognition and translation
US7848915B2 (en) * 2006-08-09 2010-12-07 International Business Machines Corporation Apparatus for providing feedback of translation quality using concept-based back translation
US7881928B2 (en) * 2006-09-01 2011-02-01 International Business Machines Corporation Enhanced linguistic transformation
US9575953B2 (en) * 2006-09-07 2017-02-21 Nec Corporation Natural-language processing system and dictionary registration system
EP2067119A2 (en) 2006-09-08 2009-06-10 Exbiblio B.V. Optical scanners, such as hand-held optical scanners
JP4481972B2 (ja) 2006-09-28 2010-06-16 株式会社東芝 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム
US9070363B2 (en) * 2007-10-26 2015-06-30 Facebook, Inc. Speech translation with back-channeling cues
US9128926B2 (en) 2006-10-26 2015-09-08 Facebook, Inc. Simultaneous translation of open domain lectures and speeches
US8972268B2 (en) 2008-04-15 2015-03-03 Facebook, Inc. Enhanced speech-to-speech translation system and methods for adding a new word
US11222185B2 (en) 2006-10-26 2022-01-11 Meta Platforms, Inc. Lexicon development via shared translation database
US8090570B2 (en) 2006-10-26 2012-01-03 Mobile Technologies, Llc Simultaneous translation of open domain lectures and speeches
US20110035662A1 (en) 2009-02-18 2011-02-10 King Martin T Interacting with rendered documents using a multi-function mobile device, such as a mobile phone
US8645120B2 (en) * 2007-10-16 2014-02-04 Lockheed Martin Corporation System and method of prioritizing automated translation of communications from a first human language to a second human language
US8086440B2 (en) * 2007-10-16 2011-12-27 Lockheed Martin Corporation System and method of prioritizing automated translation of communications from a first human language to a second human language
US8725490B2 (en) * 2007-10-18 2014-05-13 Yahoo! Inc. Virtual universal translator for a mobile device with a camera
JP5340584B2 (ja) 2007-11-28 2013-11-13 インターナショナル・ビジネス・マシーンズ・コーポレーション 電子メッセージの読解を支援する装置及び方法
CA2727046A1 (en) * 2008-06-09 2009-12-17 National Research Council Of Canada Method and system for using alignment means in matching translation
KR100998566B1 (ko) * 2008-08-11 2010-12-07 엘지전자 주식회사 음성인식을 이용한 언어 번역 방법 및 장치
US20100070482A1 (en) * 2008-09-12 2010-03-18 Murali-Krishna Punaganti Venkata Method, system, and apparatus for content search on a device
US8818992B2 (en) * 2008-09-12 2014-08-26 Nokia Corporation Method, system, and apparatus for arranging content search results
US7593844B1 (en) 2008-09-22 2009-09-22 International Business Machines Corporation Document translation systems and methods employing translation memories
US8284909B2 (en) 2008-09-29 2012-10-09 Microsoft Corporation Offline voicemail
US8494857B2 (en) 2009-01-06 2013-07-23 Regents Of The University Of Minnesota Automatic measurement of speech fluency
JP4703787B2 (ja) * 2009-01-28 2011-06-15 三菱電機株式会社 音声認識装置
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
US8990235B2 (en) 2009-03-12 2015-03-24 Google Inc. Automatically providing content associated with captured information, such as information captured in real-time
US8738354B2 (en) * 2009-06-19 2014-05-27 Microsoft Corporation Trans-lingual representation of text documents
US8352244B2 (en) * 2009-07-21 2013-01-08 International Business Machines Corporation Active learning systems and methods for rapid porting of machine translation systems to new language pairs or new domains
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
WO2011096015A1 (ja) * 2010-02-05 2011-08-11 三菱電機株式会社 認識辞書作成装置及び音声認識装置
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US20110270601A1 (en) * 2010-04-28 2011-11-03 Vahe Nick Karapetian, Jr. Universal translator
US9547626B2 (en) 2011-01-29 2017-01-17 Sdl Plc Systems, methods, and media for managing ambient adaptability of web applications and web services
US10657540B2 (en) 2011-01-29 2020-05-19 Sdl Netherlands B.V. Systems, methods, and media for web content management
US10580015B2 (en) 2011-02-25 2020-03-03 Sdl Netherlands B.V. Systems, methods, and media for executing and optimizing online marketing initiatives
US10140320B2 (en) 2011-02-28 2018-11-27 Sdl Inc. Systems, methods, and media for generating analytical data
US20120253784A1 (en) * 2011-03-31 2012-10-04 International Business Machines Corporation Language translation based on nearby devices
US9984054B2 (en) 2011-08-24 2018-05-29 Sdl Inc. Web interface including the review and manipulation of a web document and utilizing permission based control
JP5642037B2 (ja) * 2011-09-22 2014-12-17 株式会社東芝 検索装置、検索方法およびプログラム
CN103164397B (zh) * 2011-12-19 2018-02-02 新疆信息产业有限责任公司 汉哈电子辞典及其自动转译汉哈语的方法
CN103164395B (zh) * 2011-12-19 2017-06-23 新疆信息产业有限责任公司 汉柯电子辞典及其自动转译汉柯语的方法
WO2013102052A1 (en) * 2011-12-28 2013-07-04 Bloomberg Finance L.P. System and method for interactive automatic translation
US8903707B2 (en) * 2012-01-12 2014-12-02 International Business Machines Corporation Predicting pronouns of dropped pronoun style languages for natural language translation
US9256597B2 (en) * 2012-01-24 2016-02-09 Ming Li System, method and computer program for correcting machine translation information
WO2013138633A1 (en) 2012-03-15 2013-09-19 Regents Of The University Of Minnesota Automated verbal fluency assessment
US9773270B2 (en) 2012-05-11 2017-09-26 Fredhopper B.V. Method and system for recommending products based on a ranking cocktail
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US8996354B1 (en) * 2012-09-10 2015-03-31 Kabam, Inc. Facilitating localization of linguistic assets of a virtual space
US11308528B2 (en) 2012-09-14 2022-04-19 Sdl Netherlands B.V. Blueprinting of multimedia assets
US11386186B2 (en) 2012-09-14 2022-07-12 Sdl Netherlands B.V. External content library connector systems and methods
US10452740B2 (en) 2012-09-14 2019-10-22 Sdl Netherlands B.V. External content libraries
US9916306B2 (en) 2012-10-19 2018-03-13 Sdl Inc. Statistical linguistic analysis of source content
US9395234B2 (en) 2012-12-05 2016-07-19 Cardiocom, Llc Stabilizing base for scale
US8914395B2 (en) 2013-01-03 2014-12-16 Uptodate, Inc. Database query translation system
US9135916B2 (en) * 2013-02-26 2015-09-15 Honeywell International Inc. System and method for correcting accent induced speech transmission problems
US9892115B2 (en) 2013-06-11 2018-02-13 Facebook, Inc. Translation training with cross-lingual multi-media support
JP6178198B2 (ja) * 2013-09-30 2017-08-09 株式会社東芝 音声翻訳システム、方法およびプログラム
CN104598443B (zh) * 2013-10-31 2018-05-18 腾讯科技(深圳)有限公司 语言服务提供方法、装置及系统
JP6328409B2 (ja) * 2013-11-28 2018-05-23 シャープ株式会社 翻訳装置
JP5843117B2 (ja) * 2013-12-04 2016-01-13 国立研究開発法人情報通信研究機構 学習装置、翻訳装置、学習方法、翻訳方法、およびプログラム
JP2015138414A (ja) * 2014-01-22 2015-07-30 富士通株式会社 機械翻訳装置、翻訳方法、及び、そのプログラム
CN104090870B (zh) * 2014-06-26 2018-04-20 语联网(武汉)信息技术有限公司 一种在线翻译引擎的推送方法
US20160162507A1 (en) * 2014-12-05 2016-06-09 International Business Machines Corporation Automated data duplicate identification
US9836457B2 (en) * 2015-05-25 2017-12-05 Panasonic Intellectual Property Corporation Of America Machine translation method for performing translation between languages
CN106547743B (zh) 2015-09-23 2020-03-27 阿里巴巴集团控股有限公司 一种进行翻译的方法及其系统
US10614167B2 (en) 2015-10-30 2020-04-07 Sdl Plc Translation review workflow systems and methods
CN105808527A (zh) * 2016-02-24 2016-07-27 北京百度网讯科技有限公司 基于人工智能的定向翻译方法及装置
KR102463567B1 (ko) * 2016-05-06 2022-11-07 이베이 인크. 인공신경망 기계 번역시 메타 정보를 이용하는 기법
JP6705318B2 (ja) * 2016-07-14 2020-06-03 富士通株式会社 対訳辞書作成装置、対訳辞書作成方法、及び対訳辞書作成プログラム
KR102349620B1 (ko) * 2017-03-23 2022-01-10 주식회사 엘지유플러스 사용자 단말을 통해 통번역 서비스를 제공하는 방법 및 그 장치
CN107291703B (zh) * 2017-05-17 2021-06-08 百度在线网络技术(北京)有限公司 翻译服务应用中的发音方法及装置
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
CN112579735B (zh) * 2020-12-09 2023-04-28 北京字节跳动网络技术有限公司 一种题目生成方法、装置、计算机设备及存储介质

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3364473A (en) * 1964-10-05 1968-01-16 Bunker Ramo Data display system
US4706212A (en) * 1971-08-31 1987-11-10 Toma Peter P Method using a programmed digital computer system for translation between natural languages
US3770892A (en) * 1972-05-26 1973-11-06 Ibm Connected word recognition system
US4193119A (en) * 1977-03-25 1980-03-11 Xerox Corporation Apparatus for assisting in the transposition of foreign language text
US4631748A (en) * 1978-04-28 1986-12-23 Texas Instruments Incorporated Electronic handheld translator having miniature electronic speech synthesis chip
JPS5953590B2 (ja) * 1979-09-14 1984-12-26 シャープ株式会社 翻訳装置
US4393462A (en) * 1979-10-24 1983-07-12 Sharp Kabushiki Kaisha Electronic translator with means for pronouncing input words and translated words
JPS5723176A (en) * 1980-07-18 1982-02-06 Sharp Corp Electronic translator
JPS5774799A (en) * 1980-10-28 1982-05-11 Sharp Kk Word voice notifying system
US4507750A (en) * 1982-05-13 1985-03-26 Texas Instruments Incorporated Electronic apparatus from a host language
EP0176858B1 (en) * 1984-09-18 1993-01-20 Sharp Kabushiki Kaisha Translation system
JPS6244874A (ja) * 1985-08-22 1987-02-26 Toshiba Corp 機械翻訳装置
US4769846A (en) * 1985-09-09 1988-09-06 Simmons William F Speech therapy variable code learning translator
US5384701A (en) * 1986-10-03 1995-01-24 British Telecommunications Public Limited Company Language translation system
US4852170A (en) * 1986-12-18 1989-07-25 R & D Associates Real time computer speech recognition system
US4864503A (en) * 1987-02-05 1989-09-05 Toltran, Ltd. Method of using a created international language as an intermediate pathway in translation between two national languages
US4984177A (en) * 1988-02-05 1991-01-08 Advanced Products And Technologies, Inc. Voice language translator
JPH01279368A (ja) * 1988-04-30 1989-11-09 Sharp Corp キャラクタデータの転送方式
JPH0342772A (ja) * 1989-07-11 1991-02-22 Nec Corp 言語翻訳サービス方式
JP2836159B2 (ja) * 1990-01-30 1998-12-14 株式会社日立製作所 同時通訳向き音声認識システムおよびその音声認識方法
JP3114181B2 (ja) * 1990-03-27 2000-12-04 株式会社日立製作所 異言語交信用翻訳方法およびシステム
US5497319A (en) * 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
US5175684A (en) * 1990-12-31 1992-12-29 Trans-Link International Corp. Automatic text translation and routing system
JPH04235672A (ja) * 1991-01-10 1992-08-24 Sharp Corp 翻訳装置
US5251130A (en) * 1991-04-18 1993-10-05 International Business Machines Corporation Method and apparatus for facilitating contextual language translation within an interactive software application
US5241619A (en) * 1991-06-25 1993-08-31 Bolt Beranek And Newman Inc. Word dependent N-best search method
US5475587A (en) * 1991-06-28 1995-12-12 Digital Equipment Corporation Method and apparatus for efficient morphological text analysis using a high-level language for compact specification of inflectional paradigms
US5442780A (en) * 1991-07-11 1995-08-15 Mitsubishi Denki Kabushiki Kaisha Natural language database retrieval system using virtual tables to convert parsed input phrases into retrieval keys
US5475798A (en) * 1992-01-06 1995-12-12 Handlos, L.L.C. Speech-to-text translator
GB9209346D0 (en) * 1992-04-30 1992-06-17 Sharp Kk Machine translation system
US5523943A (en) * 1992-05-20 1996-06-04 Fuji Xerox Co., Ltd. Data processing device
US5293584A (en) * 1992-05-21 1994-03-08 International Business Machines Corporation Speech recognition system for natural language translation
US5375164A (en) * 1992-05-26 1994-12-20 At&T Corp. Multiple language capability in an interactive system
US5528491A (en) * 1992-08-31 1996-06-18 Language Engineering Corporation Apparatus and method for automated natural language translation
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
JP2745370B2 (ja) * 1993-02-23 1998-04-28 日本アイ・ビー・エム株式会社 機械翻訳方法及び機械翻訳装置
US5432948A (en) * 1993-04-26 1995-07-11 Taligent, Inc. Object-oriented rule-based text input transliteration system
SE500277C2 (sv) * 1993-05-10 1994-05-24 Televerket Anordning för att öka talförståelsen vid översätttning av tal från ett första språk till ett andra språk
GB2279164A (en) * 1993-06-18 1994-12-21 Canon Res Ct Europe Ltd Processing a bilingual database.
EP0645757B1 (en) * 1993-09-23 2000-04-05 Xerox Corporation Semantic co-occurrence filtering for speech recognition and signal transcription applications
US5510981A (en) * 1993-10-28 1996-04-23 International Business Machines Corporation Language translation apparatus and method using context-based translation models
US5695980A (en) * 1995-06-06 1997-12-09 Human Genome Sciences Polynucleotides, vectors, cells and an expression method for human MutT2
JP3741156B2 (ja) * 1995-04-07 2006-02-01 ソニー株式会社 音声認識装置および音声認識方法並びに音声翻訳装置
JPH09128396A (ja) * 1995-11-06 1997-05-16 Hitachi Ltd 対訳辞書作成方法
US6085162A (en) * 1996-10-18 2000-07-04 Gedanken Corporation Translation system and method in which words are translated by a specialized dictionary and then a general dictionary

Also Published As

Publication number Publication date
DE69712216T2 (de) 2002-12-12
IL129524A (en) 2003-04-10
NZ335767A (en) 1999-08-30
CN1238051A (zh) 1999-12-08
US6219646B1 (en) 2001-04-17
ES2173424T3 (es) 2002-10-16
US6085162A (en) 2000-07-04
EP0932871B1 (en) 2002-04-24
EA199900377A1 (ru) 1999-10-28
DK0932871T3 (da) 2002-08-05
JP2001502828A (ja) 2001-02-27
EP0932871A1 (en) 1999-08-04
DE69712216D1 (de) 2002-05-29
CN1204514C (zh) 2005-06-01
AU4757197A (en) 1998-05-15
TW432320B (en) 2001-05-01
PT932871E (pt) 2002-09-30
CA2269084A1 (en) 1998-04-30
WO1998018085A1 (en) 1998-04-30
AU720794B2 (en) 2000-06-15
IL129524A0 (en) 2000-02-29
ATE216790T1 (de) 2002-05-15

Similar Documents

Publication Publication Date Title
EA002989B1 (ru) Способ и аппаратура для перевода с одного языка на другой
US7467085B2 (en) Method and apparatus for language translation using registered databases
US20070061131A1 (en) Japanese virtual dictionary
JPH01251276A (ja) 機械翻訳システム
KR20200017600A (ko) 번역 서비스 제공 장치 및 방법
JPH0344764A (ja) 機械翻訳装置
KR20200064972A (ko) 번역 서비스 제공 장치 및 방법
Anderson et al. Towards a bilingual SMS parser for HIV and AIDS information retrieval in Botswana
JPS6337471A (ja) 翻訳方法及び装置
Yamron et al. LINGSTAT: An interactive, machine-aided translation system
JPS61260367A (ja) 機械翻訳システム
Li et al. Using Grammatical and Semantic Correction Model to Improve Chinese-to-Taiwanese Machine Translation Fluency
Mima et al. A situation-based approach to spoken dialog translation between different social roles
JP2871300B2 (ja) 機械翻訳装置
JP2655922B2 (ja) 機械翻訳装置
Khan et al. A Cross-lingual Messenger with Keyword Searchable Phrases for the Travel Domain
JPH07200605A (ja) 翻訳装置
JPH1185753A (ja) 誤訳のない多言語翻訳方法
JPH0378863A (ja) かな漢字変換装置
JP2004199173A (ja) 自然言語パターン生成装置、自然言語処理装置、自然言語パターン生成方法、プログラム及び記憶媒体
JP2008158642A (ja) 言語翻訳方法、言語翻訳装置、言語翻訳プログラム、および言語翻訳プログラムを記録した記録媒体
JPS6190271A (ja) 入力語の探索表示方式
JPS62210578A (ja) 中国語から日本語への翻訳方式
JPH04195586A (ja) 中国語音声入力による機械翻訳装置
JPS62271060A (ja) 機械翻訳システム

Legal Events

Date Code Title Description
MM4A Lapse of a eurasian patent due to non-payment of renewal fees within the time limit in the following designated state(s)

Designated state(s): AM AZ BY KZ KG MD TJ TM RU