RU2357285C2 - Способы и системы для перевода с одного языка на другой - Google Patents

Способы и системы для перевода с одного языка на другой Download PDF

Info

Publication number
RU2357285C2
RU2357285C2 RU2004105167/09A RU2004105167A RU2357285C2 RU 2357285 C2 RU2357285 C2 RU 2357285C2 RU 2004105167/09 A RU2004105167/09 A RU 2004105167/09A RU 2004105167 A RU2004105167 A RU 2004105167A RU 2357285 C2 RU2357285 C2 RU 2357285C2
Authority
RU
Russia
Prior art keywords
language
translation
database
user
dependent
Prior art date
Application number
RU2004105167/09A
Other languages
English (en)
Other versions
RU2004105167A (ru
Inventor
Мин ЧЖО (CN)
Мин ЧЖО
Цзяньфэн ГАО (CN)
Цзяньфэн ГАО
Original Assignee
Майкрософт Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Майкрософт Корпорейшн filed Critical Майкрософт Корпорейшн
Publication of RU2004105167A publication Critical patent/RU2004105167A/ru
Application granted granted Critical
Publication of RU2357285C2 publication Critical patent/RU2357285C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

Изобретение относится к области перевода с одного языка на другой. Изобретение позволяет повысить качество и удобство перевода текста на естественном языке. Беспроводному мобильному устройству предоставляется услуга перевода посредством избирательной загрузки информации с сервера. Загружаемая информация включает в себя архитектуру перевода, имеющую независимое от языка средство перевода и, по меньшей мере, одну зависящую от языка базу данных перевода. Зависящая от языка база данных перевода включает в себя шаблоны перевода и словарь перевода. Также может загружаться специализированная база данных для выбранного города или городов мира. Перевод между языками осуществляется путем применения в средстве перевода зависящей от языка базы данных перевода и базы данных перевода, специфической для конкретного города. Для упрощения процесса перевода средство перевода реализует управляемую пользователем схему замены терминов. 3 н. и 21 з.п. ф-лы, 5 ил.

Description

Предшествующий уровень техники
Настоящее изобретение относится к переводу с одного языка на другой. В частности, настоящее изобретение относится к услуге перевода, которая предоставляется устройству по сети.
В нашем, все в большей степени взаимосвязанном, современном мире становятся все более и более частыми определенные ситуации, в которых языковой барьер затрудняет общение. Типичная ситуация представляет собой иностранного путешественника, который не может понимать местный язык, связанный со страной, в которую он прибыл. Такому путешественнику сложно общаться с местным населением даже при помощи простейших выражений. Например, иностранный путешественник, не знающий языка той страны, в которой он находится, будет испытывать трудности в повседневном общении с местным населением при решении даже простых задач. В качестве всего лишь нескольких примеров такие задачи могут включать в себя, регистрацию и выписку из гостиницы, заказ такси, поиск туалета или пункта обмена валют.
Ожидается, что популярность беспроводных мобильных устройств (таких как, персональные цифровые информационные устройства (PDA), карманные ПК, наладонные компьютеры, переносные компьютеры, смартфоны, интеллектуальные мобильные телефоны и т.п.) в будущем будет продолжать увеличиваться. Ожидается, что такой рост популярности совпадает с уменьшением стоимости беспроводных услуг связи и услуг связи третьего поколения (3G).
Таким образом, со временем будет возрастать потребность в реализации действенной и эффективной универсальной системы перевода с одного языка на другой для мобильных устройств. Устройство, реализующее такую систему, будет помогать отдельным людям, таким как иностранные путешественники, желающим преодолеть проблемы, возникающие из-за языковых барьеров. Однако технологические ограничения затрудняют предоставление высококачественного перевода для текста на естественном языке (т.е. текста без существенных ограничений). Такие ограничения должны быть преодолены или обойдены, для того чтобы сделать возможной по-настоящему действенную и эффективную мобильную систему перевода.
Сущность изобретения
Варианты осуществления настоящего изобретения в общем случае имеют отношение к мобильному переводчику с одного языка на другой, который облегчает общение между людьми, говорящими на разных языках. Некоторые конкретные варианты осуществления изобретения имеют отношение к услуге перевода, которая предоставляется беспроводному мобильному устройству путем избирательной загрузки информации из сервера. Загружаемая информация включает в себя архитектуру перевода, имеющую независимое от языка средство перевода и, по меньшей мере, одну зависящую от языка базу данных перевода. Зависящая от языка база данных перевода включает в себя шаблоны перевода и словарь перевода. Также может быть загружена специализированная база данных для выбранного города или городов мира. Перевод между языками осуществляется путем применения в средстве перевода зависящей от языка базы данных перевода, и, необязательно, специфической для данного города базы данных перевода. Для упрощения процесса перевода средство перевода реализует управляемую пользователем схему замещения термов.
Перечень фигур чертежей
Фиг.1 - блок-схема иллюстративного вычислительного устройства.
Фиг.2 - блок-схема иллюстративного вычислительного устройства.
Фиг.3 - блок-схема иллюстративной среды вычислительной системы.
Фиг.4 - общая блок-схема алгоритма, иллюстрирующая процесс от ввода данных до получения перевода.
Фиг.5 - более детализированная блок-схема алгоритма, иллюстрирующая полный процесс от ввода данных до получения перевода.
ПОДРОБНОЕ ОПИСАНИЕ ИЛЛЮСТРАТИВНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
I. Иллюстративное подходящее вычислительное устройство
На Фиг.1 показан пример подходящей компьютерной системы 100, в которой может быть реализован вариант осуществления настоящего изобретения. Компьютерная система 100 является только одним примером подходящей компьютерной системы и не предназначена для введения каких-либо ограничений как на объем, так и на функциональность данного изобретения. Также компьютерную систему 100 не следует интерпретировать как имеющую какую-либо зависимость или требования в отношении любого ее показанного компонента или их комбинации.
Обращаясь к Фиг.1, иллюстративное устройство, подходящее для данного изобретения, включает в себя компьютерное устройство общего назначения в виде компьютера 110. Компоненты компьютера 110 могут включать в себя, но не в ограничительном смысле, процессорное устройство 120, системную память 130 и системную шину 121, связывающую различные компоненты системы, в том числе и системную память, с процессорным устройством 120. Системная шина 121 может быть шинной структурой любого типа, включая шину памяти или контроллер памяти, периферийную шину и локальную шину с любой из многочисленных шинных архитектур. Для примера, но не с целью ограничения, такие архитектуры включают в себя шину архитектуры промышленного стандарта (ISA), шину микроканальной архитектуры (МСА), расширенную ISA (EISA) шину, локальную шину ассоциации стандартов видеоэлектроники (VESA) и шину соединений периферийных компонентов (PCI), также известную как шину Mezzanine.
Компьютер 110 обычно включает в себя ряд машиночитаемых носителей данных. Машиночитаемые носители данных могут быть любыми доступными носителями данных, к которым может осуществить доступ компьютер 110, и включают в себя как энергозависимые, так и энергонезависимые носители данных и как съемные, так и несъемные носители данных. Для примера, но не с целью ограничения, машиночитаемые носители данных могут включать в себя компьютерные носители данных и среды передачи. Компьютерные носители данных включают в себя как энергозависимые, так и энергонезависимые и как съемные, так и несъемные носители данных, реализованные с применением любого способа или технологии хранения информации, такой как машиночитаемые команды, структуры данных, программные модули или другие данные. Компьютерные носители данных включают в себя, но не в ограничительном смысле ОЗУ, ПЗУ, EEPROM, флэш-память или память другой технологии, ПЗУ на компакт-диске (CD-ROM), универсальные цифровые диски (DVD) или другие оптические носители данных, магнитные кассеты, магнитные ленты, носители данных на магнитных дисках или другие устройства хранения данных на магнитных носителях, или любые другие носители данных, которые могут быть использованы для хранения необходимой информации и к которым может осуществить доступ компьютер 110.
Среды передачи обычно воплощают машиночитаемые команды, структуры данных, программные модули или другие данные в виде сигнала модулированного данными, такого как сигнал несущей или другой транспортный механизм, и включают в себя любые среды доставки информации. Термин "сигнал модулированный данными" означает сигнал, имеющий одну или более его характеристик, установленных или изменяемых для обеспечения кодирования информации в этом сигнале. Для примера, но не с целью ограничения, среды передачи включают в себя проводные среды, такие как проводная сеть или прямое кабельное соединение, беспроводные среды, такие как акустические, РЧ (радиочастотные), инфракрасные и другие беспроводные среды. В число машиночитаемых носителей также следует включить любую комбинацию упомянутых выше носителей.
Системная память 130 включает в себя компьютерные носители данных в виде энергозависимой и/или энергонезависимой памяти, такой как постоянное запоминающее устройство (ПЗУ) 131 и оперативное запоминающее устройство (ОЗУ) 132. Базовая система 133 ввода/вывода (BIOS), содержащая основные процедуры, содействующие передаче информации между элементами в компьютере 110, как, например, во время запуска, обычно хранится в ПЗУ 131. ОЗУ 132 обычно содержит данные и/или программные модули, которые являются непосредственно доступными и/или выполняются в настоящее время процессорным устройством 120. Для примера, но не с целью ограничения, на Фиг.1 показаны операционная система 134, прикладные программы 135, другие программные модули 136 и данные 137 программ.
Компьютер 110 также может включать в себя другие сменные/несменные, энергозависимые/энергонезависимые компьютерные носители данных. Исключительно в качестве примера, на Фиг.1 показан накопитель 141 на жестких магнитных дисках, считывающий и записывающий на несъемный, энергонезависимый магнитный носитель данных, привод 151 магнитного диска, считывающий и записывающий на съемный, энергонезависимый магнитный диск 152 и привод 155 оптического диска, считывающий и записывающий на съемный, энергонезависимый оптический диск 156, такой как CD-ROM или другой оптический носитель данных. Другие сменные/несменные, энергозависимые/энергонезависимые компьютерные носители данных, которые могут применяться в иллюстративной рабочей среде, включают в себя, но не в ограничительном смысле, кассеты с магнитной лентой, карты флэш-памяти, универсальные цифровые диски, цифровую видеоленту, твердотельное ОЗУ, твердотельное ПЗУ и т.п. Накопитель 141 на жестких магнитных дисках обычно соединен с системной шиной 121 посредством интерфейса несъемной памяти, такого как интерфейс 140, и привод 151 магнитного диска и привод 155 оптического диска обычно соединены с системной шиной 121 посредством интерфейса съемной памяти, такого как интерфейс 150.
Приводы и связанные с ними компьютерные носители данных, обсуждаемые выше и проиллюстрированные на Фиг.1, обеспечивают в компьютере 110 хранение машиночитаемых команд, структур данных, программных модулей и других данных. Например, на Фиг.1 накопитель на жестких магнитных дисках изображен хранящим операционную систему 144, прикладные программы 145, другие программные модули 146 и данные 147 программ. Необходимо заметить, что эти компоненты могут быть теми же самыми или отличными от операционной системы 134, прикладных программ 135, других программных модулей 136 и данных 137 программ. Операционная система 144, прикладные программы 145, другие программные модули 146 и данные 147 программ имеют в данном случае отличающиеся номера для иллюстрации того, что, по меньшей мере, они являются отличающимися копиями.
Пользователь может вводить команды и информацию в компьютер 110 через устройства ввода, такие как клавиатура 162, микрофон 163 и указывающее устройство 161, такое как мышь, трекбол или сенсорный планшет. Другие устройства ввода (не показаны) могут включать в себя джойстик, игровую панель, спутниковую параболическую антенну, сканер или подобное устройство. Эти и другие устройства ввода часто соединены с процессорным устройством 120 через интерфейс 160 пользовательского ввода, связанный с системной шиной, но могут быть подсоединены через другой интерфейс или шинные структуры, такие как параллельный порт, игровой порт или универсальную последовательную шину (USB). Монитор 191 или другое устройство отображения также подсоединены к системной шине 121 через интерфейс, такой как видеоинтерфейс 190. Помимо монитора, компьютеры могут также включать в себя другие периферийные устройства вывода, такие как громкоговорители 197 и принтер 196, которые могут быть подсоединены через периферийный интерфейс 195 вывода.
Компьютер 110 может работать в сетевой среде, используя логические соединения с одним или более удаленными компьютерами, таким как удаленный компьютер 180. Удаленный компьютер 180 может быть персональным компьютером, портативным устройством, сервером, маршрутизатором, сетевым ПК, одноранговым узлом сети или другим обычным узлом сети, и обычно включает в себя множество или все из элементов, описанных выше в связи с компьютером 110. Изображенные на Фиг.1 логические соединения включают в себя локальную сеть (ЛС) 171 и глобальную сеть (ГС) 173, но также могут включать в себя другие сети. Такие типы сетевого окружения являются обычными в офисах, компьютерных сетях масштаба предприятия, интрасетях, сети Интернет.
При использовании в локальной сетевой среде компьютер 110 подсоединяется к ЛС 171 через сетевой интерфейс или адаптер 170. При использовании в глобальной сетевой среде, компьютер 110 обычно включает в себя модем 172 или другие средства для установления соединения через ГС 173, такую как Интернет. Модем 172, который может быть внутренним или внешним, может быть подсоединен к системной шине 121 через интерфейс 160 пользовательского ввода или другим подходящим способом. В сетевой среде программные модули, описанные в связи с компьютером 110, или часть их, могут храниться в удаленном устройстве хранения данных. Для примера, но не с целью ограничения, на Фиг.1 показаны удаленные прикладные программы 185, как находящиеся на удаленном компьютере 180. Очевидно, что показанные сетевые соединения являются иллюстративными и могут быть использованы другие средства организации линии связи между компьютерами.
Необходимо отметить, что настоящее изобретение может быть выполнено как связанное с компьютерной системой такой, которая описана согласно Фиг.1. Однако настоящее изобретение может быть аналогично выполнено как связанное с сервером, компьютером, предназначенным для обработки сообщений, или распределенной системой, в которой разные части настоящего изобретения выполняются на разных частях распределенной компьютерной системы.
II. Другое иллюстративное подходящее компьютерное устройство
Фиг.2 представляет собой блок-схему мобильного компьютерного устройства 200. Мобильное устройство 200 включает в себя микропроцессор 202, память 204, компоненты 206 ввода/вывода (I/O) и интерфейс 208 связи для связи с удаленным компьютером или другими мобильными устройствами. В одном из вариантов осуществления изобретения внутренние компоненты устройства 200 для связи друг с другом соединены через подходящую шину 210.
Устройство 200 является примером подходящего компьютерного устройства, в котором может быть осуществлено настоящее изобретение. Устройство 200 является примером подходящего компьютерного устройства и не предназначено для введения каких-либо ограничений как на объем, так и на функциональность данного изобретения. Также устройство 200 не следует интерпретировать как имеющее какую-либо зависимость или требования в отношении любого его компонента или их комбинации, показанных в иллюстративном устройстве 200.
Память 204 реализована в виде энергонезависимой электронной памяти, такой как оперативное запоминающее устройство (ОЗУ) с резервным батарейным модулем (не показано), так что информация, хранящаяся в памяти 204, не теряется при отключении обычного питания мобильного устройства 200. Часть памяти 204 предпочтительно выделяется в качестве адресуемой памяти для выполнения программ, в то время как другая часть памяти 204 предпочтительно используется для хранения данных, например, для эмуляции хранения данных на жестком диске.
Память 204 содержит операционную систему 212, прикладные программы 214, а также и хранилище 216 объектов. Предпочтительно, во время работы операционная система 212 выполняется процессором 202 из памяти 204. В одном из предпочтительных вариантов осуществления изобретения, операционная система 212 представляет собой операционную систему WINDOWS® СЕ, серийно выпускаемую Microsoft Corporation. Операционная система 212 предпочтительно разработана для мобильных устройств и реализует функциональные возможности баз данных, которые могут быть использованы приложениями 214 через набор предоставляемых интерфейсов и методов прикладного программирования. Объекты библиотеки объектов 216 поддерживаются приложениями 214 и операционной системой 212, по меньшей мере, частично в ответ на вызовы предоставляемых интерфейсов и методов прикладного программирования.
Интерфейс 208 связи представляет множество устройств и способов, которые позволяют мобильному устройству 200 посылать и принимать информацию. Некоторые примеры данных устройств включают в себя проводные и беспроводные модемы, спутниковые приемники и широковещательные тюнеры. Мобильное устройство 200 может также быть соединено непосредственно с компьютером для обмена данными с ним. В этих случаях интерфейс 208 связи может быть инфракрасным приемопередатчиком или последовательным или параллельным коммуникационным соединением, причем все они способны передавать потоковые данные.
Компоненты 206 ввода/вывода могут включать в себя любое из множества устройств ввода данных, как, например, сенсорный экран, кнопки, роллеры и микрофон, а также множество устройств вывода, включающих в себя генератор звука, вибрационное устройство и дисплей. Перечисленные выше устройства представлены в качестве примера и необязательно каждое из них должно присутствовать в мобильном устройстве 200. Дополнительно другие устройства ввода/вывода информации могут быть подсоединены или использоваться с мобильным устройством 200 без выхода за пределы объема настоящего изобретения.
Варианты осуществления настоящего изобретения могут работать со многими средами или конфигурациями компьютерных систем общего назначения или специального назначения, отличными от иллюстрированных в данном описании. Примеры широко известных подходящих сред и конфигураций компьютерных систем включают в себя, но не в ограничительном смысле, персональные компьютеры, серверы, карманные или портативные устройства, микропроцессорные системы, системы, основанные на микропроцессорах, телевизионные приставки, программируемую бытовую электронику, сетевые ПК, миникомпьютеры, универсальные компьютеры (мэйнфреймы), системы телефонии, распределенные компьютерные среды, которые включают в себя любые вышеуказанные системы или устройства, и т.п.
Варианты осуществления настоящего изобретения могут быть описаны в общем контексте машиноисполняемых команд, таких как программные модули, выполняемые компьютером. Обычно программные модули включают в себя процедуры, программы, объекты, компоненты, структуры данных и т.д., которые выполняют отдельные задачи или реализуют определенные абстрактные типы данных. Настоящее изобретение разработано для использования в распределенных компьютерных средах, в которых задачи выполняются удаленными процессорными устройствами, которые соединены через сеть связи. В распределенной компьютерной среде программные модули размещены как на локальных, так и на удаленных компьютерных носителях данных, включающих в себя запоминающие устройства. Задачи, выполняемые программами и модулями, описаны ниже и сопровождаются чертежами. Специалисты в данной области техники могут реализовать описание и фигуры, в качестве как, например, машиноисполняемых команд, которые могут быть записаны на машиночитаемом носителе информации любого вида.
III. Иллюстративная среда компьютерной системы
Фиг.3 представляет собой блок-схему, иллюстрирующую пример подходящей среды 300 компьютерной системы, в которой может быть реализован вариант осуществления настоящего изобретения. Среда 300 компьютерной системы является только одним примером подходящей компьютерной среды и не предназначена для введения каких-либо ограничений как на объем, так и на функциональность данного изобретения. Также среду 300 компьютерной системы не следует интерпретировать как имеющую какую-либо зависимость или требования в отношении любого ее показанного компонента или их комбинации.
Среда 300 включает в себя множество клиентских средств (клиентов) 304. Клиенты иллюстративно, хотя и не обязательно, являются мобильными устройствами подобными устройству 200, показанному на Фиг.2. Клиенты не обязательно должны быть мобильными. Согласно одному из вариантов осуществления изобретения, по меньшей мере, один клиент 304 обычно является немобильным компьютерным устройством, таким как персональный компьютер подобный компьютеру 110 по Фиг.1. Данный клиент 304 может быть любым из компьютерных устройств, описанных выше в связи с Фиг.1 и 2, или каким-либо другим компьютерным устройством. Для упрощения настоящего описания иллюстративных вариантов осуществления изобретения предполагается, что клиенты 304 являются мобильными устройствами подобными устройству 200, показанному на Фиг.2. Дополнительно предполагается, что в общем случае связь с клиентами 304 осуществляется через беспроводную сеть связи. Для поддержки связи как с мобильным, так и с немобильным клиентом 304, также легко может быть использована проводная связь.
Клиенты 304 сконфигурированы для связи, по меньшей мере, временно, с сервером 302, который поддерживается в сети 310. Клиенты 304, в качестве иллюстрации, сконфигурированы для связи с сервером 302 через интерфейс связи, такой как интерфейс 208, показанный на Фиг.2. Сервер 302, в качестве иллюстрации, сконфигурирован для предоставления информации, такой как информация приложений, для клиентов 304. Такая информация может быть доступной из хранилища 214 приложений и использоваться процессором 202 для представления пользователю клиента функциональных возможностей перевода с одного языка на другой.
Варианты осуществления настоящего изобретения относятся к системе, которая предоставляет возможность клиенту 304 получать специализированную информацию, такую как информацию приложений, от сервера 302. Специализированная информация дает возможность клиенту функционировать в качестве мобильного переводчика с одного языка на другой. С помощью мобильного переводчика пользователь клиента 304 имеет возможность для осуществления некоторых видов общения, использующих конкретный естественный язык, которым он не владеет достаточно свободно. Информация, принимаемая клиентом от сервера, в качестве иллюстрации, предоставляет возможность перевода между языком, который знаком пользователю, и, по меньшей мере, одним иностранным языком, выбранным пользователем. Принимаемая информация может также включать в себя информацию, относящуюся к конкретному месту назначения (т.е. город), выбираемому пользователем.
Сервер 302 сконфигурирован для предоставления услуги практического перевода по сети (например, Интернет) для клиента 304. Клиент 304, в качестве иллюстрации, хотя и необязательно, является беспроводным мобильным устройством. Услуга, предоставляемая сервером 302 для клиента 304, в качестве иллюстрации, предоставляется на платной основе (например, разовая оплата или оплата за подписку). Услуга перевода, в качестве иллюстрации, дает возможность клиенту служить его пользователю в качестве мобильного переводчика. Пользователь может использовать мобильный переводчик для того, чтобы получить возможность участия в разговорах, используя конкретный естественный язык, которым он не владеет достаточно свободно. Например, иностранные туристы без знания языка страны посещения должны осуществлять повседневное общение с местным населением для регистрации в гостинице и выписки из нее, при заказе такси, посещении магазина и т.п. Мобильный переводчик дает возможность таким туристам осуществлять такие разговоры.
Как было описано, для того чтобы оснастить клиент 304 таким образом, чтобы он мог служить пользователю в качестве мобильного переводчика, для осуществления этой услуги с сервера 304 клиенту 302 передаются определенные элементы приложений. Элементы приложений, в качестве иллюстрации, включают в себя независимое от языка средство перевода и, по меньшей мере, одну зависящую от языка базу данных перевода. Зависящая от языка база данных, в качестве иллюстрации, включает в себя набор шаблонов перевода и словарь перевода. Функция шаблонов перевода имеет отношение к конкретной схеме перевода, которая будет описана ниже более подробно.
Элементы приложений, переданные с сервера 302 клиенту 304, также в необязательном порядке включают в себя одну или более специализированных баз данных, представляющих один или более конкретных городов назначения. Специализированные базы данных, в качестве иллюстрации, включают в себя определенные слова и фразы, связанные с городом назначения, такие как конкретные гостиницы, названия улиц, ресторанов, туристических достопримечательностей и т.п. Другие типы специализированных баз данных (например, отличающиеся от базы данных на основе городов) могут быть реализованы, не выходя за пределы объема настоящего изобретения.
Пользователь клиента 304 по желанию может запросить передачу одной или более зависящих от языка баз данных (соответствующих одному или более естественным языкам) вместе с одной или более специализированными базами данных. После передачи элементов приложений с сервера 302 на мобильное устройство клиента, осуществляется перевод между языками посредством использования в средстве перевода зависящей от языка базы данных перевода, и, необязательно, любых специализированных баз данных. Средство перевода может находиться в клиенте 204 продолжительное время или иногда передаваться клиенту 204 с сервера 202 (т.е. передаваться с зависящей от языка или специализированной базой данных). Средство перевода, в качестве иллюстрации, реализует конкретную схему перевода, описанную более подробно ниже.
Согласно одному конкретному варианту осуществления изобретения американец, путешествующий в окрестностях Пекина, может загрузить средство перевода, двусторонние китайско-английские шаблоны перевода и словарь, а также словарь перевода, ориентированный на Пекин, с сервера в свое беспроводное мобильное устройство. В Пекине американец может применять в средстве перевода зависящую от языка базу данных перевода и специфическую для данного города базу данных перевода для того, чтобы облегчить эффективное общение в Пекине. Средство перевода, в качестве иллюстрации, является независимым от языка.
IV. Интегрированная схема перевода
Существует много проблем, связанных с обеспечением перевода высокого качества для текста на естественном языке. Согласно одному из вариантов осуществления изобретения для решения некоторых из таких проблем услуга перевода, предоставляемая сервером 302 и осуществляемая клиентом 304, основывается на "интегрированной схеме перевода". Согласно этой схеме предоставляются переводы для обычных сценариев. Для каждого обычного сценария собирают обычные предложения вместе с их переводами на различные иностранные языки. Исходя из этих предложений-примеров перевод производится, используя систему перевода, основанную на примерах.
Фиг.4 представляет собой блок-схему алгоритма, иллюстрирующую в общем виде процесс работы интегрированной схемы перевода. Первым этапом этого процесса является взаимодействие пользователя клиента со своим клиентским устройством для того, чтобы произвести выбор исходного предложения 408. Как показано блоками 402, 404 и 406, пользователь может выбирать исходное предложение 408 при помощи взаимодействия, выполняемого через устройство речевого ввода, устройство рукописного ввода и/или при помощи клавиатуры. Могут использоваться другие способы ввода без выхода за пределы объема настоящего изобретения. Исходное предложение 408, в качестве иллюстрации, выбирается из зависящей от языка базы данных и специализированной базы данных, которые загружаются с сервера 302 в клиент 304. Исходное предложение 408, в качестве иллюстрации, представлено на языке, знакомом пользователю.
После выбора исходного предложения 408 переводчик 410 использует независящее от языка средство перевода для перевода исходного предложения в целевое предложение 412. Целевое предложение 412, в качестве иллюстрации, составлено на языке, который необходим пользователю для осуществления взаимодействия. Согласно блокам 414 и 416 целевое предложение 412 выводится в виде речи (т.е. искусственная речь) или выводится на дисплей пользователю клиентского устройства. Затем пользователь использует упомянутый вывод для общения на соответствующем иностранном языке. Могут быть реализованы другие виды вывода без отступления от объема настоящего изобретения.
Согласно одному из вариантов осуществления изобретения выбор исходного предложения 408 выполняется также просто, как непосредственный ввод данных пользователем. Например, пользователь может непосредственно ввести исходное предложение в клиентское устройство, используя способы речевого, рукописного ввода или при помощи клавиатуры. В качестве альтернативы, выбор исходного предложения 408 может производиться при помощи процесса выбора. Например, клиентское устройство может предоставить список исходных предложений 408, распределенных по категориям, из которых пользователь производит выбор.
Однако согласно одному из аспектов настоящего изобретения зависящая от языка база данных, загруженная в клиентское устройство, содержит ограниченное количество предложений-примеров. Если одно из таких предложений-примеров точно соответствует тому, которое ищет пользователь, оно отбирается пользователем в качестве исходного предложения 408. В противном случае, пользователь выбирает предложение-пример, которое достаточно похоже на то, которое ищет пользователь. Затем система конфигурируется для предоставления пользователю возможности изменять похожее предложение до тех пор, пока оно не примет надлежащую форму, в которой сможет служить в качестве исходного предложения 408. Пользователь, в качестве иллюстрации, изменяет похожее предложение путем замены определенных элементов предложения элементами, содержащимися в словарях, найденных в зависящей от языка базе данных и/или одной или более загруженных специализированных базах данных. Таким образом, пользователь преобразует похожее предложение в требуемое исходное предложение 408. Другими словами, выбор исходного предложения 408 может выполняться при помощи использования двух этапного процесса. Во-первых, выбирается похожее предложение. Затем похожее предложение преобразуется путем замены, добавления и/или удаления термов до тех пор, пока похожее предложение не становится в достаточной мере или точно соответствующим исходному предложению 408.
Согласно одному из аспектов настоящего изобретения похожее предложение может быть выбрано, по меньшей мере, двумя способами. Во-первых, пользователем может вручную просматриваться база данных предложений (т.е. часть зависящей от языка базы данных). Процессу просмотра, в качестве иллюстрации, содействует использованию системы, использующей меню на основе категорий. Например, пользователь может использовать устройство ввода для выбора общей категории, такой как "ТАКСИ". После выбора пользователю предоставляется список подкатегорий. Пользователь может перемещаться по системе меню до тех пор, пока не находит предложение, похожее на искомое, в качестве исходного предложения 408. Затем пользователь изменяет похожее предложение до состояния, в котором его можно будет использовать в качестве исходного предложения 408.
Однако в качестве альтернативы пользователь может начать поиск похожего предложения путем ввода искомого предложения. Затем система извлекает похожие предложения из базы данных и предоставляет их пользователю для выбора. Затем пользователь выбирает предложение, которое достаточно похоже на искомое. Затем пользователь изменяет похожее предложение до состояния, в котором его можно будет использовать в качестве исходного предложения 408. Например, пользователь может ввести "May I get to the train station quickly by taxi?" («Могу ли я быстро доехать до вокзала на такси?»). Затем система производит поиск в базе данных предложений и предоставляет список, такой как:
a. "May I get to the hotel by taxi?" («Могу ли я доехать до гостиницы на такси?»,
b. "I get to the train station by bus." («Я доберусь до вокзала на автобусе»).
с. "I get to the train station quickly." («Я быстро доберусь до вокзала»).
Затем пользователь выбирает предложение из списка для использования в качестве похожего предложения (т.е. исходное для изменения). В одном из примеров изменения пользователь может выбрать для преобразования сегмент "the hotel" («гостиница») в предложении "а" для замещения на "train station" («вокзал»). Терм "train station" («вокзал»), в качестве иллюстрации, является термом, который доступен из зависящей от языка базы данных для перевода.
Согласно одному из аспектов настоящего изобретения Фиг.5 является блок-схемой алгоритма, иллюстрирующей полный процесс, причем пользователь начинает с ввода предложения, перевод которого он ищет. Блок 502 представляет процесс ввода данных пользователем, который может производиться через устройство речевого ввода, при помощи клавиатуры, через устройство рукописного ввода или другим способом. Блок 504 представляет процесс сравнения введенных данных с предложениями и шаблонами 506, хранящимися в клиенте в качестве части, зависящей от языка базы данных (и/или части любой специализированной базы данных).
Блок 508 представляет ситуацию, в которой найдено точное соответствие данным, введенным пользователем. В такой ситуации, согласно блоку 510, словарь и правила 512, которые в качестве иллюстрации, используются в качестве части загруженных зависящей от языка базы данных и независимого средства перевода, применяются для перевода предложения 508 и генерируют выходные данные 514 (т.е., речевой вывод или вывод на дисплей).
Блок 516 представляет ситуацию, в которой не найдено точное соответствие данным, введенным пользователем, однако найдено похожее соответствие. Шаблон 516 представляет похожее соответствие, извлеченное из базы данных 506. Согласно блоку 518 пользователь преобразует похожее соответствие до тех пор, пока оно не становится разумным приближением первоначально введенных данных 502. Затем согласно блоку 510 преобразованное предложение переводится в выходные данные 514 (т.е. речевой вывод или вывод на дисплей).
Блок 520 представляет ситуацию, когда не может быть найдено ни точного соответствия, ни подходящего приближения введенных данных 502. В этом случае соответствующие введенные данные 502 возвращаются в сервер. Согласно блоку 522 введенные данные используются для обучения зависящей от языка базы данных и/или специализированных баз данных, которые впоследствии передаются другим клиентам.
V. Основанный на шаблонах машинный перевод
Согласно одному из аспектов настоящего изобретения описанный процесс перевода реализуется посредством основанного на шаблонах машинного перевода, как это показано на примере формата данных в Выражении 1:
Выражение 1
Figure 00000001
Согласно подходу основанного на шаблонах машинного перевода извлечение предложения из зависящей от языка базы данных в качестве приближения предложения, перевод которого требуется пользователю, осуществляется путем применения алгоритма, который использует подход, основанный на шаблонах. В общем случае, алгоритм содержит два этапа.
На первом этапе алгоритм выбирает предложения-кандидаты, используя подход извлечения информации на основе взвешенной частоты встречаемости терма/инверсной частоте терма во всех документах (ЧТ-ИЧД, TF-IDF). Набор предложений-примеров, обозначаемый в данном описании D, содержит некоторое количество документов, причем каждый документ фактически является предложением-примером. Результат индексации документа (который содержит только одно предложение) представляется в виде вектора весов:
Выражение 2
Figure 00000002
где dik (1≤k≤m) является весом терма tk в документе Di, и m является размерностью векторного пространства, которое определяется количеством разных термов, найденных в наборе. Термы, в качестве иллюстрации, но не обязательно, являются словами английского языка. С тем же успехом они могут быть японскими или китайскими иероглифами или любыми другими лингвистическими единицами. Вес dik терма в документе вычисляется согласно его частоте встречаемости в документе (ЧТ - частота встречаемости), а также его распространенности во всем наборе (ИЧД - инверсная частота терма во всех документах). Существует большое количество способов, которые могут применяться для вычисления din. Например, может быть использована следующая формула:
Выражение 3
Figure 00000003
где fik является частотой встречаемости терма tk в документе Di; N является общим количеством документов в наборе; и nk является количеством документов, которые содержат терм tk.
Аналогичным образом индексируется запрос (который в данном случае соответствует предложению, перевод которого требуется пользователю), и также получается вектор для запроса:
Выражение 4
Figure 00000004
Затем вычисляется мера подобия между Di и Qj как скалярное произведение этих векторов, которое представляет собой:
Выражение 5
Figure 00000005
Результат представляет собой набор предложений S, где
Выражение 6
Figure 00000006
На втором этапе алгоритма используется подход взвешенного расстояния редактирования для изменения ранжирования набора выбранных предложений. Для заданного выбранного предложения Di→(di1, di2,…, dim), расстояние редактирования между Di и Qj, обозначаемое ED(Di,Qj), определяется как минимальное количество вставок, удалений и замен термов, необходимое для того, чтобы сделать две строки А и В одинаковыми. Более точно, ED(Di,Qj) определяется как минимальное количество операций, необходимое для изменения Di в Qj, где операцией является одна из следующих операций:
1. изменение терма;
2. вставка терма; или
3. удаление терма.
Для вычисления расстояния редактирования между двумя строками, в качестве иллюстрации, используется алгоритм динамического программирования. Для представления значений расстояния редактирования используется двумерная матрица, m[0..|S1|,0..|S2|]:
Уравнение 7
Figure 00000007
m[,], в качестве иллюстрации, вычисляется построчно. Строка m[i, ] зависит только от строки m[i-1,]. Временная сложность этого алгоритма составляет 0(|s1|*|s2|). Если s1 и s2 имеют похожие длины в единицах количества термов, например, примерно n, то упомянутая временная сложность составляет O(n2).
Взвешенное расстояние редактирования в общем случае означает тот факт, что штраф за каждую операцию (вставка, удаление, перестановка) не обязательно равен 1, но может принимать разные значения исходя из значимости соответствующих термов. Например, может использоваться следующий список значений штрафов для присвоения значений в соответствии с конкретными частям речи:
Часть речи Оценка
Существительное 0,6
Глагол 1,0
Прилагательное 0,8
Наречие 0,8
Предлог 0,8
Другие 0,4
Такой список является только примером, и может быть изменен в соответствии с конкретным приложением. Предложения S={Di|Sim(Di,Qj)|≥δ}, выбранные при помощи подхода ЧТ-ИЧД, в качестве иллюстрации, ранжируются по взвешенному расстоянию редактирования ED, и получается упорядоченный список:
Уравнение 8
Т={T1, T2, T3,…Tn}. где ED(Ti,Qj)>ED(Ti+1,Qj). 1≤i≤n
Упорядоченный список, в качестве иллюстрации, используется в качестве основы для определения того, какое похожее предложение или предложения должны быть предоставлены пользователю для упрощения описанного процесса перевода, основанного на шаблонах.
Хотя настоящее изобретение было описано со ссылкой на предпочтительные варианты осуществления, специалистам в данной области техники должно быть очевидно, что могут быть внесены изменения в форму и детали без отступления от сущности и объема настоящего изобретения.

Claims (24)

1. Способ предоставления услуги перевода с одного языка на другой пользователю клиентского компьютерного устройства, включающий в себя этапы, на которых
принимают от пользователя входные данные, которые соответствуют выбору языка,
принимают от пользователя входные данные, которые соответствуют выбору специализированной базы данных, причем выбор специализированной базы данных соответствует географической области, представлять которую адаптированы данные в специализированной базе данных,
передают запрос из клиентского компьютерного устройства на сервер,
в ответ на упомянутый запрос принимают от сервера зависящую от языка базу данных, которая соответствует выбору языка,
в ответ на упомянутый запрос принимают от сервера специализированную базу данных,
эксплуатируют клиентское компьютерное устройство для использования независимого от языка средства перевода совместно с зависящей от языка базой данных и специализированной базой данных,
предоставляют пользователю доступ к набору предложений-примеров, которые содержатся в зависящей от языка базе данных, на языке, который является знакомым для пользователя,
принимают от пользователя входные данные выбора, которые идентифицируют предложение-пример, подобное, но не идентичное целевому предложению, перевод которого требуется пользователю,
принимают от пользователя входные данные манипулирования и
изменяют предложение-пример согласно входным данным манипулирования для создания предложения-примера, наиболее близко соответствующего целевому предложению.
2. Способ по п.1, в котором при приеме специализированной базы данных принимают специализированную базу данных, содержащую информацию перевода, которая имеет отношение к конкретному месту назначения и которая включает в себя словарь перевода, адаптированный для представления этого конкретного места назначения, при этом словарь перевода включает в себя слова, связанные с по меньшей мере одним из гостиницы, названия улицы, ресторана, туристической достопримечательности, ассоциированных с упомянутым конкретным местом назначения.
3. Способ по п.2, в котором при приеме специализированной базы данных принимают специализированную базу данных, содержащую информацию перевода, которая имеет отношение к конкретному городу.
4. Способ по п.1, дополнительно включающий в себя этап, на котором эксплуатируют клиентское компьютерное устройство для использования независимого от языка средства перевода совместно с зависящей от языка базой данных для выполнения перевода с одного языка на другой.
5. Способ по п.4, дополнительно включающий в себя этап, на котором принимают независимое от языка средство перевода от сервера.
6. Способ по п.5, в котором при приеме независимого от языка средства перевода принимают независимое от языка средство перевода с зависящей от языка базой данных.
7. Способ по п.1, в котором при предоставлении пользователю доступа к набору предложений-примеров предоставляют пользователю доступ к распределенному по категориям набору предложений-примеров.
8. Способ по п.1, в котором при использовании независимого от языка средства перевода совместно с зависящей от языка базой данных переводят предложение-пример посредством использования независимого от языка средства перевода для применения к предложению-примеру словаря перевода, содержащегося в зависящей от языка базе данных.
9. Способ по п.1, в котором при изменении предложения-примера выполняют по меньшей мере одно из добавления, удаления и замещения терма в предложении-примере для создания измененного предложения-примера.
10. Способ по п.1, в котором при предоставлении пользователю доступа к набору предложений-примеров предоставляют пользователю доступ к распределенному по категориям набору предложений-примеров.
11. Способ по п.1, в котором при применении независимого от языка средства перевода совместно с зависящей от языка базой данных переводят предложение-пример посредством использования независимого от языка средства перевода для применения к измененному предложению-примеру словаря перевода, содержащегося в зависящей от языка базе данных.
12. Способ по п.4, дополнительно включающий в себя этапы, на которых принимают от пользователя целевые входные данные, которые представляют собой текст, перевод которого требуется пользователю;
выполняют поиск в наборе текстов-примеров, которые содержатся в зависящей от языка базе данных; и
идентифицируют текст-пример, который, по меньшей мере, подобен целевым входным данным по существу.
13. Способ по п.12, в котором при использовании независимого от языка средства перевода совместно с зависящей от языка базой данных переводят текст-пример посредством использования независимого от языка средства перевода для применения к тексту-примеру словаря перевода, содержащегося в зависящей от языка базе данных.
14. Способ по п.12, в котором при идентификации текста-примера
идентифицируют множество текстов-примеров, которые являются приближениями целевого текста;
представляют множество текстов-примеров пользователю и
принимают от пользователя входные данные выбора, которые идентифицируют один из этого множества текстов-примеров.
15. Способ по п.12, в котором при использовании независимого от языка средства перевода и зависящей от языка базы данных переводят упомянутый один из упомянутого множества текстов-примеров посредством использования независимого от языка средства перевода для применения словаря перевода, содержащегося в зависящей от языка базы данных.
16. Способ по п.12, дополнительно включающий в себя этапы, на которых принимают от пользователя входные данные манипулирования;
изменяют упомянутый один из упомянутого множества текстов-примеров согласно входным данным манипулирования для преобразования его в наилучшее приближение целевого предложения.
17. Способ по п.16, в котором при использовании независимого от языка средства перевода и зависящей от языка базы данных переводят упомянутое наилучшее приближение при помощи использования независимого от языка средства перевода для применения словаря перевода, содержащегося в зависящей от языка базы данных, к наилучшему приближению.
18. Способ функционирования сервера для предоставления услуги перевода с одного языка на другой, содержащий этапы, на которых хранят первую зависящую от языка базу данных, которая соответствует первой паре языков, хранят вторую зависящую от языка базу данных, которая соответствует второй паре языков, которая отличается от первой пары языков,
хранят по меньшей мере одну специализированную базу данных, которая является дополнением к одной из первой и второй зависящих от языка баз данных, причем эта специализированная база данных содержит информацию перевода, которая имеет отношение к конкретной географической области, причем данная информация перевода содержит словарь перевода, скомпонованный так, что он включает в себя данные, которые соответствуют этой конкретной географической области,
хранят независимое от языка средство перевода,
принимают от клиента запрос на перевод,
отвечают на данный запрос посредством передачи на клиент, по меньшей мере, копии либо первой, либо второй зависящей от языка базы данных и отвечают на данный запрос посредством передачи на клиент независимого от языка средства перевода.
19. Способ по п.18, дополнительно содержащий этап, на котором отвечают на запрос посредством передачи на клиент упомянутой специализированной базы данных.
20. Устройство для реализации услуги перевода с одного языка на другой, содержащее
средство ввода данных, приспособленное для приема входных данных пользователя,
процессор, связанный со средством ввода данных и приспособленный для приема входного сигнала, который соответствует входным данным пользователя,
память, связанную с процессором,
хранящуюся в памяти зависящую от языка базу данных, содержащую словарь перевода и набор предложений-примеров,
хранящуюся в памяти специализированную базу данных, содержащую информацию перевода, которая соответствует конкретной географической области, причем данная информация перевода включает в себя словарь перевода, адаптированный для представления этой конкретной географической области, при этом словарь перевода включает в себя слова, связанные с по меньшей мере одним из гостиницы, названия улицы, ресторана, туристической достопримечательности, ассоциированных с упомянутой конкретной географической областью, и
хранящееся в памяти независимое от языка средство перевода, при этом процессор приспособлен выбирать предложение-пример на основе входных данных пользователя и изменять это предложение-пример для создания измененного предложения-примера на основе дополнительных входных данных пользователя, причем процессор приспособлен создавать измененное предложение-пример на основе этих дополнительных входных данных пользователя посредством замещения терма в упомянутом предложении-примере термом, выбранным из специализированной базы данных, при этом процессор дополнительно приспособлен использовать независимое от языка средство перевода для применения словаря перевода к упомянутому предложению-примеру для выполнения перевода, который выдается пользователю.
21. Устройство по п.20, в котором процессор дополнительно приспособлен изменять предложение-пример на основе дополнительного входного сигнала, который соответствует дополнительным входным данным пользователя.
22. Устройство по п.20, в котором процессор дополнительно приспособлен использовать независимое от языка средство перевода для применения специализированной базы данных к предложению-примеру для получения перевода, который выводится пользователю.
23. Устройство по п.22, в котором специализированная база данных является базой данных, специфической для конкретного места назначения.
24. Устройство по п.23, в котором специализированная база данных является базой данных, специфической для конкретного города.
RU2004105167/09A 2003-02-24 2004-02-20 Способы и системы для перевода с одного языка на другой RU2357285C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US44971203P 2003-02-24 2003-02-24
US60/449,712 2003-02-24
US10/462,459 2003-06-16
US10/462,459 US7536293B2 (en) 2003-02-24 2003-06-16 Methods and systems for language translation

Publications (2)

Publication Number Publication Date
RU2004105167A RU2004105167A (ru) 2005-07-20
RU2357285C2 true RU2357285C2 (ru) 2009-05-27

Family

ID=32738447

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2004105167/09A RU2357285C2 (ru) 2003-02-24 2004-02-20 Способы и системы для перевода с одного языка на другой

Country Status (12)

Country Link
US (1) US7536293B2 (ru)
EP (1) EP1450267B1 (ru)
JP (1) JP2004259271A (ru)
KR (1) KR101076858B1 (ru)
CN (1) CN1530861B (ru)
AT (1) ATE441153T1 (ru)
AU (1) AU2004200638B2 (ru)
BR (1) BRPI0400333A (ru)
CA (1) CA2458138C (ru)
DE (1) DE602004022730D1 (ru)
MX (1) MXPA04001729A (ru)
RU (1) RU2357285C2 (ru)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2546064C1 (ru) * 2013-11-12 2015-04-10 Общество с ограниченной ответственностью "Технологии управления переводом" Распределенная система и способ языкового перевода
RU2602330C2 (ru) * 2012-07-10 2016-11-20 Тенсент Текнолоджи (Шеньчжень) Компани Лимитед Способ и система облачного перевода для мобильного клиента
RU2812301C2 (ru) * 2021-12-24 2024-01-29 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для выполнения контекстно-зависимого перевода

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7580960B2 (en) 2003-02-21 2009-08-25 Motionpoint Corporation Synchronization of web site content between languages
US7552221B2 (en) 2003-10-15 2009-06-23 Harman Becker Automotive Systems Gmbh System for communicating with a server through a mobile communication device
US8566081B2 (en) * 2004-03-25 2013-10-22 Stanley F. Schoenbach Method and system providing interpreting and other services from a remote location
DE602004010054T2 (de) * 2004-01-19 2008-03-06 Harman Becker Automotive Systems Gmbh Betätigung eines Sprachdialogsystems
DE602004017955D1 (de) * 2004-01-29 2009-01-08 Daimler Ag Verfahren und System zur Sprachdialogschnittstelle
EP1560199B1 (en) 2004-01-29 2008-07-09 Harman Becker Automotive Systems GmbH Multimodal data input
EP1562180B1 (en) * 2004-02-06 2015-04-01 Nuance Communications, Inc. Speech dialogue system and method for controlling an electronic device
US7711571B2 (en) * 2004-03-15 2010-05-04 Nokia Corporation Dynamic context-sensitive translation dictionary for mobile phones
US20050288919A1 (en) * 2004-06-28 2005-12-29 Wang Jian C Method and system for model-parameter machine translation
WO2006019993A2 (en) * 2004-07-15 2006-02-23 Aurilab, Llc Distributed pattern recognition training method and system
US7825901B2 (en) * 2004-12-03 2010-11-02 Motorola Mobility, Inc. Automatic language selection for writing text messages on a handheld device based on a preferred language of the recipient
US7624099B2 (en) * 2005-10-13 2009-11-24 Microsoft Corporation Client-server word-breaking framework
JP4058071B2 (ja) * 2005-11-22 2008-03-05 株式会社東芝 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
US20070255554A1 (en) * 2006-04-26 2007-11-01 Lucent Technologies Inc. Language translation service for text message communications
US8209162B2 (en) * 2006-05-01 2012-06-26 Microsoft Corporation Machine translation split between front end and back end processors
WO2007139910A2 (en) * 2006-05-26 2007-12-06 Laden Sondrah S System and method of language translation
DE102007003862A1 (de) 2007-01-25 2009-02-05 Anders, Klaus E., 26127 Oldenburg Verfahren zur interkulturellen mehrsprachigen Kommunikation unter Einbeziehung einer Plansprache
US7983897B2 (en) * 2007-02-14 2011-07-19 Google Inc. Machine translation feedback
US8515728B2 (en) 2007-03-29 2013-08-20 Microsoft Corporation Language translation of visual and audio input
JP2008305167A (ja) * 2007-06-07 2008-12-18 Toshiba Corp 原言語文を目的言語文に機械翻訳する装置、方法およびプログラム
US20100324884A1 (en) * 2007-06-26 2010-12-23 Jeffrey Therese M Enhanced telecommunication system
US20090094018A1 (en) * 2007-10-08 2009-04-09 Nokia Corporation Flexible Phrasebook
US20090138255A1 (en) * 2007-11-26 2009-05-28 First Data Corporation Customer facing device having language translation capabilities
US20100082324A1 (en) * 2008-09-30 2010-04-01 Microsoft Corporation Replacing terms in machine translation
US20100198582A1 (en) * 2009-02-02 2010-08-05 Gregory Walker Johnson Verbal command laptop computer and software
JP5257189B2 (ja) * 2009-03-25 2013-08-07 富士通株式会社 検索結果出力プログラム、検索結果出力装置、および検索結果出力方法
CN102193939B (zh) * 2010-03-10 2016-04-06 阿里巴巴集团控股有限公司 信息导航的实现方法、信息导航服务器和信息处理系统
TWI490713B (zh) * 2010-05-14 2015-07-01 Alibaba Group Holding Ltd Information navigation method, information navigation server and information processing system
US8804574B2 (en) 2010-10-01 2014-08-12 Telefonaktiebolaget L M Ericsson (Publ) Language dependent positioning and signalling
JP5842452B2 (ja) * 2011-08-10 2016-01-13 カシオ計算機株式会社 音声学習装置及び音声学習プログラム
CN103631772A (zh) * 2012-08-29 2014-03-12 阿里巴巴集团控股有限公司 机器翻译方法及装置
KR101740332B1 (ko) * 2013-11-05 2017-06-08 한국전자통신연구원 자동 번역 장치 및 방법
US10854106B2 (en) * 2014-07-30 2020-12-01 Ofir Geller Targeted repetition and targeted reinforcement in a language learning system
US10102202B2 (en) 2015-12-17 2018-10-16 Mastercard International Incorporated Systems and methods for independent computer platform language conversion services
JP6555553B2 (ja) * 2016-03-25 2019-08-07 パナソニックIpマネジメント株式会社 翻訳装置
CN106021239B (zh) * 2016-04-29 2018-10-26 北京创鑫旅程网络技术有限公司 一种翻译质量实时评价方法
US11449495B2 (en) * 2017-02-01 2022-09-20 United Parcel Service Of America, Inc. Indexable database profiles comprising multi-language encoding data and methods for generating the same
CN107526730B (zh) * 2017-08-29 2022-03-25 惠州Tcl移动通信有限公司 一种翻译数据的管理方法、存储介质及电子设备
WO2019090782A1 (zh) * 2017-11-13 2019-05-16 深圳市沃特沃德股份有限公司 语言翻译方法、装置和服务器
CN107885733A (zh) * 2017-11-13 2018-04-06 深圳市沃特沃德股份有限公司 语言翻译方法和装置
CN108959276A (zh) * 2018-07-23 2018-12-07 传神语联网网络科技股份有限公司 一种用于翻译的术语发现方法及其系统
CN110866406B (zh) * 2019-11-15 2023-08-15 上海醍顶信息科技有限公司 用于翻译集成服务优化方法、电子装置及储存介质
CN111539231A (zh) * 2020-04-29 2020-08-14 北京金山安全软件有限公司 一种翻译方法、装置、服务器及计算机可读存储介质
CN111857906B (zh) * 2020-06-03 2022-02-01 北京旷视科技有限公司 终端的文本显示方法、装置、系统和存储介质

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0262938B1 (en) * 1986-10-03 1993-12-15 BRITISH TELECOMMUNICATIONS public limited company Language translation system
JPH02165378A (ja) * 1988-12-20 1990-06-26 Csk Corp 機械翻訳システム
EP0672989A3 (en) * 1994-03-15 1998-10-28 Toppan Printing Co., Ltd. Machine translation system
US5884247A (en) * 1996-10-31 1999-03-16 Dialect Corporation Method and apparatus for automated language translation
JPH10198680A (ja) * 1997-01-07 1998-07-31 Hitachi Ltd 分散辞書管理方法及びそれを用いた機械翻訳方法
EP0968475B1 (en) * 1997-05-28 2001-12-19 Shinar Linguistic Technologies Inc. Translation system
US5960382A (en) * 1997-07-07 1999-09-28 Lucent Technologies Inc. Translation of an initially-unknown message
US6081803A (en) * 1998-02-06 2000-06-27 Navigation Technologies Corporation Support for alternative names in a geographic database used with a navigation program and methods for use and formation thereof
US6192332B1 (en) 1998-04-06 2001-02-20 Mitsubishi Electric Research Laboratories, Inc. Adaptive electronic phrase book
JP2000194698A (ja) 1998-12-25 2000-07-14 Sony Corp 情報処理装置および方法、並びに提供媒体
JP4718687B2 (ja) 1999-03-19 2011-07-06 トラドス ゲゼルシャフト ミット ベシュレンクテル ハフツング ワークフロー管理システム
US7110938B1 (en) * 1999-09-17 2006-09-19 Trados, Inc. E-services translation portal system
JP2001101187A (ja) * 1999-09-30 2001-04-13 Sony Corp 翻訳装置および翻訳方法、並びに記録媒体
JP2001175683A (ja) * 1999-12-21 2001-06-29 Nec Corp 翻訳サーバシステム
JP2001243224A (ja) 2000-02-25 2001-09-07 Sharp Corp 情報処理装置およびプログラム記録媒体
US20010029442A1 (en) * 2000-04-07 2001-10-11 Makoto Shiotsu Translation system, translation processing method and computer readable recording medium
JP2001306564A (ja) * 2000-04-21 2001-11-02 Nec Corp 自動翻訳機能付き携帯端末
US7107204B1 (en) * 2000-04-24 2006-09-12 Microsoft Corporation Computer-aided writing system and method with cross-language writing wizard
JP2002092462A (ja) 2000-09-12 2002-03-29 Casio Comput Co Ltd 情報提供システム、サーバ装置、プログラムが記憶された記憶媒体
US6859820B1 (en) * 2000-11-01 2005-02-22 Microsoft Corporation System and method for providing language localization for server-based applications
US6904401B1 (en) * 2000-11-01 2005-06-07 Microsoft Corporation System and method for providing regional settings for server-based applications
US7050979B2 (en) * 2001-01-24 2006-05-23 Matsushita Electric Industrial Co., Ltd. Apparatus and method for converting a spoken language to a second language
US20020111791A1 (en) 2001-02-15 2002-08-15 Sony Corporation And Sony Electronics Inc. Method and apparatus for communicating with people who speak a foreign language
JP4574047B2 (ja) * 2001-03-30 2010-11-04 富士通株式会社 訳例辞書を用いて翻訳を行う機械翻訳装置およびプログラム
US20020188670A1 (en) * 2001-06-08 2002-12-12 Stringham Gary G. Method and apparatus that enables language translation of an electronic mail message
US20020198699A1 (en) * 2001-06-21 2002-12-26 International Business Machines Corporation Apparatus, system and method for providing open source language translation
US20030101044A1 (en) * 2001-11-28 2003-05-29 Mark Krasnov Word, expression, and sentence translation management tool
EP1482414B1 (en) * 2002-01-29 2010-10-06 International Business Machines Corporation Translating method for emphasised words
US7272377B2 (en) * 2002-02-07 2007-09-18 At&T Corp. System and method of ubiquitous language translation for wireless devices
US20030154069A1 (en) * 2002-02-14 2003-08-14 International Business Machines Corporation Computerized system and method for converting selected text between languages
JP3959453B2 (ja) * 2002-03-14 2007-08-15 沖電気工業株式会社 翻訳仲介システム及び翻訳仲介サーバ
US20030212542A1 (en) * 2002-05-08 2003-11-13 Amikai, Inc. Platform-independent automated machine translation system
US7548863B2 (en) * 2002-08-06 2009-06-16 Apple Inc. Adaptive context sensitive analysis
US20040044518A1 (en) * 2002-08-27 2004-03-04 Reed John E. Method and system for multilingual display generation

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2602330C2 (ru) * 2012-07-10 2016-11-20 Тенсент Текнолоджи (Шеньчжень) Компани Лимитед Способ и система облачного перевода для мобильного клиента
RU2546064C1 (ru) * 2013-11-12 2015-04-10 Общество с ограниченной ответственностью "Технологии управления переводом" Распределенная система и способ языкового перевода
RU2812301C2 (ru) * 2021-12-24 2024-01-29 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для выполнения контекстно-зависимого перевода

Also Published As

Publication number Publication date
JP2004259271A (ja) 2004-09-16
KR20040076213A (ko) 2004-08-31
US20040167770A1 (en) 2004-08-26
CA2458138A1 (en) 2004-08-24
AU2004200638B2 (en) 2010-09-16
US7536293B2 (en) 2009-05-19
CN1530861A (zh) 2004-09-22
EP1450267A3 (en) 2004-12-22
CA2458138C (en) 2012-10-09
CN1530861B (zh) 2010-05-26
DE602004022730D1 (de) 2009-10-08
KR101076858B1 (ko) 2011-10-25
RU2004105167A (ru) 2005-07-20
MXPA04001729A (es) 2004-12-02
EP1450267A2 (en) 2004-08-25
BRPI0400333A (pt) 2005-01-04
EP1450267B1 (en) 2009-08-26
AU2004200638A1 (en) 2004-09-09
ATE441153T1 (de) 2009-09-15

Similar Documents

Publication Publication Date Title
RU2357285C2 (ru) Способы и системы для перевода с одного языка на другой
JP3272288B2 (ja) 機械翻訳装置および機械翻訳方法
US7742922B2 (en) Speech interface for search engines
US7711571B2 (en) Dynamic context-sensitive translation dictionary for mobile phones
JP4058071B2 (ja) 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
JP2017068845A (ja) 情報ソースの情報ソース用言語を選択するためのコンピュータ実装方法、コンピュータ・システム、コンピュータ・プログラム製品
CN104919522A (zh) 分布式nlu/nlp
JPH03278174A (ja) 異言語交信用翻訳方法およびシステム
EP2306333A1 (en) Offline software library
WO2018148441A1 (en) Natural language content generator
KR20160032564A (ko) 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체
AU2018250372A1 (en) Method to construct content based on a content repository
KR100544905B1 (ko) 여행자를 위한 의사소통 지원 시스템 및 그 서비스 방법
KR101734533B1 (ko) 다국가 뉴스 서비스 제공 방법
CN111949748A (zh) 多语言智能翻译电子地图系统
JP4464713B2 (ja) 支援サーバ、支援システム及び支援方法
KR101501459B1 (ko) 자동 번역 기술을 이용한 작문 시스템 및 방법
JP6881518B2 (ja) 多言語変換装置、多言語変換方法、および多言語変換プログラム
Muroň et al. User-Driven Toponym Disambiguation Using Dialogue
JP3768157B2 (ja) 他言語オントロジー辞書利用装置及び方法並びにプログラム
KR101525324B1 (ko) ?티미디어 콘텐츠의 단어를 제공하는 장치 및 그 방법
Fassbender Dictionary of basic indexing terminology: latest developments and future plans
KR20240002420A (ko) 키워드 기반의 여행 정보 검색 결과를 단문 컨텐츠로 제공하는 방법, 장치 및 컴퓨터-판독 가능 기록 매체
JP2008210216A (ja) 利用者を検索する装置、方法およびプログラム
JP2002297027A (ja) 地図情報提供方法、地図情報提供システム、及びコンピュータ読取可能なプログラム。

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20130221