RU2628202C1 - Adaptive context-thematic machine translation - Google Patents

Adaptive context-thematic machine translation Download PDF

Info

Publication number
RU2628202C1
RU2628202C1 RU2016113939A RU2016113939A RU2628202C1 RU 2628202 C1 RU2628202 C1 RU 2628202C1 RU 2016113939 A RU2016113939 A RU 2016113939A RU 2016113939 A RU2016113939 A RU 2016113939A RU 2628202 C1 RU2628202 C1 RU 2628202C1
Authority
RU
Russia
Prior art keywords
standard
phrase
translation
phrases
source
Prior art date
Application number
RU2016113939A
Other languages
Russian (ru)
Inventor
Михаил Маркович Гольдреер
Original Assignee
Михаил Маркович Гольдреер
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Михаил Маркович Гольдреер filed Critical Михаил Маркович Гольдреер
Priority to RU2016113939A priority Critical patent/RU2628202C1/en
Application granted granted Critical
Publication of RU2628202C1 publication Critical patent/RU2628202C1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

FIELD: physics.
SUBSTANCE: in the method of providing information to the automatic machine translation system, the text is accepted in the user's language, which is then divided into separate initial sentence phrases. The automatic system, by analysis and comparison, selects standard phrases similar to each original phrase stored in its database. The user is offered to select the topic of a standard phrase from a set of topics in the database and the phrase is translated into a foreign language. If the database does not have standard analog phrases given by the user's original phrase, then this source information is sent to the source of reliable information along with the source text, where the standard phrase-counterparts are selected for unknown initial phrases and these phrases are translated, and also topics to these new standard pairs "phrase-translation" are selected. New topics and standard phrases to them with their exact translations are built into the automatic machine translation system.
EFFECT: increasing the accuracy of machine translation from the user's language into a foreign language, increasing universalization and saving computing power in translation.
7 cl, 4 dwg

Description

Изобретение относится к машинному переводу.The invention relates to machine translation.

В настоящее время растет рынок машинного перевода с широким применением цифровых интернет-технологий. Несмотря на их бурное развитие, качество машинного перевода практически не растет, все усилия сводятся к тому, чтобы по возможности точнее передать общий смысл переводимых текстов, но точность такого перевода весьма относительна. Такие переводы могут только сэкономить время специалистам при знакомстве со специализированными текстами, когда они похожи и многократно пропускаются через системы машинного перевода с корректировками из надежного источника информации.Currently, the market for machine translation with the widespread use of digital Internet technologies is growing. Despite their rapid development, the quality of machine translation is practically not growing, all efforts are reduced to ensure that the general meaning of the texts being translated is as accurate as possible, but the accuracy of such a translation is very relative. Such translations can only save time for specialists when they get acquainted with specialized texts, when they are similar and repeatedly passed through machine translation systems with corrections from a reliable source of information.

Такая методика практически непригодна для межличностного общения разноязыких людей на бытовые темы при обычном разговоре. В то же время уже есть программные приложения, позволяющие делать машинный перевод не только текстовых, но и голосовых сообщений.Such a technique is practically unsuitable for interpersonal communication of multilingual people on everyday topics in ordinary conversation. At the same time, there are already software applications that allow machine translation of not only text, but also voice messages.

В целом все методики и системы современного машинного перевода разрабатываются и имеют конечную цель воспроизвести как можно точнее работу переводчика-человека, специалиста самого высокого класса. Для этого разрабатываются сложнейшие системы структурного и статистического анализа различных языков, задействуются все более мощные вычислительные ресурсы. Но решение задачи не просматривается, ибо это задача создания полноценного искусственного интеллекта.In general, all methods and systems of modern machine translation are developed and have the ultimate goal of reproducing as accurately as possible the work of a human translator, a specialist of the highest class. For this, the most complex systems of structural and statistical analysis of various languages are developed, and increasingly powerful computing resources are involved. But the solution to the problem is not visible, because it is the task of creating a full-fledged artificial intelligence.

Сущность изобретенияSUMMARY OF THE INVENTION

Варианты осуществления настоящего изобретения относятся к реализуемому при помощи компьютера способу предоставления информации автоматической системе машинного перевода для повышения точности перевода с языка пользователя на иностранный язык, для повышения его универсализации, для экономии вычислительных мощностей. Данный способ включает прием исходного текста на языке пользователя и подачу его для перевода отдельными предложениями-фразами для перевода. Автоматическая система машинного перевода ищет в своих базах данных стандартные фразы-аналоги полученным исходным фразам и темы, которым соответствуют найденные фразы-аналоги. После отбора пользователем нужной темы, если стандартная фраза-аналог исходной фразы представлена в нескольких темах в базе данных системы, автоматическая система машинного перевода дает этой фразе однозначно точный перевод на иностранные языки, которые заготовлены в ее базе данных. Если же стандартная фраза представлена только в одной теме, то она переводится сразу, без подбора темы пользователем. Если какие-то фразы из исходного текста не имеют стандартных фраз-аналогов и своих тем в автоматической системе машинного перевода, то в процессе перевода исходного текста эти новые данные по ним создаются и закладываются в базы данных автоматической системы машинного перевода через связанный с ней удаленный источник надежной информации. Наиболее близким аналогом заявленного изобретения является "Адаптивный машинный перевод", патент RU 2382399 С2 от 18.06.2004 года. Недостатком этого аналога является то, что он ориентирован на перевод сразу всего заданного ему текста, подвергая его сложному грамматическому, семантическому и экстралингвистическому анализу, после чего полученный перевод подвергается статистическому сравнению с похожими текстами и дорабатывается уже после этого сравнения. Но поскольку любой язык постоянно и быстро меняется, вбирая в себя новые слова, смыслы, подтексты и термины, то такая методика перевода обречена на неизбежное отставание и использование все больших вычислительных мощностей, никогда не выходя за понимание общего смысла переводимого текста и не давая исчерпывающего представления о его деталях и тонкостях. А для чисто разговорного общения между людьми этот способ вообще непригоден, так как способен менять в течение непродолжительного времени перевод одних и тех же фраз.Embodiments of the present invention relate to a computer-implemented method for providing information to an automatic machine translation system to improve the accuracy of translation from a user's language into a foreign language, to increase its versatility, to save computing power. This method includes receiving the source text in the user's language and submitting it for translation with separate sentences-phrases for translation. The automatic machine translation system in its databases searches for standard phrases-analogues to the received source phrases and topics that correspond to the found phrases-analogues. After the user selects the desired topic, if the standard phrase-analogue of the source phrase is presented in several topics in the database of the system, the automatic machine translation system gives this phrase uniquely accurate translation into foreign languages that are stored in its database. If the standard phrase is presented in only one topic, then it is translated immediately, without selecting a topic by the user. If some phrases from the source text do not have standard phrases-analogs and their own themes in the automatic machine translation system, then in the process of translating the source text, these new data are created and stored in the databases of the automatic machine translation system through a remote source associated with it reliable information. The closest analogue of the claimed invention is "Adaptive Machine Translation", patent RU 2382399 C2 from 06/18/2004. The disadvantage of this analogue is that it focuses on the translation of all the text given to it at once, subjecting it to complex grammatical, semantic and extralinguistic analysis, after which the resulting translation is subjected to statistical comparison with similar texts and is finalized after this comparison. But since any language constantly and quickly changes, incorporating new words, meanings, subtexts and terms, such a translation technique is doomed to the inevitable lag and use of ever greater computing power, never going beyond understanding the general meaning of the text being translated and without giving an exhaustive presentation about its details and subtleties. And for a purely conversational communication between people, this method is generally unsuitable, as it is able to change the translation of the same phrases for a short time.

Предлагаемое же изобретение упрощает задачу для автоматической системы машинного перевода тем, что пользователь приспосабливается к ее ограниченным возможностям, задавая для перевода не произвольные тексты целиком, а отдельные фразы, каждая из которых представляет законченный мини-контекст для каждого своего слова и входит в группу фраз, соответствующих определенной теме, которая тоже задается в качестве команды. Таким образом автоматическая система машинного перевода просто ищет в заданной теме стандартные фразы-аналоги фразе, заданной пользователем, и, если выбран нужный аналог, то он тут же получает этот перевод в самом точном и однозначном виде из базы данных автоматической системы. Если же какой-то темы с соответствующими ей стандартными фразами и их переводами еще нет в системе машинного перевода, то с помощью источника надежной информации, в котором могут быть задействованы и переводчики-специалисты, всегда может быть создана новая тема и наполнена соответствующими стандартными фразами с их точными переводами и постоянно пополняемыми наборами фраз - нестандартных соответствий. Таким образом экономится время пользователей, особенно при личном диалоговом общении, и нет необходимости в больших вычислительных мощностях для сложного анализа задаваемых текстов. Тем же, кто хочет перевести иностранный текст на свой язык, эта методика пока не поможет, зато может резко облегчить и ускорить работу профессиональных переводчиков-специалистов, которые, зная иностранный язык и переводя на него тексты, могли бы к тому же пополнять базы данных системы автоматического машинного перевода созданными ими стандартными парами "фраза-перевод" с соответствующими новыми темами. Данный способ резко облегчает переводы исходных текстов на последующие иностранные языки потому, что имея уже один готовый перевод исходного текста, можно этот перевод задавать системе, и она его гораздо легче переведет на другие языки, поскольку он будет состоять из одних стандартных фраз с уже выбранными для них темами.The present invention simplifies the task for an automatic machine translation system by the fact that the user adapts to its limited capabilities by specifying not arbitrary texts as a whole, but separate phrases, each of which represents a complete mini-context for each of its words and is included in a group of phrases, corresponding to a specific topic, which is also given as a team. Thus, the automatic machine translation system simply searches in the given topic for standard phrases that are analogous to the phrase set by the user, and if the desired analogue is selected, then it immediately receives this translation in the most accurate and unambiguous form from the database of the automatic system. If a topic with standard phrases corresponding to it and their translations is not yet in the machine translation system, then using a source of reliable information, in which professional translators can be involved, a new topic can always be created and filled with the corresponding standard phrases with their accurate translations and constantly replenished sets of phrases - non-standard matches. This saves users time, especially with personal dialogue, and there is no need for large computing power for complex analysis of the given texts. For those who want to translate a foreign text into their own language, this technique will not help yet, but it can dramatically facilitate and speed up the work of professional translators-specialists who, knowing a foreign language and translating texts into it, could also supplement the system databases automatic machine translation created by them standard phrase-translation pairs with corresponding new topics. This method greatly facilitates the translation of source texts into subsequent foreign languages because having already one ready translation of the source text, you can set this translation to the system, and it will be much easier to translate into other languages, since it will consist of the same standard phrases with those already selected for them by topics.

Можно сказать, что по сравнению с уже имеющимися системами автоматического машинного перевода, с тем же патентом 2382399, данный способ резко упрощает процесс перевода и своей адаптации за счет того, что весь анализ переводимых фраз сводится к поиску аналогов в базах данных путем сравнения, а адаптация (обучение!) - к пополнению баз данных новыми темами с наборами новых стандартных пар "фраза-перевод" с сопутствующими им наборами нестандартных фраз-аналогов. Однако это не исключает в будущем встраивания и использования в настоящем изобретении уже имеющихся методик компьютерного анализа и перевода, вероятностных и статистических, которые применяются в том же способе по патенту 2382399, для повышения степени автоматизации процесса перевода. Но и в этом случае задача для указанных методик будет резко упрощена, поскольку работать придется с отдельными фразами без ориентации на смысл и специализацию всего массива похожих текстов, как это происходит сейчас. Таким образом достигается универсальность настоящего изобретения для максимально точного перевода любых текстов, а не только близких по тематике, как в уже действующих системах автоматического машинного перевода, а общее упрощение работы системы многократно снизит требования к мощности вычислительных ресурсов для ее обеспечения.We can say that, compared with existing automatic machine translation systems, with the same patent 2382399, this method dramatically simplifies the process of translation and its adaptation due to the fact that the entire analysis of translated phrases is reduced to searching for analogues in databases by comparison, and adaptation (training!) - to replenish databases with new topics with sets of new standard phrase-translation pairs with their accompanying sets of non-standard phrases-analogues. However, this does not preclude the future incorporation and use in the present invention of the existing methods of computer analysis and translation, probabilistic and statistical, which are used in the same method according to patent 2382399, to increase the degree of automation of the translation process. But even in this case, the task for these methods will be greatly simplified, since you will have to work with individual phrases without focusing on the meaning and specialization of the entire array of similar texts, as is happening now. Thus, the universality of the present invention is achieved for the most accurate translation of any texts, and not just related topics, as in existing automatic machine translation systems, and the overall simplification of the system will greatly reduce the power requirements for computing resources to ensure it.

Данное изобретение можно использовать с множеством любых вычислительных систем, сред или конфигураций вычислительной системы общего или специального назначения.This invention can be used with a variety of any computing systems, environments or configurations of a general or special purpose computing system.

Примеры хорошо известных вычислительных систем, сред и/или конфигураций, пригодных для использования с настоящим изобретением, включают персональные компьютеры, серверы, карманные или портативные устройства, мультипроцессорные системы, системы на основе микропроцессоров, приставки, программируемую бытовую электронику, сетевые ПК, мини-компьютеры, универсальные ЭВМ, телефонные системы, распределенные вычислительные среды, содержащие любые из перечисленных систем или устройств и т.п., но не ограничиваются упомянутым.Examples of well-known computing systems, environments and / or configurations suitable for use with the present invention include personal computers, servers, handheld or portable devices, multiprocessor systems, microprocessor based systems, set-top boxes, programmable consumer electronics, network PCs, mini computers , universal computers, telephone systems, distributed computing environments containing any of the listed systems or devices, etc., but are not limited to those mentioned.

Краткое описание чертежейBrief Description of the Drawings

Рис. 1 - Структурная схема, иллюстрирующая сервис адаптивного машинного перевода, соответствующий настоящему изобретению.Fig. 1 is a block diagram illustrating an adaptive machine translation service according to the present invention.

Рис. 2 - Структурная схема, иллюстрирующая поиск стандартных фраз-аналогов и тем в базах данных автоматической системы машинного перевода, соответствующий настоящему изобретению.Fig. 2 is a block diagram illustrating the search for standard phrases-analogues and topics in the databases of an automatic machine translation system in accordance with the present invention.

Рис. 3 - Структурная схема одного конкретного применения вариантов осуществления настоящего изобретения.Fig. 3 is a block diagram of one particular application of embodiments of the present invention.

Рис. 4 - Структурная схема второго конкретного применения вариантов осуществления настоящего изобретения.Fig. 4 is a block diagram of a second specific application of embodiments of the present invention.

Подробное описание вариантов осуществления настоящего изобретенияDetailed Description of Embodiments of the Present Invention

На рис. 1 структурно показано, как работает адаптивная система машинного перевода в соответствии с настоящим изобретением.In fig. 1 shows structurally how an adaptive machine translation system in accordance with the present invention works.

Голосом или с помощью клавиатуры, а также с любого машиночитаемого носителя пользователь вводит в систему автоматического машинного перевода исходный текст 1, там происходит процесс разделения исходного текста 2 на отдельные фразы-предложения по таким признакам, как заглавные буквы в начале предложения и точка, вопросительный и восклицательный знаки в конце предложения. Затем исходной фразе 3 проводится автоматический процесс подбора 4 стандартной фразы-аналога в базах данных системы, затем стандартной фразе-аналогу 5 система осуществляет автоматический подбор тем 6 из своих баз данных, после чего пользователем выбирается из представленного набора тем подходящая 7. Если в базах данных системы есть только одна тема для стандартной фразы-аналога, то участие пользователя не требуется. Затем стандартная фраза, соответствующая своей теме подвергается процессу автоматического перевода 11, который состоит в том, что данной фразе в базах данных системы отыскивается однозначно точный перевод 12. Если же какой-то исходной фразе текста автоматическая система не находит у себя стандартных аналогов, то эта фраза 8 вместе с исходным текстом поступают по сети Интернет в удаленный источник надежной информации 9, где, либо автоматически, либо при участии человека-переводчика, новой фразе подбирается стандартный аналог и тема, либо из тем, имеющихся в базах данных системы, либо новая тема, соответственно создается стандартная пара "фраза-перевод" 10, которая вместе с новой темой закладывается в базы данных поиска автоматической системы машинного перевода 4, 6, 11. Исходная фраза, не имевшая до этого стандартных аналогов тоже закладывается в базы данных поиска, как нестандартное соответствие стандартной паре "фраза-перевод". В конечном итоге получается автоматически созданный перевод исходной фразы в виде однозначно точного перевода найденной ей стандартной фразы-аналога 12. После перевода всех исходных фраз система машинного перевода выдает полный перевод исходного текста 13.By voice or using the keyboard, as well as from any machine-readable medium, the user enters the source text 1 into the automatic machine translation system, there the process of dividing the source text 2 into separate sentence phrases takes place based on such criteria as capital letters at the beginning of the sentence and a period, interrogative exclamation marks at the end of the sentence. Then, the initial phrase 3 is used to automatically select 4 standard analog phrases in the system’s databases, then the standard analogue 5 phrases the system automatically selects 6 of its databases, after which the user selects the appropriate 7 from the presented set of topics. If the databases Since the system has only one topic for a standard phrase-analogue, user participation is not required. Then the standard phrase corresponding to its theme is subjected to the automatic translation process 11, which consists in the fact that the phrase in the databases of the system is searched for an unambiguously accurate translation 12. If the automatic system does not find standard analogs for some initial phrase of the text, then this phrase 8 together with the source text are transmitted via the Internet to a remote source of reliable information 9, where, either automatically, or with the participation of a human translator, a new analogue and subject are selected, or the number available in the system databases, or a new topic, respectively, a standard phrase-translation pair is created 10, which, together with the new topic, is stored in the search databases of the automatic machine translation system 4, 6, 11. The original phrase that did not have before standard analogues are also embedded in the search database as non-standard compliance with the standard phrase-translation pair. As a result, an automatically generated translation of the original phrase is obtained in the form of an unambiguously accurate translation of the standard analogue phrase found by it 12. After the translation of all the source phrases, the machine translation system issues a complete translation of the source text 13.

На рис. 2 отображен поиск стандартных соответствий по базам данных системы автоматического машинного перевода. В базах данных собраны все темы, которые когда-либо задавались системе, каждой теме соответствует свой набор стандартных фраз со своими однозначно точными переводами, а каждой стандартной фразе имеется свой набор исходных фраз, которые когда-либо задавались в систему машинного перевода и прошли через источник надежной информации для подбора им стандартной пары "фраза-перевод" в соответствии с заданной темой.In fig. 2 shows the search for standard matches in the databases of the automatic machine translation system. The databases contain all the topics that were ever asked to the system, each topic has its own set of standard phrases with its uniquely accurate translations, and each standard phrase has its own set of source phrases that were ever asked in the machine translation system and passed through the source reliable information for his selection of a standard phrase-translation pair in accordance with a given topic.

Исходная фраза 1 сравнивается в со всеми стандартными и нестандартными фразами в базе данных 2, где расположены все стандартные фразы с соответствующими им нестандартными фразами-аналогами, которые когда-либо задавались для перевода системе машинного перевода. Если нашлась стандартная фраза-аналог 3, то она поступает в базу данных 4, где расположены все темы со своими наборами соответствующих им стандартных фраз. После этого пользователь видит все темы 5, в наборах которых присутствует нужная ему стандартная фраза. Из них он выбирает одну 6, которая ему нужна.The original phrase 1 is compared in with all standard and non-standard phrases in database 2, where all standard phrases with their corresponding non-standard phrases-analogues that are ever specified for translation by the machine translation system are located. If a standard phrase-analogue 3 is found, then it enters database 4, where all topics are located with their own sets of standard phrases corresponding to them. After that, the user sees all 5 topics, in the sets of which there is a standard phrase he needs. Of them, he chooses one 6, which he needs.

На рис. 3 показан вариант использования настоящего изобретения при переводе исходного текста профессиональным переводчиком на иностранный язык. В этом случае системе посылается сигнал о том, что будет работать пользователь-переводчик, в системе предусматривается такая опция. Далее все идет по следующей схеме. Задается исходный текст 1, разбивается на исходные фразы-предложения 2, и, если этим фразам в системе есть стандартные аналоги и темы, то все идет так, как показано на рис. 1, но если находятся исходные фразы без стандартных аналогов и тем 8 в базах данных системы, то переводчик сам делает перевод фразы 9, после чего она вместе с исходным текстом поступает в источник надежной информации 10, где им дается, если нужно, стандартная модификация, и эти новые данные 11 поступают в базы данных 4, 6, 12 системы автоматического машинного перевода.In fig. 3 shows an embodiment of the use of the present invention when translating a source text by a professional translator into a foreign language. In this case, the system sends a signal that the user-translator will work, the system provides such an option. Further, everything goes as follows. The source text 1 is specified, it is divided into source sentences-sentences 2, and if these phrases in the system have standard analogues and themes, then everything goes as shown in Fig. 1, but if the source phrases without standard analogs and 8 in the system databases are located, the translator himself translates the phrase 9, after which it, together with the source text, goes to the source of reliable information 10, where they are given, if necessary, a standard modification, and this new data 11 enters the databases 4, 6, 12 of the automatic machine translation system.

Таким образом переводчик может сэкономить много времени и сил при переводе больших текстов, а также, имея готовый перевод, скажем на английский язык, состоящий из стандартных фраз, да еще имея тему каждой фразы, поскольку можно запросить ее у системы, он легко, точно и быстро переведет с помощью системы этот текст на любые другие языки, которыми сам не владеет. Также это возможно и для обычного пользователя, что подробно показано на рис. 4.Thus, the translator can save a lot of time and effort when translating large texts, and also, having the translation ready, let's say in English, consisting of standard phrases, and even having the subject of each phrase, since you can request it from the system, it’s easy, accurate and quickly translates the text using the system into any other languages that he does not own. It is also possible for the average user, as shown in detail in Fig. four.

На рис. 4 показан вариант использования настоящего изобретения при переводе уже готового перевода исходного текста на дополнительные языки. Пользователь имеет готовый перевод исходного текста на какой-то язык. Следовательно, этот перевод состоит из одних стандартных фраз. В системе будет предусмотрена опция, благодаря которой пользователь может запросить электронную версию перевода с проставлением каждой фразе текста названия ее темы. После чего пользователь дает сигнал системе, что ей предстоит перевод на соответствующий язык текста, состоящего из стандартных фраз с указанием их тем. В системе отключаются ненужные звенья и далее все идет следующим путем, исходный текст из стандартных фраз с темами по каждой фразе 1, задается в систему и делается его разделение на фразы предложения со своими темами 2, затем каждая тема 3 со своей стандартной фразой 4 поступают в автоматический процесс перевода стандартной фразы 5, выдавая ее автоматически созданный перевод 6.In fig. 4 shows an embodiment of the use of the present invention in translating an already completed translation of the source text into additional languages. The user has a ready translation of the source text into some language. Therefore, this translation consists of standard phrases. An option will be provided in the system, thanks to which the user can request an electronic version of the translation with each phrase inserted with the text of the name of its topic. After which the user gives a signal to the system that she will have to translate into the appropriate language a text consisting of standard phrases indicating their topics. Unnecessary links are disconnected in the system and everything goes the following way, the source text from standard phrases with topics for each phrase 1 is set into the system and its division into sentence phrases with its themes 2 is made, then each topic 3 with its own standard phrase 4 goes to automatic translation process of a standard phrase 5, issuing its automatically generated translation 6.

На конечном этапе получаем автоматически созданный перевод исходного текста.At the final stage, we get an automatically generated translation of the source text.

Claims (7)

1. Реализуемый с помощью компьютера способ предоставления информации автоматической системе машинного перевода, заключающийся в том, что: исходный текст на языке пользователя предварительно разбивается для анализа и перевода на отдельные фразы, каждая из которых представляет одно законченное предложение, каждой исходной фразе автоматическая система подбирает в своей базе данных стандартную фразу-аналог, после чего пользователь может видеть набор тем, в которых присутствует выбранная стандартная фраза в базе данных, если она присутствует сразу в нескольких темах, пользователь указывает тему, которую должна освещать выбранная им стандартная фраза, после чего дается однозначно точный перевод стандартной фразы на иностранный язык в соответствии с темой, которую эта фраза должна освещать, если стандартная фраза присутствует только в одной теме, то переводится сразу без участия пользователя, если исходной фразе нет в базе данных стандартных фраз-аналогов, то система посылает эту фразу вместе с исходным текстом в связанный с ней по сети Интернет источник надежной информации, где данной фразе готовится стандартный аналог, который либо закрепляется за одной из тем, имеющихся в базе данных системы, либо ему подбирается своя тема, подобранной стандартной фразе дается однозначный стандартный перевод на иностранные языки, после чего все эти результаты закладываются в базу данных автоматической системы машинного перевода, причем исходная нестандартная фраза тоже закладывается в базу данных, как одно из нестандартных соответствий стандартной паре "фраза-перевод", созданных для новой темы источником надежной информации, а потом перевод новой стандартной фразы предоставляется пользователю в составе перевода всего исходного текста.1. A computer-implemented way of providing information to an automatic machine translation system, which consists in the following: the source text in the user's language is preliminarily broken down for analysis and translation into separate phrases, each of which represents one complete sentence, the automatic system selects each source phrase in a standard phrase-analogue to its database, after which the user can see a set of topics in which the selected standard phrase is present in the database, if it is present it appears in several topics at once, the user indicates the topic that the standard phrase he has chosen to cover, after which an unambiguously accurate translation of the standard phrase into a foreign language is given in accordance with the topic that this phrase should cover, if the standard phrase is present in only one topic, then it is translated immediately without user intervention, if the source phrase does not have standard analog phrases in the database, the system sends this phrase together with the source text to a reliable information source connected to it via the Internet and, where a standard analogue is prepared for this phrase, which is either assigned to one of the topics available in the database of the system, or its own theme is selected, the selected standard phrase is given an unambiguous standard translation into foreign languages, after which all these results are stored in the database automatically machine translation systems, and the original non-standard phrase is also put into the database, as one of the non-standard matches to the standard phrase-translation pair, created for a new topic by a source of reliable information deformations of, and then translate the new standard phrase provided to the user as part of the transfer of all the source code. 2. Способ по п. 1, отличающийся тем, что предоставление информации автоматической системе машинного перевода производится отдельными законченными фразами-предложениями без необходимости анализировать смысл всего текста.2. The method according to p. 1, characterized in that the provision of information to the automatic machine translation system is carried out in separate complete sentences, sentences without the need to analyze the meaning of the entire text. 3. Способ по п. 1, отличающийся тем, что подготовка информации для перевода производится автоматической системой машинного перевода путем предварительного подбора стандартных фраз-аналогов исходных фраз и соответствующих им тем в имеющихся базах данных.3. The method according to p. 1, characterized in that the preparation of information for the translation is carried out by an automatic machine translation system by preliminary selection of standard phrases-analogues of the original phrases and the corresponding topics in the available databases. 4. Способ по п. 1, отличающийся тем, что каждой стандартной фразе на исходном языке в базах данных автоматической системы машинного перевода соответствует однозначно точный стандартный перевод на языках перевода.4. The method according to p. 1, characterized in that each standard phrase in the source language in the databases of the automatic machine translation system corresponds to a uniquely accurate standard translation in the target languages. 5. Способ по п. 1, отличающийся тем, что предусматривает пополнение баз данных автоматической системы машинного перевода новыми темами с соответствующими им наборами стандартных фраз и их стандартными переводами.5. The method according to p. 1, characterized in that it enriches the databases of the automatic machine translation system with new topics with their corresponding sets of standard phrases and their standard translations. 6. Способ по п. 1, отличающийся тем, что исходные фразы, которым подбираются стандартные пары "фраза-перевод" через источник надежной информации, в дальнейшем закладываются в базы данных системы автоматического перевода как часть набора нестандартных соответствий для каждой стандартной пары "фраза-перевод".6. The method according to claim 1, characterized in that the source phrases to which the standard phrase-translation pairs are selected through a source of reliable information are subsequently stored in the databases of the automatic translation system as part of a set of non-standard matches for each standard phrase-pair transfer". 7. Способ по п. 6, отличающийся тем, что в базах данных автоматической системы машинного перевода каждой стандартной паре "фраза-перевод" предусмотрен постоянно пополняемый набор нестандартных фраз-соответствий на языке пользователя.7. The method according to claim 6, characterized in that the databases of the automatic machine translation system of each standard phrase-translation pair provide for a constantly updated set of non-standard phrase-matches in the user's language.
RU2016113939A 2016-04-11 2016-04-11 Adaptive context-thematic machine translation RU2628202C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2016113939A RU2628202C1 (en) 2016-04-11 2016-04-11 Adaptive context-thematic machine translation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2016113939A RU2628202C1 (en) 2016-04-11 2016-04-11 Adaptive context-thematic machine translation

Publications (1)

Publication Number Publication Date
RU2628202C1 true RU2628202C1 (en) 2017-08-15

Family

ID=59641740

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016113939A RU2628202C1 (en) 2016-04-11 2016-04-11 Adaptive context-thematic machine translation

Country Status (1)

Country Link
RU (1) RU2628202C1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USD917549S1 (en) 2019-06-20 2021-04-27 Yandex Europe Ag Display screen or portion thereof with graphical user interface
RU2767965C2 (en) * 2019-06-19 2022-03-22 Общество С Ограниченной Ответственностью «Яндекс» Method and system for translating a source phrase in a first language with a target phrase in a second language
RU2770569C2 (en) * 2020-03-04 2022-04-18 Общество С Ограниченной Ответственностью «Яндекс» Method and server for training machine learning algorithm in translation
RU2779526C2 (en) * 2018-05-15 2022-09-08 Айфлайтек Ко., Лтд. Method and device for text translation at discourse level
US11694041B2 (en) 2018-05-15 2023-07-04 Iflytek Co., Ltd. Chapter-level text translation method and device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2285951C2 (en) * 2002-05-08 2006-10-20 Марк КРАСНОВ System for controlling language translation
EA007776B1 (en) * 2001-12-21 2007-02-27 Эли Абир Content conversion method and apparatus
RU2382399C2 (en) * 2003-06-20 2010-02-20 Майкрософт Корпорейшн Adaptive machine translation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA007776B1 (en) * 2001-12-21 2007-02-27 Эли Абир Content conversion method and apparatus
RU2285951C2 (en) * 2002-05-08 2006-10-20 Марк КРАСНОВ System for controlling language translation
RU2382399C2 (en) * 2003-06-20 2010-02-20 Майкрософт Корпорейшн Adaptive machine translation

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2779526C2 (en) * 2018-05-15 2022-09-08 Айфлайтек Ко., Лтд. Method and device for text translation at discourse level
US11694041B2 (en) 2018-05-15 2023-07-04 Iflytek Co., Ltd. Chapter-level text translation method and device
RU2767965C2 (en) * 2019-06-19 2022-03-22 Общество С Ограниченной Ответственностью «Яндекс» Method and system for translating a source phrase in a first language with a target phrase in a second language
US11568155B2 (en) 2019-06-19 2023-01-31 Yandex Europe Ag Method and system of translating a source phrase in a first language into a target phrase in a second language
USD917549S1 (en) 2019-06-20 2021-04-27 Yandex Europe Ag Display screen or portion thereof with graphical user interface
USD946599S1 (en) 2019-06-20 2022-03-22 Yandex Europe Ag Display screen or portion thereof with graphical user interface
RU2770569C2 (en) * 2020-03-04 2022-04-18 Общество С Ограниченной Ответственностью «Яндекс» Method and server for training machine learning algorithm in translation

Similar Documents

Publication Publication Date Title
US10073843B1 (en) Method and apparatus for cross-lingual communication
CN109840331B (en) Neural machine translation method based on user dictionary
CN110543644A (en) Machine translation method and device containing term translation and electronic equipment
US7848916B2 (en) System, method and program product for bidirectional text translation
JP4263181B2 (en) Communication support device, communication support method, and communication support program
RU2628202C1 (en) Adaptive context-thematic machine translation
US7630880B2 (en) Japanese virtual dictionary
JP2018028752A (en) Dialog system and computer program therefor
JP2005216126A (en) Text generation method and text generation device of other language
JPH03278174A (en) Translation method and system for communication between different language
JP2000353161A (en) Method and device for controlling style in generation of natural language
JP2009075791A (en) Device, method, program, and system for machine translation
JP5002271B2 (en) Apparatus, method, and program for machine translation of input source language sentence into target language
CN110678868A (en) Translation support system and the like
KR20170008357A (en) System for Translating Using Crowd Sourcing, Server and Method for Web toon Language Automatic Translating
RU2546064C1 (en) Distributed system and method of language translation
CN108255818B (en) Combined machine translation method using segmentation technology
JP6619764B2 (en) Language processing apparatus, program and method for selecting language model according to user attribute
CN108153743B (en) Intelligent off-line translation machine based on similarity
CN108280066B (en) Off-line translation method from Chinese to English
CN103577397A (en) Computer translation data processing method and computer translation data processing device
KR100327115B1 (en) Device and method for generating translated sentences based on partial translation patterns
JP2006024114A (en) Mechanical translation device and mechanical translation computer program
CN115618087B (en) Method and device for storing, searching and displaying multilingual translation corpus
JP3921543B2 (en) Machine translation device