RU2779526C2 - Method and device for text translation at discourse level - Google Patents

Method and device for text translation at discourse level Download PDF

Info

Publication number
RU2779526C2
RU2779526C2 RU2020139212A RU2020139212A RU2779526C2 RU 2779526 C2 RU2779526 C2 RU 2779526C2 RU 2020139212 A RU2020139212 A RU 2020139212A RU 2020139212 A RU2020139212 A RU 2020139212A RU 2779526 C2 RU2779526 C2 RU 2779526C2
Authority
RU
Russia
Prior art keywords
text
translated
encoding
relevant
result
Prior art date
Application number
RU2020139212A
Other languages
Russian (ru)
Other versions
RU2020139212A (en
Inventor
Чжицян МА
Цзюньхуа ЛЮ
Сы ВЭЙ
Гуопин Ху
Original Assignee
Айфлайтек Ко., Лтд.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Айфлайтек Ко., Лтд. filed Critical Айфлайтек Ко., Лтд.
Publication of RU2020139212A publication Critical patent/RU2020139212A/en
Application granted granted Critical
Publication of RU2779526C2 publication Critical patent/RU2779526C2/en

Links

Images

Abstract

FIELD: information processing.
SUBSTANCE: invention relates to a method, a device and a machine-readable carrier for text translation at a discourse level. In the method, the text to be translated is obtained, while the text to be translated is a unit of text in the text at the discourse level to be translated, the relevant text is obtained for the text to be translated, while the relevant text includes at least one of the following: the preceding source text, the subsequent source text or the preceding target text, wherein the preceding source text is at least one unit of text before the text to be translated in the text at the discourse level, the subsequent source text is at least one unit of text after the text to be translated in the text at the discourse level, and the preceding target text is the translation text of the mentioned preceding source text, and the text to be translated is translated in accordance with the relevant text, while the translation of the text to be translated in accordance with the relevant text includes: obtaining the initial encoding result by encoding the text to be translated, while the initial encoding result is semantic information of the text to be translated; obtaining the relevant encoding result by encoding the relevant text, while the relevant encoding result is semantic information of the relevant text; obtaining the target encoding result by processing the initial encoding result using all or part of encoding results in the relevant encoding result, and translating the text to be translated by decoding the target encoding result.
EFFECT: increase in the accuracy of text translation.
12 cl, 8 dwg

Description

[1] По настоящей заявке испрашивается приоритет согласно заявке на выдачу патента КНР №201810463138.3, озаглавленной «Способ и устройство для перевода текста на уровне дискурса» и поданной в патентное ведомство КНР 15 мая 2018 года, причем содержание упомянутой заявки полностью включено в настоящее описание посредством ссылки.[1] The present application claims priority according to the PRC Patent Application No. 201810463138.3 entitled "Method and Apparatus for Translating Text at the Discourse Level" and filed with the PRC Patent Office on May 15, 2018, and the content of said application is fully incorporated herein by links.

Область техникиTechnical field

[2] Настоящее изобретение относится к технической области перевода текстов и, в частности, к способу и устройству для перевода текста на уровне дискурса.[2] The present invention relates to the technical field of text translation and, in particular, to a method and apparatus for translating text at the discourse level.

Предпосылки создания изобретенияPrerequisites for the creation of the invention

[3] Текст на уровне дискурса состоит из последовательности предложений. Например, текст на уровне дискурса может представлять собой текст устного доклада, журнальную статью, литературное произведение и т.п. Поскольку основным свойством текстов на уровне дискурса являются связность и согласованность предложений, такой текст представляет собой не просто набор последовательных предложений, а имеет семантическое единство с завершенными структурами и ясными функциями.[3] The text at the level of discourse consists of a sequence of sentences. For example, the text at the discourse level can be the text of an oral report, a journal article, a literary work, etc. Since the main property of texts at the discourse level is the coherence and consistency of sentences, such a text is not just a set of consecutive sentences, but has a semantic unity with complete structures and clear functions.

[4] Для перевода таких текстов должны применяться способы перевода текстов на уровне дискурса. Среди известных способов перевода текстов на уровне дискурса, текст на уровне дискурса, подлежащий переводу, как правило, переводят непосредственно как единое целое, рассматривая его как отдельный объект перевода. Однако полученный в результате перевод не идеален в том смысле, что точность перевода невысока, что отрицательно сказывается на пользовательском восприятии.[4] To translate such texts, methods of translating texts at the level of discourse should be used. Among the known methods of translating texts at the discourse level, the text at the discourse level to be translated is usually translated directly as a whole, considering it as a separate object of translation. However, the resulting translation is not perfect in the sense that the accuracy of the translation is not high, which negatively affects the user's experience.

Сущность изобретенияThe essence of the invention

[5] Целью настоящего изобретения является предоставление способа и устройства для перевода текста на уровне дискурса, которые позволят повысить точность результата перевода текста на уровне дискурса.[5] The purpose of the present invention is to provide a method and apparatus for translating text at the discourse level, which will improve the accuracy of the result of translating text at the discourse level.

[6] В соответствии с вариантами осуществления настоящего изобретения предлагается способ перевода текста на уровне дискурса. Способ включает:[6] In accordance with embodiments of the present invention, a method for translating text at the discourse level is provided. The method includes:

[7] получение текста, подлежащего переводу, при этом текст, подлежащий переводу, представляет собой единицу текста в тексте на уровне дискурса, подлежащем переводу;[7] obtaining a text to be translated, wherein the text to be translated is a unit of text in the text at the discourse level to be translated;

[8] получение релевантного текста для текста, подлежащего переводу, при этом релевантный текст включает по меньшей мере одно из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст,[8] obtaining the relevant text for the text to be translated, wherein the relevant text includes at least one of the following: the previous source text, the subsequent source text, or the previous target text,

[9] при этом под предшествующим исходным текстом понимают по меньшей мере одну единицу текста перед текстом, подлежащим переводу, в тексте на уровне дискурса, под последующим исходным текстом понимают по меньшей мере одну единицу текста после текста, подлежащего переводу, в тексте на уровне дискурса, а под предшествующим целевым текстом понимают текст перевода упомянутого предшествующего исходного текста, и[9] meanwhile, the preceding source text is understood to be at least one unit of text before the text to be translated in the text at the discourse level, the subsequent source text is understood to be at least one unit of text after the text to be translated in the text at the discourse level , and by the previous target text is meant the text of the translation of the said previous source text, and

[10] перевод текста, подлежащего переводу, в соответствии с релевантным текстом.[10] translation of the text to be translated according to the relevant text.

[11] Опционально, перевод текста, подлежащего переводу, в соответствии с релевантным текстом включает:[11] Optionally, the translation of the text to be translated according to the relevant text includes:

[12] перевод текста, подлежащего переводу, в соответствии с релевантным текстом с использованием заранее построенной модели кодирования-декодирования.[12] translation of the text to be translated according to the relevant text using a pre-built encoding-decoding model.

[13] Опционально, перевод текста, подлежащего переводу, в соответствии с релевантным текстом включает:[13] Optionally, the translation of the text to be translated according to the relevant text includes:

[14] получение начального результата кодирования путем кодирования текста, подлежащего переводу, при этом начальный результат кодирования представляет семантическую информацию текста, подлежащего переводу;[14] obtaining the initial encoding result by encoding the text to be translated, wherein the initial encoding result represents the semantic information of the text to be translated;

[15] получение релевантного результата кодирования путем кодирования релевантного текста, при этом релевантный результат кодирования представляет семантическую информацию релевантного текста;[15] obtaining a relevant encoding result by encoding the relevant text, wherein the relevant encoding result represents the semantic information of the relevant text;

[16] получение целевого результата кодирования путем обработки начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования, при этом целевой результат кодирования представляет семантическую информацию текста, подлежащего переводу, и переносит всю семантическую информацию релевантного текста или ее часть, и[16] obtaining a target encoding result by processing the initial encoding result using all or part of the encoding results in the relevant encoding result, wherein the target encoding result represents the semantic information of the text to be translated and carries all or part of the semantic information of the relevant text, and

[17] перевод текста, подлежащего переводу, путем декодирования целевого результата кодирования.[17] translating the text to be translated by decoding the target encoding result.

[18] Опционально, получение начального результата кодирования путем кодирования текста, подлежащего переводу, включает:[18] Optionally, obtaining the initial encoding result by encoding the text to be translated includes:

[19] получение начального результата кодирования путем кодирования слов текста, подлежащего переводу.[19] obtaining the initial encoding result by encoding the words of the text to be translated.

[20] Соответственно, получение релевантного результата кодирования путем кодирования релевантного текста включает:[20] Accordingly, obtaining a relevant encoding result by encoding the relevant text includes:

[21] кодирование слов каждой единицы текста в релевантном тексте для получения результатов кодирования, отвечающих соответствующим единицам текста, и определение упомянутых результатов кодирования в качестве релевантного результата кодирования.[21] encoding the words of each text unit in the relevant text to obtain encoding results corresponding to the corresponding text units, and determining said encoding results as the relevant encoding result.

[22] Опционально, после кодирования слов текста, подлежащего переводу, способ также включает:[22] Optionally, after encoding the words of the text to be translated, the method also includes:

[23] получение суммарного результата, соответствующего тексту, подлежащему переводу, путем сложения вместе результатов кодирования слов текста, подлежащего переводу.[23] obtaining a total result corresponding to the text to be translated by adding together the results of encoding the words of the text to be translated.

[24] Соответственно, после кодирования слов каждой единицы текста в релевантном тексте способ также включает:[24] Accordingly, after encoding the words of each unit of text in the relevant text, the method also includes:

[25] в случае, когда релевантный текст включает предшествующий исходный текст, сложение вместе результатов кодирования слов каждой единицы текста в предшествующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста;[25] in the case where the relevant text includes the preceding source text, adding together the word encoding results of each text unit in the preceding source text to obtain a total result corresponding to each text unit;

[26] в случае, когда релевантный текст включает последующий исходный текст, сложение вместе результатов кодирования слов каждой единицы текста в последующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста, и,[26] in the case where the relevant text includes subsequent source text, adding together the word encoding results of each unit of text in the subsequent source text to obtain a total result corresponding to each unit of text, and,

[27] в случае, когда релевантный текст включает предшествующий целевой текст, сложение вместе результатов кодирования слов каждой единицы текста в предшествующем целевом тексте для получения суммарного результата, соответствующего каждой единице текста.[27] in the case where the relevant text includes the preceding target text, adding together the word encoding results of each text unit in the preceding target text to obtain a total result corresponding to each text unit.

[28] Опционально, обработка начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования включает:[28] Optionally, processing the initial encoding result using all or part of the encoding results in the relevant encoding result includes:

[29] определение, в случае, когда релевантный текст включает предшествующий исходный текст, результата кодирования предшествующего исходного текста из релевантного результата кодирования;[29] determining, in the case where the relevant text includes the preceding source text, the encoding result of the preceding source text from the relevant encoding result;

[30] определение, в случае, когда релевантный текст включает последующий исходный текст, результата кодирования последующего исходного текста из релевантного результата кодирования и[30] determining, in the case where the relevant text includes the subsequent source text, the encoding result of the subsequent source text from the relevant encoding result, and

[31] обработку начального результата кодирования в соответствии с определенным результатом кодирования.[31] processing the initial encoding result according to the determined encoding result.

[32] Опционально, обработка начального результата кодирования в соответствии с определенным результатом кодирования включает:[32] Optionally, processing the initial encoding result according to the determined encoding result includes:

[33] определение, в случае, когда релевантный текст включает предшествующий исходный текст, степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования предшествующего исходного текста.[33] determining, in the case where the relevant text includes the preceding source text, the degree of correlation between the text to be translated and the preceding source text according to the initial encoding result of the text to be translated and the encoding result of the preceding source text.

[34] определение, в случае, когда релевантный текст включает последующий исходный текст, степени корреляции между текстом, подлежащим переводу, и последующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования последующего исходного текста и[34] determining, in the case where the relevant text includes a subsequent source text, the degree of correlation between the text to be translated and the subsequent source text according to the initial encoding result of the text to be translated and the encoding result of the subsequent source text, and

[35] обработку начального результата кодирования в соответствии с определенным результатом кодирования и определенными степенями корреляции.[35] processing the initial encoding result in accordance with the determined encoding result and the determined degrees of correlation.

[36] Опционально, перевод текста, подлежащего переводу, путем декодирования целевого результата кодирования включает:[36] Optionally, translating the text to be translated by decoding the target encoding result includes:

[37] декодирование, в случае, когда релевантный текст включает предшествующий целевой текст, целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования.[37] decoding, in the case where the relevant text includes the previous target text, the encoding target result using the encoding result of the previous target text in the relevant encoding result.

[38] Опционально, декодирование целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования включает:[38] Optionally, decoding the target encoding result using the encoding result of the preceding target text in the relevant encoding result includes:

[39] определение степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом и[39] determining the degree of correlation between the text to be translated and the previous target text, and

[40] декодирование целевого результата кодирования в соответствии с определенной степенью корреляции и результатом кодирования предшествующего целевого текста.[40] decoding the target encoding result in accordance with the determined degree of correlation and the encoding result of the previous target text.

[41] Опционально, определение степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом включает:[41] Optionally, determining the degree of correlation between the text to be translated and the previous target text includes:

[42] определение степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в качестве степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом.[42] determining the degree of correlation between the text to be translated and the preceding source text as the degree of correlation between the text to be translated and the preceding target text.

[43] В соответствии с вариантами осуществления настоящего изобретения предлагается устройство для перевода текста на уровне дискурса. Устройство содержит:[43] In accordance with embodiments of the present invention, a device for translating text at the discourse level is provided. The device contains:

[44] блок получения текста, подлежащего переводу, который сконфигурирован для получения текста, подлежащего переводу, при этом текст, подлежащий переводу, представляет собой единицу текста в тексте на уровне дискурса, подлежащем переводу;[44] a text to be translated acquisition unit, which is configured to obtain a text to be translated, wherein the text to be translated is a unit of text in a discourse level text to be translated;

[45] блок получения релевантного текста, сконфигурированный для получения релевантного текста для текста, подлежащего переводу, при этом релевантный текст включает по меньшей мере одно из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст, причем под предшествующим исходным текстом понимают по меньшей мере одну единицу текста перед текстом, подлежащим переводу, в тексте на уровне дискурса, под последующим исходным текстом понимают по меньшей мере одну единицу текста после текста, подлежащего переводу, в тексте на уровне дискурса, а под предшествующим целевым текстом понимают текст перевода упомянутого предшествующего исходного текста, и[45] a relevant text obtaining unit configured to obtain relevant text for the text to be translated, wherein the relevant text includes at least one of the following: the previous source text, the subsequent source text, or the previous target text, wherein the previous source text is understood as at least one unit of text before the text to be translated in the text at the discourse level, the subsequent source text is understood to be at least one unit of text after the text to be translated in the text at the discourse level, and the preceding target text is the text of the translation of the aforementioned preceding source text, and

[46] блок перевода текста, подлежащего переводу, который сконфигурирован для перевода текста, подлежащего переводу, в соответствии с релевантным текстом.[46] a translation unit of the text to be translated, which is configured to translate the text to be translated according to the relevant text.

[47] Опционально, блок перевода текста, подлежащего переводу, сконфигурирован для перевода текста, подлежащего переводу, в соответствии с релевантным текстом с использованием заранее построенной модели кодирования-декодирования.[47] Optionally, the translation unit of the text to be translated is configured to translate the text to be translated according to the relevant text using a pre-built encoding-decoding model.

[48] Опционально, блок перевода текста, подлежащего переводу, содержит:[48] Optionally, the translation block of the text to be translated contains:

[49] первый подблок кодирования, сконфигурированный для получения начального результата кодирования путем кодирования текста, подлежащего переводу, при этом начальный результат кодирования представляет семантическую информацию текста, подлежащего переводу;[49] a first encoding subunit, configured to obtain an initial encoding result by encoding a text to be translated, wherein the initial encoding result represents the semantic information of the text to be translated;

[50] второй подблок кодирования, сконфигурированный для получения релевантного результата кодирования путем кодирования релевантного текста, при этом релевантный результат кодирования представляет семантическую информацию релевантного текста;[50] a second encoding subunit, configured to obtain a relevant encoding result by encoding the relevant text, wherein the relevant encoding result represents the semantic information of the relevant text;

[51] подблок обработки результата, сконфигурированный для получения целевого результата кодирования путем обработки начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования, при этом целевой результат кодирования представляет семантическую информацию текста, подлежащего переводу, и переносит всю семантическую информацию релевантного текста или ее часть, и[51] a result processing subunit configured to obtain a target encoding result by processing the initial encoding result using all or part of the encoding results in the relevant encoding result, wherein the target encoding result represents the semantic information of the text to be translated and carries all the semantic information of the relevant text or part of it, and

[52] подблок выполнения декодирования, сконфигурированный для перевода текста, подлежащего переводу, путем декодирования целевого результата кодирования.[52] a decoding execution sub-unit configured to translate text to be translated by decoding a target encoding result.

[53] Опционально, подблок выполнения декодирования сконфигурирован для декодирования, в случае, когда релевантный текст включает предшествующий целевой текст, целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования.[53] Optionally, the decoding execution sub-unit is configured to decode, in the case where the relevant text includes the previous target text, the target encoding result using the encoding result of the previous target text in the relevant encoding result.

[54] В соответствии с вариантами осуществления настоящего изобретения предлагается устройство для перевода текста на уровне дискурса. Устройство содержит процессор, память и системную шину,[54] In accordance with embodiments of the present invention, a device for translating text at the discourse level is provided. The device contains a processor, memory and a system bus,

[55] при этом процессор и память связаны друг с другом посредством системной шины, и[55] while the processor and memory are connected to each other via the system bus, and

[56] память сконфигурирована для хранения одной или более программ, содержащих инструкции, которые при их исполнении процессором обеспечивают выполнение, этим процессором, любых из описанных выше способов перевода текста на уровне дискурса.[56] the memory is configured to store one or more programs containing instructions that, when executed by a processor, cause, by that processor, any of the discourse-level text translation methods described above.

[57] В соответствии с вариантами осуществления настоящего изобретения предлагается машиночитаемый носитель данных. Машиночитаемый носитель данных содержит инструкции, которые при их исполнении на компьютере обеспечивают выполнение, этим компьютером, любых из описанных выше способов перевода текста на уровне дискурса.[57] According to embodiments of the present invention, a computer-readable storage medium is provided. The computer-readable storage medium contains instructions which, when executed on a computer, cause that computer to perform any of the above-described methods of translating text at the discourse level.

[58] В соответствии с вариантами осуществления настоящего изобретения предлагается компьютерный программный продукт, который при его исполнении на терминальном устройстве обеспечивает выполнение, этим терминальным устройством, любых из описанных выше способов перевода текста на уровне дискурса.[58] In accordance with embodiments of the present invention, there is provided a computer program product that, when executed on a terminal device, causes that terminal device to perform any of the discourse-level text translation methods described above.

[59] При использовании способа и устройства для перевода текста на уровне дискурса, соответствующих вариантам осуществления настоящего изобретения, каждую единицу текста в тексте на уровне дискурса, подлежащем переводу, берут в качестве текста, подлежащего переводу, затем из текста на уровне дискурса получают релевантный текст для текста, подлежащего переводу, и переводят текст, подлежащий переводу, на основе упомянутого релевантного текста. Можно видеть, что при переводе текста, подлежащего переводу, учитывается не только текущий контекст текста, подлежащего переводу, но и содержание релевантного текста для текста, подлежащего переводу, что позволяет повысить точность результата перевода текста, подлежащего переводу, и соответственно улучшить пользовательское восприятие.[59] When using the method and apparatus for translating text at the discourse level according to the embodiments of the present invention, each unit of text in the text at the discourse level to be translated is taken as the text to be translated, then the relevant text is obtained from the text at the discourse level for the text to be translated, and translating the text to be translated based on said relevant text. It can be seen that when translating the text to be translated, not only the current context of the text to be translated is taken into account, but also the content of the relevant text for the text to be translated, which makes it possible to improve the accuracy of the result of the translation of the text to be translated and, accordingly, improve the user experience.

Краткое описание чертежейBrief description of the drawings

[60] Ниже будут кратко описаны чертежи, используемые при описании вариантов осуществления настоящего изобретения или известных технологий, для пояснения технических решений в соответствии с вариантами осуществления настоящего изобретения или в соответствии с известным уровнем техники. Очевидно, что на приложенных чертежах в последующем описании проиллюстрированы лишь некоторые из вариантов осуществления настоящего изобретения. Специалисты в данной области техники, не прилагая творческих усилий, могут создать на их основе другие чертежи.[60] The following will briefly describe the drawings used in describing embodiments of the present invention or known technologies to explain technical solutions in accordance with embodiments of the present invention or in accordance with the prior art. Obviously, the accompanying drawings in the following description illustrate only some of the embodiments of the present invention. Specialists in the art, without making creative efforts, can create other drawings based on them.

[61] На фиг. 1 показана блок-схема способа перевода текста на уровне дискурса в соответствии с одним из вариантов осуществления настоящего изобретения.[61] FIG. 1 shows a flow diagram of a method for translating text at the discourse level in accordance with one embodiment of the present invention.

[62] На фиг. 2 показана схема текста на уровне дискурса в соответствии с одним из вариантов осуществления настоящего изобретения.[62] FIG. 2 shows a text diagram at the discourse level in accordance with one embodiment of the present invention.

[63] На фиг. 3 показана топологическая структурная схема модели кодирования-декодирования в соответствии с одним из вариантов осуществления настоящего изобретения.[63] FIG. 3 shows a topological block diagram of an encoding/decoding model in accordance with one embodiment of the present invention.

[64] На фиг. 4 показана блок-схема выполнения перевода с использованием заранее построенной модели кодирования-декодирования в соответствии с одним из вариантов осуществления настоящего изобретения.[64] FIG. 4 shows a flowchart for performing translation using a pre-built encoding/decoding model in accordance with one embodiment of the present invention.

[65] На фиг. 5 показана блок-схема выполнения обработки начального результата кодирования в соответствии с одним из вариантов осуществления настоящего изобретения.[65] FIG. 5 is a flowchart showing the processing of initial encoding result processing according to one embodiment of the present invention.

[66] На фиг. 6 показана сетевая структурная логическая схема шлюзовой сети (Gate Network) в соответствии с одним из вариантов осуществления настоящего изобретения.[66] FIG. 6 is a network block diagram of a Gate Network in accordance with one embodiment of the present invention.

[67] На фиг. 7 показана структурная схема устройства для перевода текста на уровне дискурса в соответствии с одним из вариантов осуществления настоящего изобретения.[67] FIG. 7 shows a block diagram of a device for translating text at the discourse level in accordance with one embodiment of the present invention.

[68] На фиг. 8 показана структурная аппаратная схема устройства для перевода текста на уровне дискурса в соответствии с одним из вариантов осуществления настоящего изобретения.[68] FIG. 8 shows a hardware block diagram of a device for translating text at the discourse level in accordance with one embodiment of the present invention.

Подробное описание вариантов осуществления изобретенияDetailed description of embodiments of the invention

[69] В некоторых способах перевода текста на уровне дискурса в качестве объекта перевода, непосредственно переводимого с помощью модели перевода, может рассматриваться весь подлежащий переводу текст на уровне дискурса. Однако, если каждое предложение текста на уровне дискурса переводить с использованием таких способов, контекстная информация для переводимого предложения учитываться не будет, что негативно скажется на точности результата перевода и на пользовательском восприятии. Кроме того, при переводе предложения, в информации, которую принимает модель перевода, может содержаться избыточная информация. Более конкретно, если предложения, предшествующие и последующие переводимому предложению, не связаны с ним по смыслу, то в случае, когда в качестве объекта перевода для этого предложения взят текст на уровне дискурса целиком, нерелевантные предшествующее и последующее предложения будут избыточной информацией.[69] In some methods of translating text at the discourse level, the entire text to be translated at the discourse level can be considered as the object of translation directly translated using the translation model. However, if each sentence of the text at the discourse level is translated using such methods, the contextual information for the translated sentence will not be taken into account, which will negatively affect the accuracy of the translation result and the user's perception. Also, when translating a sentence, the information that the translation model accepts may contain redundant information. More specifically, if the sentences preceding and following the translated sentence are not related to it in meaning, then in the case when the text at the discourse level is taken as the object of translation for this sentence, the irrelevant preceding and subsequent sentences will be redundant information.

[70] Для решения описанных выше проблем предлагается способ перевода текста на уровне дискурса в соответствии с вариантами осуществления настоящего изобретения. Для каждого фрагмента текста, подлежащего переводу, причем текст представляет собой, например, предложение, в тексте на уровне дискурса, при переводе текста, подлежащего переводу, учитывают не только его текущий контекст, но и контекстную информацию текста, подлежащего переводу, что позволяет повысить точность результата перевода текста, подлежащего переводу, и соответственно улучшить пользовательское восприятие. Кроме того, в вариантах осуществления настоящего изобретения, при переводе текста, подлежащего переводу, контекстную информацию выбирают динамически согласно релевантности текста, подлежащего переводу, контекстной информации, что не только позволяет уменьшить избыточную информацию в информации, принимаемой в модели перевода, но также повысить точность результата перевода текста, подлежащего переводу. Кроме того, в вариантах осуществления настоящего изобретения, при переводе текста, подлежащего переводу, учитывают также результат перевода текста, предшествующего тексту, подлежащему переводу, что позволяет связать результат перевода текста, подлежащего переводу, с результатом перевода предшествующего теста. Таким образом, не только повышается точность перевода текста, подлежащего переводу, но также и плавность текста перевода в целом. Другими словами, гарантируются связность и согласованность предложений переведенного текста на уровне дискурса.[70] In order to solve the problems described above, a discourse-level text translation method according to embodiments of the present invention is provided. For each piece of text to be translated, where the text is, for example, a sentence, in a text at the discourse level, when translating the text to be translated, not only its current context is taken into account, but also the contextual information of the text to be translated, which improves accuracy. translation result of the text to be translated, and improve the user experience accordingly. In addition, in the embodiments of the present invention, when translating the text to be translated, the context information is dynamically selected according to the relevance of the text to be translated, the context information, which not only reduces redundant information in the information received in the translation model, but also improves the accuracy of the result. translation of the text to be translated. In addition, in the embodiments of the present invention, when translating the text to be translated, the result of the translation of the text preceding the text to be translated is also taken into account, which allows the result of the translation of the text to be translated to be associated with the result of the translation of the previous test. In this way, not only the accuracy of the translation of the text to be translated is improved, but also the smoothness of the translation text as a whole. In other words, the coherence and consistency of the sentences of the translated text at the discourse level are guaranteed.

[71] Технические решения, предлагаемые в вариантах осуществления настоящего изобретения, будут описаны ясно и полностью далее со ссылками на приложенные чертежи, для пояснения целей, технических решений и преимуществ вариантов осуществления настоящего изобретения. Очевидно, что рассмотренные варианты осуществления настоящего изобретения представляют собой лишь некоторые, но не все возможные варианты его осуществления. Другие варианты осуществления настоящего изобретения, которые могут быть получены специалистами в данной области техники на основе вариантов осуществления настоящего изобретения без творческих усилий, находятся в пределах сущности настоящего изобретения.[71] The technical solutions proposed in the embodiments of the present invention will be described clearly and completely in the following with reference to the attached drawings, to explain the objectives, technical solutions and advantages of the embodiments of the present invention. It is obvious that the considered embodiments of the present invention are only some, but not all possible options for its implementation. Other embodiments of the present invention, which can be obtained by those skilled in the art based on the embodiments of the present invention without creative effort, are within the spirit of the present invention.

[72] Первый вариант осуществления изобретения[72] First Embodiment

[73] На фиг. 1 показана блок-схема способа перевода текста на уровне дискурса в соответствии с одним из вариантов осуществления настоящего изобретения. Способ включает шаги S101-S103, описанные ниже.[73] FIG. 1 shows a flow diagram of a method for translating text at the discourse level in accordance with one embodiment of the present invention. The method includes steps S101-S103 described below.

[74] На шаге S101 получают текст, подлежащий переводу, при этом текст, подлежащий переводу, представляет собой единицу текста в тексте на уровне дискурса, подлежащем переводу.[74] In step S101, a text to be translated is obtained, wherein the text to be translated is a unit of text in a discourse-level text to be translated.

[75] Текст на уровне дискурса, подлежащий переводу, то есть текст на уровне дискурса до перевода, далее будет для простоты называться просто текстом на уровне дискурса. Данный вариант осуществления настоящего изобретения не накладывает ограничений на тип текста на уровне дискурса. Например, текст на уровне дискурса может представлять собой текст устного доклада, журнальную статью, литературное произведение и т.п.[75] The discourse-level text to be translated, that is, the discourse-level text prior to translation, will hereinafter be referred to simply as the discourse-level text for simplicity. This embodiment of the present invention imposes no restrictions on the type of text at the discourse level. For example, the text at the discourse level can be the text of an oral report, a journal article, a literary work, etc.

[76] Текст на уровне дискурса представляет собой набор последовательных предложений. При переводе текста на уровне дискурса единицей перевода может быть предложение или последовательный текст любой другой длины в варианте осуществления настоящего изобретения. Если допустить, что перевод выполняют по предложениям, то каждое предложение может быть получено в соответствии с последовательностью предложений в тексте на уровне дискурса. Предложение, полученное в текущий момент, определяют в качестве текста, подлежащего переводу, и переводят в соответствии с описанными ниже шагами.[76] The text at the level of discourse is a set of consecutive sentences. When translating text at the discourse level, the unit of translation can be a sentence or a sequential text of any other length in an embodiment of the present invention. If we assume that the translation is performed by sentences, then each sentence can be obtained in accordance with the sequence of sentences in the text at the discourse level. The sentence currently received is identified as the text to be translated and translated according to the steps below.

[77] Следует отметить, что данный вариант осуществления настоящего изобретения не накладывает ограничения на язык текста на уровне дискурса как до, так и после перевода. К примеру, языком оригинала может быть китайский, а языком перевода - английский.[77] It should be noted that this embodiment of the present invention does not impose restrictions on the language of the text at the discourse level, both before and after translation. For example, the original language may be Chinese and the target language may be English.

[78] На шаге S102 получают релевантный текст для текста, подлежащего переводу, при этом релевантный текст включает по меньшей мере одно из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст.[78] In step S102, the relevant text for the text to be translated is obtained, wherein the relevant text includes at least one of the following: the previous source text, the subsequent source text, or the previous target text.

[79] В данном варианте осуществления настоящего изобретения под предшествующим исходным текстом понимают по меньшей мере одну единицу текста перед текстом, подлежащим переводу, в тексте на уровне дискурса, под последующим исходным текстом понимают по меньшей мере одну единицу текста после текста, подлежащего переводу, в тексте на уровне дискурса, а под предшествующим целевым текстом понимают текст перевода упомянутого предшествующего исходного текста.[79] In this embodiment of the present invention, prior source text is understood to be at least one unit of text before the text to be translated in a discourse-level text, subsequent source text is understood to be at least one unit of text after the text to be translated in text at the discourse level, and the previous target text is understood as the text of the translation of the mentioned previous source text.

[80] Более конкретно, если перевод выполняют по предложениям, одно или более предложений, предшествующих тексту, подлежащему переводу, могут быть получены из текста на уровне дискурса в качестве предшествующего исходного текста. Одно или более предложений, следующих за текстом, подлежащим переводу, могут быть получены из текста на уровне дискурса в качестве последующего исходного текста. Кроме того, поскольку каждое предложение в тексте на уровне дискурса переводят последовательно, то на момент перевода текста, подлежащего переводу, предшествующий ему исходный текст уже переведен. Таким образом, может быть непосредственно получен текст перевода предшествующего исходного текста, то есть предшествующий целевой текст.[80] More specifically, if the translation is performed by sentences, one or more sentences preceding the text to be translated can be derived from the text at the discourse level as the preceding source text. One or more sentences following the text to be translated can be derived from the text at the discourse level as a subsequent source text. In addition, since each sentence in the text is translated sequentially at the discourse level, at the time of translation of the text to be translated, the source text preceding it has already been translated. Thus, the translation text of the previous source text, that is, the previous target text, can be directly obtained.

[81] Следует отметить, что количество предложений в предшествующем исходном тексте и последующем исходном тексте может быть одинаковым или различным. Если в качестве предшествующего исходного текста определены к предложений, предшествующие тексту, подлежащему переводу, в качестве последующего исходного текста могут быть определены к или l предложений, следующих за текстом, подлежащим переводу, где k и l - целые числа, причем k≠l, k≥1, l≥1.[81] It should be noted that the number of sentences in the preceding source text and subsequent source text may be the same or different. If k sentences preceding the text to be translated are defined as the preceding source text, k or l sentences following the text to be translated can be defined as the subsequent source text, where k and l are integers, where k≠l, k ≥1, l≥1.

[82] Например, в тексте на уровне дискурса, показанном на фиг. 2, текст, подлежащий переводу, обозначен X, предложение X-1, предшествующее X, может быть определено в качестве предшествующего исходного текста, или несколько предложений, предшествующих X, например предложение Х-1 и предложение Х-2, могут быть определены в качестве предшествующего исходного текста. Аналогично, предложение Х1, следующее за X, может быть определено в качестве последующего исходного текста, или несколько предложений, следующих за X, например предложение Х1, предложение Х2 и предложение Х3, могут быть определены в качестве последующего исходного текста.[82] For example, in the text at the discourse level shown in FIG. 2, the text to be translated is indicated by X, the sentence X -1 preceding X may be identified as the preceding source text, or several sentences preceding X, such as sentence X -1 and sentence X -2 , may be designated as previous source text. Similarly, the sentence X 1 following X may be designated as a subsequent source text, or multiple sentences following X, such as sentence X 1 , sentence X 2 and sentence X 3 , may be designated as a subsequent source text.

[83] На шаге 103 выполняют перевод текста, подлежащего переводу, в соответствии с релевантным текстом.[83] In step 103, translation of the text to be translated is performed according to the relevant text.

[84] В данном варианте осуществления настоящего изобретения при переводе текста, подлежащего переводу, может также учитываться релевантный ему текст. Другими словами, для перевода текста, подлежащего переводу, учитывают семантическую информацию по меньше мере одного из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст для текста, подлежащего переводу, чтобы получить результат перевода текста, подлежащего переводу. Также может учитываться степень корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом, степень корреляции между текстом, подлежащим переводу, и последующим исходным текстом, и степень корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом. Очевидно, за счет учета семантического содержания текста, подлежащего переводу, и релевантного текста, а также степени корреляции между текстом, подлежащим переводу, и релевантным текстом может быть получен более точный результат перевода текста, подлежащего переводу.[84] In this embodiment of the present invention, when translating the text to be translated, the relevant text may also be taken into account. In other words, for the translation of the text to be translated, the semantic information of at least one of the following is taken into account: the previous source text, the subsequent source text, or the previous target text for the text to be translated, to obtain the translation result of the text to be translated. The degree of correlation between the text to be translated and the preceding source text, the degree of correlation between the text to be translated and the subsequent source text, and the degree of correlation between the text to be translated and the preceding target text may also be considered. Obviously, by taking into account the semantic content of the text to be translated and the relevant text, as well as the degree of correlation between the text to be translated and the relevant text, a more accurate result of the translation of the text to be translated can be obtained.

[85] Следует отметить, что когда релевантный текст включает предшествующий целевой текст (результат перевода предшествующего исходного текста), то есть когда предшествующий целевой текст используют как вспомогательный при переводе текста, подлежащего переводу, не только повышается точность результата перевода текста, подлежащего переводу, но и обеспечивается возможность связать результат перевода текста, подлежащего переводу, с результатом перевода предшествующего исходного текста. Другими словами, результат перевода текста, подлежащего переводу, может быть в большей степени связан по смыслу с результатом перевода предшествующего исходного текста, что гарантирует связность и согласованность предложений переведенного текста на уровне дискурса.[85] It should be noted that when the relevant text includes the previous target text (translation result of the previous source text), that is, when the previous target text is used as an auxiliary in the translation of the text to be translated, not only the accuracy of the translation result of the text to be translated is improved, but and it is possible to link the result of the translation of the text to be translated with the result of the translation of the previous source text. In other words, the result of the translation of the text to be translated can be more related in meaning to the result of the translation of the previous source text, which guarantees the coherence and consistency of the sentences of the translated text at the discourse level.

[86] Отметим, что за описанием конкретной реализации шага S103 можно обратиться ко второму варианту осуществления настоящего изобретения.[86] Note that for a description of the specific implementation of step S103, refer to the second embodiment of the present invention.

[87] Таким образом, в соответствии с данным вариантом осуществления настоящего изобретения предлагается способ перевода текста на уровне дискурса, в котором каждую единицу текста в тексте на уровне дискурса, подлежащем переводу, берут в качестве текста, подлежащего переводу, затем из текста на уровне дискурса получают релевантный текст для текста, подлежащего переводу, и переводят текст, подлежащий переводу, на основе упомянутого релевантного текста. Можно видеть, что при переводе текста, подлежащего переводу, учитывается не только текущий контекст текста, подлежащего переводу, но и содержание релевантного текста для текста, подлежащего переводу, что позволяет повысить точность результата перевода текста, подлежащего переводу, и соответственно улучшить пользовательское восприятие.[87] Thus, according to this embodiment of the present invention, a discourse-level text translation method is provided in which each unit of text in the discourse-level text to be translated is taken as the text to be translated, then from the discourse-level text obtaining a relevant text for the text to be translated, and translating the text to be translated based on said relevant text. It can be seen that when translating the text to be translated, not only the current context of the text to be translated is taken into account, but also the content of the relevant text for the text to be translated, which makes it possible to improve the accuracy of the result of the translation of the text to be translated and, accordingly, improve the user experience.

[88] Второй вариант осуществления изобретения[88] Second Embodiment

[89] Данный вариант осуществления настоящего изобретения включает конкретную реализацию шага S103, упомянутого в первом варианте осуществления настоящего изобретения.[89] This embodiment of the present invention includes a specific implementation of step S103 mentioned in the first embodiment of the present invention.

[90] В данном варианте осуществления настоящего изобретения может быть заранее построена модель кодирования-декодирования как модель перевода текстов на уровне дискурса, то есть модель кодирования-декодирования осуществляет перевод текста на уровне дискурса посредством кодирования и последующего декодирования. Соответственно, упомянутый выше шаг S103 может включать, в частности, перевод текста, подлежащего переводу, в соответствии с релевантным текстом с использованием заранее построенной модели кодирования-декодирования.[90] In this embodiment of the present invention, the encoding-decoding model can be pre-built as a model for translating texts at the discourse level, that is, the encoding-decoding model performs text translation at the discourse level by encoding and then decoding. Accordingly, the above-mentioned step S103 may include specifically translating the text to be translated according to the relevant text using the pre-built encoding/decoding model.

[91] Следует отметить, что применение модели кодирования-декодирования для перевода текста, подлежащего переводу, рассмотрено ниже со ссылкой на фиг.3, где показана топологическая структурная схема модели кодирования-декодирования.[91] It should be noted that the application of the encoding-decoding model for translating text to be translated is discussed below with reference to FIG. 3, which shows a topological block diagram of the encoding-decoding model.

[92] Для обеспечения введения для фиг.3, рассмотрим пример, в котором перевод выполняют по предложениям, при этом в качестве предшествующего исходного текста берут к предложений перед текстом, подлежащим переводу, а в качестве последующего исходного текста берут к предложений после текста, подлежащего переводу. Сначала определим следующее.[92] To provide an introduction for Figure 3, consider an example in which the translation is performed by sentences, while taking k sentences before the text to be translated as the previous source text, and taking k sentences after the text to be translated as the subsequent source text. translation. Let's first define the following.

[93] 1. Текст на уровне дискурса до перевода представлен как {Х-k, …, Х-1, X, Х1, … Хk}, где X представляет текст, подлежащий переводу, X-1…Х-k последовательно представляют первое предложение перед X, …, k-е предложение перед X; X1 … Хk последовательно представляют первое предложение после X, …, k-е предложение после X. Здесь Х-1 … Х-k совместно определены в качестве предшествующего исходного текста, a X1 … Хk совместно определены в качестве последующего исходного текста.[93] 1. The text at the discourse level before translation is represented as {X -k , …, X -1 , X, X 1 , … X k }, where X represents the text to be translated, X -1 ... X -k in sequence represent the first sentence before X, ..., the kth sentence before X; X 1 ... X k sequentially represent the first sentence after X, ..., the kth sentence after X. Here, X -1 ... X -k are jointly defined as the preceding source text, and X 1 ... X k are jointly defined as the subsequent source text .

[94] Для простоты допустим, что каждое предложение содержит n слов (на практике будет использоваться фактическое количество слов). Как показано на фиг. 3, все слова текста X, подлежащего переводу, представлены как {х1, х2, …,хn}, где х1, х2, …, хn последовательно представляют первое слово, второе слово, …, n-е слово текста X подлежащего переводу. Аналогично, все слова предложения Х-k в предшествующем исходном тексте представлены как

Figure 00000001
где
Figure 00000002
последовательно представляют первое слово, второе слово, …, n-е слово предложения Х-k; остальные предложения предшествующего исходного текста представлены аналогичным образом. Все слова предложения Хk в последующем исходном тексте представлены как
Figure 00000003
где
Figure 00000004
последовательно представляют первое слово, второе слово, …, n-е слово предложения Хk; остальные предложения последующего исходного текста представлены аналогичным образом.[94] For simplicity, let's assume that each sentence contains n words (in practice, the actual number of words will be used). As shown in FIG. 3, all words of the text X to be translated are represented as {x 1 , x 2 , ..., x n }, where x 1 , x 2 , ..., x n sequentially represent the first word, the second word, ..., the nth word text X to be translated. Similarly, all the words of the sentence X -k in the preceding source text are represented as
Figure 00000001
where
Figure 00000002
sequentially represent the first word, the second word, ..., the n-th word of the sentence X -k ; the remaining sentences of the preceding source text are presented in a similar way. All words of the sentence Х k in the following source text are presented as
Figure 00000003
where
Figure 00000004
sequentially represent the first word, the second word, ..., the n-th word of the sentence X k ; the remaining sentences of the subsequent source text are presented in a similar way.

[95] 2. Текст на уровне дискурса после перевода представлен как {Y-k, …, Y-1, Y, Y1, … Yk}, где Y представляет текст перевода текста X, подлежащего переводу, Y-1…Y-k последовательно представляют текст перевода Х-1…Х-k в предшествующем исходном тексте, a Y1…Yk последовательно представляют текст перевода Х1…Хk в последующем исходном тексте. Здесь Y-1…Y-k совместно определены в качестве предшествующего целевого текста.[95] 2. Text at the discourse level after translation is represented as {Y -k , …, Y -1 , Y, Y 1 , … Y k }, where Y represents the translation text of text X to be translated, Y -1 …Y -k sequentially represent the translation text X -1 ...X -k in the preceding source text, and Y 1 ...Y k sequentially represent the translation text X 1 ...X k in the subsequent source text. Here Y -1 ...Y -k are jointly defined as the previous target text.

[96] Все слова текста перевода Y для текста X, подлежащего переводу, представлены как {у1, у2, …, yn}, где y1, y2, …, yn последовательно представляют первое слово, второе слово, …, n-е слово текста Y как показано на фиг.3, все слова предложения Y-k в предшествующем целевом тексте представлены как

Figure 00000005
, где
Figure 00000006
последовательно представляют первое слово, второе слово, …, n-е слово предложения Y-k. Все слова предложения Y-1 в предшествующем целевом тексте представлены как
Figure 00000007
, где
Figure 00000008
последовательно представляют первое слово, второе слово, …, n-е слово предложения Y-1. Остальные предложения последующего целевого текста представлены аналогичным образом.[96] All words of the translation text Y for the text X to be translated are represented as {y 1 , y 2 , …, y n }, where y 1 , y 2 , …, y n successively represent the first word, the second word, … , the nth word of the text Y as shown in Fig. 3, all the words of the sentence Y -k in the preceding target text are represented as
Figure 00000005
, where
Figure 00000006
sequentially represent the first word, the second word, ..., the n-th word of the sentence Y -k . All words of sentence Y -1 in the preceding target text are represented as
Figure 00000007
, where
Figure 00000008
sequentially represent the first word, the second word, ..., the n-th word of the sentence Y -1 . The remaining sentences of the subsequent target text are presented in a similar way.

[97] Ниже, со ссылкой на фиг. 3, будет описано применение модели кодирования-декодирования для перевода текста, подлежащего переводу.[97] Below, with reference to FIG. 3, the application of an encoding-decoding model for translating a text to be translated will be described.

[98] Фиг. 4 представляет собой блок-схему выполнения перевода с использованием заранее построенной модели кодирования-декодирования, которая в одной из реализаций данного варианта осуществления изобретения включает, в частности, описанные ниже шаги S401-S404.[98] FIG. 4 is a flowchart for performing translation using a pre-built encoding/decoding model, which in one implementation of this embodiment includes steps S401-S404 described below in particular.

[99] На шаге S401 получают начальный результат кодирования путем кодирования текста, подлежащего переводу, при этом начальный результат кодирования представляет семантическую информацию текста, подлежащего переводу.[99] In step S401, an initial encoding result is obtained by encoding the text to be translated, wherein the initial encoding result represents the semantic information of the text to be translated.

[100] В одной из реализаций шаг S401 может включать, в частности, получение начального результата кодирования путем кодирования текста, подлежащего переводу, с использованием двунаправленной рекуррентной нейронной сети (Recurrent Neural Network, RNN).[100] In one implementation, step S401 may include, in particular, obtaining the initial encoding result by encoding the text to be translated using a bidirectional recurrent neural network (Recurrent Neural Network, RNN).

[101] На шаге S401 или в конкретных реализациях шага S401 при кодировании текста, подлежащего переводу, начальный результат кодирования может быть получен, в частности, путем кодирования всех слов текста, подлежащего переводу.[101] In step S401 or in specific implementations of step S401, when encoding the text to be translated, the initial encoding result can be obtained, in particular, by encoding all the words of the text to be translated.

[102] Более конкретно, как показано на фиг. 3, слова текста X, подлежащего переводу, то есть {х12,…,хn}, вводят в двунаправленную RNN-сеть в виде вектора слов.[102] More specifically, as shown in FIG. 3, the words of the text X to be translated, that is, {x 1 ,x 2 ,...,x n }, are entered into the bidirectional RNN as a vector of words.

Для векторизации слов в данном варианте осуществления настоящего изобретения могут применяться любые из известных или предложенных в будущем методов.To vectorize words in this embodiment of the present invention, any of the methods known or proposed in the future can be used.

[103] Формула для вычисления каждого из скрытых состояний двунаправленной RNN-сети имеет следующий вид:[103] The formula for calculating each of the hidden states of a bidirectional RNN network is as follows:

[104]

Figure 00000009
[104]
Figure 00000009

[105] где i=1, 2, …, n, f - нелинейная функция, например, сигмоидная функция или сеть с долговременной и кратковременной памятью (Long Short-Term Memory, LSTM), W и U - параметры обучения двунаправленной RNN-сети,

Figure 00000010
представляет вектор слов, составленный из слов хi, hi-1 представляет (i-1)-e скрытое состояние, используемое для представления семантической информации слова х, а hi. представляет i-e скрытое состояние, используемое для представления семантической информации слова[105] where i=1, 2, …, n, f is a non-linear function, for example, a sigmoid function or a network with long and short-term memory (Long Short-Term Memory, LSTM), W and U are the training parameters of a bidirectional RNN network ,
Figure 00000010
represents a word vector composed of words x i , h i-1 represents the (i-1)-e hidden state used to represent the semantic information of word x, and h i . represents an ie hidden state used to represent the semantic information of a word

[106] Двунаправленная RNN-сеть включает прямую RNN-сеть и обратную RNN-сеть. Прямая RNN-сеть формирует прямую скрытую последовательность

Figure 00000011
после чтения по порядку вектора слов, составленного из слов текста X, подлежащего переводу, где
Figure 00000012
представляет информацию текста X, подлежащего переводу, в прямом порядке; обратная RNN-сеть формирует обратную скрытую последовательность
Figure 00000013
после чтения в обратном порядке вектора слов, составленного из слов текста X, подлежащего переводу, где
Figure 00000014
представляет информацию текста, подлежащего переводу, в обратном порядке.[106] A bidirectional RNN network includes a forward RNN network and a reverse RNN network. Forward RNN Network Forms Direct Hidden Sequence
Figure 00000011
after reading in order a vector of words composed of the words of the text X to be translated, where
Figure 00000012
presents the information of the text X to be translated in direct order; reverse RNN-network forms reverse hidden sequence
Figure 00000013
after reading in reverse order a vector of words composed of the words of the text X to be translated, where
Figure 00000014
represents the information of the text to be translated in reverse order.

[107] Блоки скрытых состояний, позиции которых в прямой скрытой последовательности

Figure 00000015
и обратной скрытой последовательности
Figure 00000016
соответствуют друг другу, соединяют вместе и получают последовательность состояний, соответствующую слову в этой позиции. Другими словами, последовательности состояний, соответствующие словам в {х12,…,хn}, имеют следующий вид: последовательностью состояний, соответствующей х1, является
Figure 00000017
последовательностью состояний, соответствующей х2, является
Figure 00000018
а последовательностью состояний, соответствующей хn, является
Figure 00000019
Соответственно, семантическая информация текста X, подлежащего переводу, может быть представлена как Н={h1, h2, …, hn}, где Н - начальный результат кодирования, полученный кодированием текста, подлежащего переводу.[107] Blocks of hidden states whose positions are in direct hidden sequence
Figure 00000015
and reverse hidden sequence
Figure 00000016
match each other, connect together and get the sequence of states corresponding to the word in this position. In other words, the state sequences corresponding to the words in {x 1 ,x 2 ,…,x n } are as follows: the state sequence corresponding to x 1 is
Figure 00000017
the sequence of states corresponding to x 2 is
Figure 00000018
and the sequence of states corresponding to x n is
Figure 00000019
Accordingly, the semantic information of the text X to be translated can be represented as H={h 1 , h 2 , …, h n }, where H is the initial encoding result obtained by encoding the text to be translated.

[108] Кроме того, в одной из реализаций, после кодирования слов текста, подлежащего переводу, способ может также включать получение суммарного результата, соответствующего тексту, подлежащему переводу, путем сложения вместе результатов кодирования слов текста, подлежащего переводу. В такой реализации после получения результата Н кодирования суммарный результат

Figure 00000020
, полученный путем сложения вместе последовательностей состояний в Н, может быть определен в качестве нового начального результата кодирования, для представления семантической информации текста X, подлежащего переводу,[108] In addition, in one implementation, after encoding the words of the text to be translated, the method may also include obtaining a total result corresponding to the text to be translated by adding together the results of encoding the words of the text to be translated. In such an implementation, after obtaining the result H of coding, the total result
Figure 00000020
, obtained by adding together the sequences of states in H, can be defined as a new initial encoding result, to represent the semantic information of the text X to be translated,

[109] где

Figure 00000021
[109] where
Figure 00000021

[110] На шаге S402 получают релевантный результат кодирования путем кодирования релевантного текста, при этом релевантный результат кодирования представляет семантическую информацию релевантного текста.[110] In step S402, a relevant encoding result is obtained by encoding the relevant text, wherein the relevant encoding result represents the semantic information of the relevant text.

[111] В одной из реализаций шаг S402 может включать, в частности, получение релевантного результата кодирования путем кодирования релевантного текста с помощью двунаправленной RNN-сети.[111] In one implementation, step S402 may include, in particular, obtaining a relevant encoding result by encoding the relevant text using a bidirectional RNN.

[112] На шаге S402 или в конкретных реализациях шага S402 при кодировании релевантного текста, в частности, могут кодироваться слова каждой единицы текста в релевантном тексте для получения результатов кодирования, отвечающих соответствующим единицам текста, причем упомянутые результаты кодирования определяют в качестве релевантного результата кодирования.[112] In step S402 or specific implementations of step S402, when encoding relevant text, in particular, the words of each text unit in the relevant text may be encoded to obtain encoding results corresponding to the corresponding text units, said encoding results being determined as the relevant encoding result.

[113] Более конкретно, как показано на фиг. 3, когда релевантный текст включает предшествующий исходный текст, то есть релевантный текст содержит K предложений Х-1…Х-k перед текстом X, подлежащим переводу, Х-1…Х-k могут кодироваться аналогично кодированию текста X, подлежащего переводу, на шаге S401, где нужно только заменить текст X, подлежащий переводу, на Х-1…Х-k по отдельности, так что семантическая информация предложения Х-1 представлена как

Figure 00000022
…, семантическая информация предложения Х-k представлена как
Figure 00000023
а H-1, …, Н-k представляет собой результат кодирования, полученный кодированием предшествующего исходного текста, где в
Figure 00000024
Figure 00000025
Figure 00000026
…,
Figure 00000027
а в
Figure 00000028
Figure 00000029
Figure 00000030
…,
Figure 00000031
[113] More specifically, as shown in FIG. 3, when the relevant text includes the preceding source text, that is, the relevant text contains K sentences X -1 ... X -k before the text X to be translated, X -1 ... X -k can be encoded similarly to the encoding of the text X to be translated in step S401, where it is only necessary to replace the text X to be translated with X -1 ... X -k separately, so that the semantic information of the sentence X -1 is represented as
Figure 00000022
…, the semantic information of the sentence X -k is presented as
Figure 00000023
and H -1 , ..., H -k is the encoding result obtained by encoding the previous source text, where in
Figure 00000024
Figure 00000025
Figure 00000026
…,
Figure 00000027
and in
Figure 00000028
Figure 00000029
Figure 00000030
…,
Figure 00000031

[114] Когда релевантный текст включает последующий исходный текст, то есть релевантный текст содержит K предложений Х1…Хk после текста X, подлежащего переводу, Х1…Хk могут кодироваться аналогично кодированию текста X, подлежащего переводу, на шаге S401, где нужно только заменить текст X, подлежащий переводу, на Х1…Хk по отдельности, так что семантическая информация предложения Х1 представлена как

Figure 00000032
семантическая информация предложения Хk представлена как
Figure 00000033
а Н1, …, Нk представляет собой результат кодирования, полученный кодированием последующего исходного текста, где в
Figure 00000034
…,
Figure 00000035
Figure 00000036
…,
Figure 00000037
[114] When the relevant text includes subsequent source text, that is, the relevant text contains K sentences X 1 ...X k after the text X to be translated, X 1 ...X k may be encoded similarly to the encoding of the text X to be translated in step S401, where it is only necessary to replace the text X to be translated with X 1 ... X k separately, so that the semantic information of the sentence X 1 is represented as
Figure 00000032
the semantic information of the sentence Х k is presented as
Figure 00000033
and H 1 , ..., H k is the encoding result obtained by encoding the subsequent source text, where in
Figure 00000034
…,
Figure 00000035
Figure 00000036
…,
Figure 00000037

[115] Когда релевантный текст включает предшествующий целевой текст, то есть релевантный текст содержит текст перевода Y1…Y-k для K предложений Х-1…Х-k перед текстом X, подлежащим переводу, Y1…Y-k могут кодироваться аналогично кодированию текста X, подлежащего переводу, на шаге S401, где нужно только заменить текст X, подлежащий переводу, на Y-1…Y-k по отдельности, так что семантическая информация предложения Y-1 представлена как

Figure 00000038
семантическая информация предложения Y-k представлена как
Figure 00000039
а
Figure 00000040
представляет собой результат кодирования, полученный кодированием предшествующего целевого текста, где в
Figure 00000041
Figure 00000042
…,
Figure 00000043
а в
Figure 00000044
Figure 00000045
Figure 00000046
…,
Figure 00000047
[115] When the relevant text includes the preceding target text, i.e. the relevant text contains the translation text Y 1 ...Y -k for K sentences X -1 ...X -k before the text X to be translated, Y 1 ...Y -k may be encoded similarly encoding the text X to be translated in step S401, where it is only necessary to replace the text X to be translated with Y -1 ... Y -k separately, so that the semantic information of the sentence Y -1 is represented as
Figure 00000038
the semantic information of the sentence Y -k is represented as
Figure 00000039
a
Figure 00000040
is the encoding result obtained by encoding the preceding target text, where in
Figure 00000041
Figure 00000042
…,
Figure 00000043
and in
Figure 00000044
Figure 00000045
Figure 00000046
…,
Figure 00000047

[116] Кроме того, в одной из реализаций, после кодирования слов каждой единицы текста в релевантном тексте способ может также включать шаги А1-С1.[116] In addition, in one implementation, after encoding the words of each unit of text in the relevant text, the method may also include steps A1-C1.

[117] На шаге А1, в случае, когда релевантный текст включает предшествующий исходный текст, складывают вместе результаты кодирования слов каждой единицы текста в предшествующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста.[117] In step A1, in the case where the relevant text includes the previous source text, the word encoding results of each text unit in the previous source text are added together to obtain a total result corresponding to each text unit.

[118] После получения результатов H-1, …, Н-k кодирования для предшествующего исходного текста, суммарный результат

Figure 00000048
для всех последовательностей состояний в Н-1 может использоваться для представления семантической информации предложения Х-1, суммарный результат
Figure 00000049
для всех последовательностей состояний в Н-k может использоваться для представления семантической информации предложения Х-k, а
Figure 00000050
…,
Figure 00000051
совместно определяют в качестве результата кодирования предшествующего исходного текста,[118] After obtaining the results of H -1 , ..., H -k encoding for the previous source text, the total result
Figure 00000048
for all sequences of states in H -1 can be used to represent the semantic information of the sentence X -1 , the total result
Figure 00000049
for all state sequences in H -k can be used to represent the semantic information of the sentence X -k , and
Figure 00000050
…,
Figure 00000051
jointly defined as the result of encoding the previous source text,

[119] где

Figure 00000052
[119] where
Figure 00000052

[120] …;[120] ...;

[121]

Figure 00000053
[121]
Figure 00000053

[122] На шаге В1, в случае, когда релевантный текст включает последующий исходный текст, складывают вместе результаты кодирования слов каждой единицы текста в последующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста.[122] In step B1, in the case where the relevant text includes subsequent source text, the word encoding results of each text unit in the subsequent source text are added together to obtain a total result corresponding to each text unit.

[123] После получения результатов Н1, …, Нk кодирования последующего исходного текста, суммарный результат

Figure 00000054
для всех последовательностей состояний в Н1 может использоваться для представления семантической информации предложения Х1, суммарный результат
Figure 00000055
для всех последовательностей состояний в Нk может использоваться для представления семантической информации предложения Хk, а
Figure 00000056
, …,
Figure 00000057
совместно определяют в качестве результата кодирования последующего исходного текста,[123] After obtaining the results H 1 , ..., H k encoding the subsequent source text, the total result
Figure 00000054
for all sequences of states in H 1 can be used to represent the semantic information of the sentence X 1 , the total result
Figure 00000055
for all sequences of states in H k can be used to represent the semantic information of the sentence X k , and
Figure 00000056
, …,
Figure 00000057
jointly determined as the result of encoding the subsequent source text,

[124] где

Figure 00000058
[124] where
Figure 00000058

[125] …;[125] ...;

[126]

Figure 00000059
[126]
Figure 00000059

[127] На шаге С1, в случае, когда релевантный текст включает предшествующий целевой текст, результаты кодирования слов каждой единицы текста в предшествующем целевом тексте складывают вместе для получения суммарного результата, соответствующего каждой единице текста.[127] In step C1, in the case where the relevant text includes the previous target text, the word encoding results of each text unit in the previous target text are added together to obtain a total result corresponding to each text unit.

[128] После получения результатов

Figure 00000060
кодирования предшествующего исходного текста, суммарный результат
Figure 00000061
для всех последовательностей состояний в
Figure 00000062
может использоваться для представления семантической информации предложения Y-1, суммарный результат
Figure 00000063
для всех последовательностей состояний в
Figure 00000064
может использоваться для представления семантической информации предложения
Figure 00000065
а
Figure 00000066
,…,
Figure 00000067
совместно определяют в качестве результата кодирования предшествующего целевого текста,[128] After receiving the results
Figure 00000060
encoding of the previous source text, the total result
Figure 00000061
for all state sequences in
Figure 00000062
can be used to represent the semantic information of the sentence Y -1 , the total result
Figure 00000063
for all state sequences in
Figure 00000064
can be used to represent the semantic information of a sentence
Figure 00000065
a
Figure 00000066
,…,
Figure 00000067
jointly determined as the encoding result of the preceding target text,

[129] где

Figure 00000068
[129] where
Figure 00000068

[130] …;[130] ...;

[131]

Figure 00000069
[131]
Figure 00000069

[132] Следует отметить, что в данном варианте осуществления настоящего изобретения порядок выполнения описанных выше шагов S401 и S402 не ограничен. Шаги S401 и S402 могут выполняться одновременно, шаг S401 может выполняться перед выполнением шага S402, или шаг S402 может выполняться перед выполнением шага S401.[132] It should be noted that in this embodiment of the present invention, the order of performing the steps S401 and S402 described above is not limited. Steps S401 and S402 may be performed simultaneously, step S401 may be performed before the execution of step S402, or step S402 may be performed before the execution of step S401.

[133] На шаге S403 получают целевой результат кодирования путем обработки начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования, при этом целевой результат кодирования представляет семантическую информацию текста, подлежащего переводу, и переносит всю семантическую информацию релевантного текста или ее часть.[133] In step S403, the target encoding result is obtained by processing the initial encoding result using all or part of the encoding results in the relevant encoding result, wherein the target encoding result represents the semantic information of the text to be translated, and carries all or part of the semantic information of the relevant text .

[134] В данном варианте осуществления настоящего изобретения один или более из следующих результатов кодирования: результат Н-1, …, Н-k кодирования предшествующего исходного текста, результат Н1, …, Нk кодирования последующего исходного текста и результат

Figure 00000070
кодирования предшествующего целевого текста, могут использоваться для обработки начального результата Н кодирования текста, подлежащего переводу, при этом обработанный результат кодирования определяют в качестве целевого результата кодирования.[134] In this embodiment of the present invention, one or more of the following encoding results: the encoding result H -1 , ..., H -k of the preceding source text encoding, the encoding result H 1 , ..., H k of the subsequent source text, and the result
Figure 00000070
encoding of the previous target text may be used to process the initial encoding result H of the text to be translated, wherein the processed encoding result is determined as the target encoding result.

[135] Альтернативно, один или более из следующих результатов кодирования: результат

Figure 00000071
кодирования предшествующего исходного текста, результат
Figure 00000072
Figure 00000073
кодирования последующего исходного текста и результат
Figure 00000074
кодирования предшествующего целевого текста, могут использоваться для обработки начального результата Н кодирования текста, подлежащего переводу, причем обработанный результат кодирования определяют в качестве целевого результата Нс кодирования.[135] Alternatively, one or more of the following encoding results: result
Figure 00000071
encoding of the previous source text, the result
Figure 00000072
Figure 00000073
encoding the subsequent source text and the result
Figure 00000074
encoding of the preceding target text may be used to process the initial encoding result H of the text to be translated, wherein the processed encoding result is determined as the target encoding result Hc.

[136] Следует отметить, что при обработке начального результата кодирования семантическая информация единиц текста в релевантном тексте может выбираться по различным значениям степени, соответствующим степени корреляции между текстом, подлежащим переводу, и релевантным текстом, так что целевой результат кодирования может переносить информацию с различными степенями и представлять семантическую информацию Нс текста, подлежащего переводу.[136] It should be noted that, when processing the initial encoding result, the semantic information of text units in the relevant text may be selected by different degree values corresponding to the degree of correlation between the text to be translated and the relevant text, so that the target encoding result may carry information with different degrees. and present semantic information H from the text to be translated.

[137] Отметим, что за описанием конкретной реализации шага S403 можно обратиться к третьему варианту осуществления настоящего изобретения.[137] Note that for a description of the specific implementation of step S403, refer to the third embodiment of the present invention.

[138] На шаге S404 текст, подлежащий переводу, переводят путем декодирования целевого результата кодирования.[138] In step S404, the text to be translated is translated by decoding the target encoding result.

[139] При декодировании целевого результата Нс кодирования, для получения результата перевода текста, подлежащего переводу, могут применяться известные методы декодирования, например, с помощью модели внимания (см. фиг. 3) или предложенные в будущем методы декодирования.[139] When decoding the target result H with encoding, known decoding methods, for example, using the attention model (see Fig. 3) or future decoding methods proposed in the future, can be used to obtain the translation result of the text to be translated.

[140] Отметим также, что за описанием конкретной реализации шага S404 можно обратиться к четвертому варианту осуществления настоящего изобретения.[140] Note also that for a description of the specific implementation of step S404, you can refer to the fourth embodiment of the present invention.

[141] Таким образом, в данном варианте осуществления настоящего изобретения применяют модель кодирования-декодирования для кодирования и декодирования текста, подлежащего переводу, а также релевантного текста. Когда текст, подлежащий переводу, переводят с помощью способа кодирования и декодирования, учитывается не только текущий контекст текста, подлежащего переводу, но также и релевантный текст для текста, подлежащего переводу. Таким образом, может быть повышена точность результата перевода текста, подлежащего переводу, и соответственно улучшено пользовательское восприятие.[141] Thus, in this embodiment of the present invention, an encoding-decoding model is used to encode and decode the text to be translated as well as the relevant text. When the text to be translated is translated using the encoding and decoding method, not only the current context of the text to be translated, but also the relevant text for the text to be translated is taken into account. Thus, the accuracy of the translation result of the text to be translated can be improved and the user experience improved accordingly.

[142] Третий вариант осуществления изобретения[142] Third Embodiment

[143] Данный вариант осуществления настоящего изобретения включает конкретную реализацию шага S403, упомянутого во втором варианте осуществления настоящего изобретения.[143] This embodiment of the present invention includes a specific implementation of step S403 mentioned in the second embodiment of the present invention.

[144] На фиг. 5 показана блок-схема выполнения обработки начального результата кодирования. «Обработка начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования» на упомянутом выше шаге S403 также включает шаги S501-S503, описанные ниже.[144] FIG. 5 is a flowchart showing the processing of the initial encoding result. "Processing the initial encoding result using all or part of the encoding results in the relevant encoding result" in the above-mentioned step S403 also includes steps S501-S503 described below.

[145] На шаге S501, в случае, когда релевантный текст включает предшествующий исходный текст, результат кодирования предшествующего исходного текста определяют из релевантного результата кодирования.[145] In step S501, in the case where the relevant text includes the previous source text, the encoding result of the previous source text is determined from the relevant encoding result.

[146] В данном варианте осуществления настоящего изобретения результатом[146] In this embodiment of the present invention, the result

кодирования предшествующего исходного текста может быть Н-1, …, Н-k или

Figure 00000075
в соответствии со вторым вариантом осуществления изобретения.encoding of the preceding source text can be H -1 , ..., H -k or
Figure 00000075
according to the second embodiment of the invention.

[147] На шаге S502, в случае, когда релевантный текст включает последующий исходный текст, результат кодирования последующего исходного текста определяют из релевантного результата кодирования.[147] In step S502, in the case where the relevant text includes the subsequent source text, the encoding result of the subsequent source text is determined from the relevant encoding result.

[148] В данном варианте осуществления настоящего изобретения, если результатом кодирования предшествующего исходного текста является Н-1, …, Н-k, результатом кодирования последующего исходного текста может являться Н1, …, Нk в соответствии со вторым вариантом осуществления изобретения; аналогично, если результатом кодирования предшествующего исходного текста является

Figure 00000076
результатом кодирования последующего исходного текста может являться
Figure 00000077
в соответствии со вторым вариантом осуществления изобретения.[148] In this embodiment of the present invention, if the encoding result of the preceding source text is H -1 , ..., H -k , the encoding result of the subsequent source text may be H 1 , ..., H k in accordance with the second embodiment of the invention; similarly, if the result of encoding the preceding source text is
Figure 00000076
the result of encoding the subsequent source text may be
Figure 00000077
according to the second embodiment of the invention.

[149] На шаге S503 выполняют обработку начального результата кодирования в соответствии с определенным результатом кодирования.[149] In step S503, processing of the initial encoding result is performed in accordance with the determined encoding result.

[150] В одной из реализаций шаг S503 может включать, в частности, шаги А2-С2, описанные ниже.[150] In one implementation, step S503 may include, in particular, steps A2-C2, described below.

[151] На шаге А2, в случае, когда релевантный текст включает предшествующий исходный текст, определяют степень корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования предшествующего исходного текста.[151] In step A2, in the case where the relevant text includes the previous source text, the degree of correlation between the text to be translated and the previous source text is determined according to the initial encoding result of the text to be translated and the encoding result of the previous source text.

[152] Степень релевантности между текстом, подлежащим переводу, и каждым предложением в предшествующем исходном тексте (далее называемым предшествующим предложением) является неопределенной, и, если текст, подлежащий переводу, совсем не связан с предшествующим предложением, предшествующее предложение будет избыточной информацией. Если текст, подлежащий переводу, переводят со ссылкой на предшествующее предложение, то это негативно скажется на точности результата перевода текста, подлежащего переводу, то есть точность результата перевода будет низкой. Поэтому для более рационального использования результата кодирования предшествующего исходного текста, в данном варианте осуществления настоящего изобретения определяют степень корреляции между текстом, подлежащим переводу, и каждым из предшествующих предложений по отдельности, так что семантическая информация, соответствующая предшествующему предложению, может применяться динамически с использованием результата определения степени корреляции, чтобы избежать избыточности информации, вызванной предшествующим предложением.[152] The degree of relevance between the text to be translated and each sentence in the preceding source text (hereinafter referred to as the preceding sentence) is uncertain, and if the text to be translated is not at all related to the preceding sentence, the preceding sentence will be redundant information. If the text to be translated is translated with reference to the preceding sentence, this will adversely affect the accuracy of the translation result of the text to be translated, that is, the accuracy of the translation result will be low. Therefore, in order to make more rational use of the encoding result of the previous source text, in this embodiment of the present invention, the degree of correlation between the text to be translated and each of the previous sentences is determined separately, so that the semantic information corresponding to the previous sentence can be applied dynamically using the determination result degree of correlation in order to avoid redundancy of information caused by the preceding sentence.

[153] На этом шаге начальным результатом кодирования текста, подлежащего переводу, может быть

Figure 00000078
а результатами кодирования предшествующих предложений предшествующего исходного текста могут быть, соответственно,
Figure 00000079
Может использоваться шлюзовая сеть (Gate Network) со структурой нейронной сети для формирования коэффициента корреляции, соответствующего каждому предшествующему предложению, причем коэффициент корреляции представляет степень корреляции между текстом, подлежащим переводу, и соответствующим предшествующим предложением.[153] At this step, the initial encoding result of the text to be translated may be
Figure 00000078
and the encoding results of previous sentences of the previous source text can be, respectively,
Figure 00000079
A Gate Network with a neural network structure may be used to generate a correlation coefficient corresponding to each preceding sentence, the correlation coefficient representing the degree of correlation between the text to be translated and the corresponding preceding sentence.

[154] На фиг. 6 показана сетевая структурная схема шлюзовой сети. В конкретных реализациях начальный результат

Figure 00000080
кодирования текста, подлежащего переводу, и результаты
Figure 00000081
кодирования, отвечающие соответствующим предшествующим предложениям, используют в качестве входных данных для шлюзовой сети. Затем шлюзовая сеть вычисляет коэффициент корреляции, соответствующий каждому из предшествующих предложений, согласно следующей формуле: [154] FIG. 6 shows a network block diagram of a gateway network. In specific implementations, the initial result
Figure 00000080
encoding of the text to be translated and the results
Figure 00000081
encodings corresponding to the respective previous proposals are used as input to the gateway network. The gateway network then calculates the correlation coefficient corresponding to each of the preceding sentences according to the following formula:

[155]

Figure 00000082
[155]
Figure 00000082

[156] где i=1, 2 … k;

Figure 00000083
- начальный результат кодирования текста, подлежащего переводу;
Figure 00000084
- результат кодирования i-го предложения, предшествующего тексту, подлежащему переводу; λ-i - коэффициент корреляции i-го предложения, предшествующего тексту, подлежащему переводу, который представляет степень корреляции между текстом, подлежащим переводу, и i-м предложением, предшествующим тексту, подлежащему переводу; U и V - параметры обучения шлюзовой сети, которые получают путем обучения на большом объеме заранее собранных данных, при этом каждый из них имеет размер d×1.[156] where i=1, 2 … k;
Figure 00000083
- the initial result of encoding the text to be translated;
Figure 00000084
- the result of encoding the i-th sentence preceding the text to be translated; λ -i - correlation coefficient of the i-th sentence preceding the text to be translated, which represents the degree of correlation between the text to be translated and the i-th sentence preceding the text to be translated; U and V are the training parameters of the gateway network, which are obtained by training on a large amount of pre-collected data, each of which has a size of d×1.

[157] Следует отметить, что

Figure 00000085
и
Figure 00000086
представляют собой матрицы размера 1×d, где d - количество скрытых узлов в процедуре кодирования посредством двунаправленной RNN-сети, которое заранее сконфигурировано. Таким образом, скалярная величина размерностью 1 может быть получена умножением матриц, указанных в формуле (2), а затем преобразована с помощью нелинейной функции, то есть сигмоидной функции, с получением скалярного значения λ-i, лежащего в диапазоне от 0 до 1. Чем больше значение λ-1, тем выше степень корреляции между текстом, подлежащим переводу, и i-м предложением, предшествующим тексту, подлежащему переводу, и наоборот.[157] It should be noted that
Figure 00000085
and
Figure 00000086
are 1×d matrices, where d is the number of hidden nodes in the bidirectional RNN coding procedure, which is preconfigured. Thus, a scalar value of dimension 1 can be obtained by multiplying the matrices indicated in formula (2), and then transformed using a non-linear function, that is, a sigmoid function, to obtain a scalar value λ -i ranging from 0 to 1. Than the greater the value of λ -1 , the higher the degree of correlation between the text to be translated and the i-th sentence preceding the text to be translated, and vice versa.

[158] Как можно видеть, коэффициенты {Х-k-k-1,…,Х-1) корреляции, отвечающие соответствующим предшествующим предложениям в предшествующем исходном тексте, могут быть вычислены с помощью формулы (2).[158] As can be seen, the correlation coefficients {X -k ,X -k-1 ,...,X -1 ) corresponding to the corresponding preceding sentences in the preceding source text can be calculated using formula (2).

[159] На шаге В2, в случае, когда релевантный текст включает последующий исходный текст, определяют степень корреляции между текстом, подлежащим переводу, и последующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования последующего исходного текста.[159] In step B2, in the case where the relevant text includes the subsequent source text, the degree of correlation between the text to be translated and the subsequent source text is determined according to the initial encoding result of the text to be translated and the encoding result of the subsequent source text.

[160] Релевантность между текстом, подлежащим переводу, и каждым предложением в последующем исходном тексте (далее называемым последующим предложением) является неопределенной, и, если текст, подлежащий переводу, совсем не связан с последующим предложением, последующее предложение будет избыточно в отношении текста, подлежащего переводу. Если текст, подлежащий переводу, переводят со ссылкой на последующее предложение, то это негативно скажется на точности результата перевода, то есть точность результата перевода будет низкой. Поэтому для более рационального использования результата кодирования последующего исходного текста, в данном варианте осуществления настоящего изобретения определяют степень корреляции между текстом, подлежащим переводу, и каждым последующим предложением по отдельности, так что семантическая информация, соответствующая последующему предложению, может применяться динамически с использованием результата определения степени корреляции, чтобы избежать избыточности информации, вызванной последующим предложением.[160] The relevance between the text to be translated and each sentence in the subsequent source text (hereinafter referred to as the subsequent sentence) is uncertain, and if the text to be translated is not at all related to the subsequent sentence, the subsequent sentence will be redundant with respect to the text to be translated. translation. If the text to be translated is translated with reference to a subsequent sentence, this will negatively affect the accuracy of the translation result, that is, the accuracy of the translation result will be low. Therefore, in order to make more rational use of the encoding result of the subsequent source text, in this embodiment of the present invention, the degree of correlation between the text to be translated and each subsequent sentence individually is determined, so that the semantic information corresponding to the subsequent sentence can be applied dynamically using the result of determining the degree correlations to avoid information redundancy caused by the subsequent sentence.

[161] На этом шаге начальным результатом кодирования текста, подлежащего переводу, может быть

Figure 00000087
, а результатами кодирования предшествующего предложения предшествующего исходного текста могут быть, соответственно,
Figure 00000088
Может использоваться шлюзовая сеть (Gate Network) со структурой нейронной сети для формирования коэффициента корреляции, соответствующего каждому предшествующему предложению, причем коэффициент корреляции представляет степень корреляции между текстом, подлежащим переводу, и соответствующим предшествующим предложением.[161] At this step, the initial encoding result of the text to be translated may be
Figure 00000087
, and the results of encoding the previous sentence of the previous source text can be, respectively,
Figure 00000088
A Gate Network with a neural network structure may be used to generate a correlation coefficient corresponding to each preceding sentence, the correlation coefficient representing the degree of correlation between the text to be translated and the corresponding preceding sentence.

[162] На фиг. 6 показана сетевая структурная схема шлюзовой сети. В конкретных реализациях начальный результат

Figure 00000089
кодирования текста, подлежащего переводу, и результаты
Figure 00000090
кодирования, отвечающие соответствующим последующим предложениям, используют в качестве входных данных для шлюзовой сети. Затем шлюзовая сеть вычисляет коэффициент корреляции, соответствующий каждому из последующих предложений, согласно следующей формуле:[162] FIG. 6 shows a network block diagram of a gateway network. In specific implementations, the initial result
Figure 00000089
encoding of the text to be translated and the results
Figure 00000090
the encodings corresponding to the respective subsequent sentences are used as input to the gateway network. The gateway network then calculates the correlation coefficient corresponding to each of the following sentences according to the following formula:

[163]

Figure 00000091
[163]
Figure 00000091

[164] где i=1,2…k;

Figure 00000092
- начальный результат кодирования текста, подлежащего переводу;
Figure 00000093
- результат кодирования i-го предложения, следующего за текстом, подлежащим переводу; λi - коэффициент корреляции i-го предложения, следующего за текстом, подлежащим переводу, который представляет степень корреляции между текстом, подлежащим переводу и i-м предложением, следующим за текстом, подлежащим переводу; U и V - параметры обучения шлюзовой сети, которые получены путем обучения на большом объеме заранее собранных данных, при этом каждый из них имеет размер d×1.[164] where i=1,2…k;
Figure 00000092
- the initial result of encoding the text to be translated;
Figure 00000093
- the result of encoding the i-th sentence following the text to be translated; λ i - correlation coefficient of the i-th sentence following the text to be translated, which represents the degree of correlation between the text to be translated and the i-th sentence following the text to be translated; U and V are the training parameters of the gateway network, which are obtained by training on a large amount of pre-collected data, each of which has a size of d×1.

[165] Следует отметить, что

Figure 00000094
и
Figure 00000095
представляют собой матрицы размера 1×d, где d - количество скрытых узлов в процедуре кодирования посредством двунаправленной RNN-сети, которое сконфигурировано заранее. Таким образом, скалярная величина размерностью 1 может быть получена умножением матриц, указанных в формуле (3), а затем преобразована с помощью нелинейной функции, то есть сигмоидной функции, для получения скалярного значения λi, лежащего в диапазоне от 0 до 1. Чем больше значение λi, тем выше степень корреляции между текстом, подлежащим переводу, и i-м предложением, следующим за текстом, подлежащим переводу, и наоборот.[165] It should be noted that
Figure 00000094
and
Figure 00000095
are 1×d matrices, where d is the number of hidden nodes in the bidirectional RNN coding procedure, which is preconfigured. Thus, a scalar value of dimension 1 can be obtained by multiplying the matrices indicated in formula (3), and then transformed using a non-linear function, that is, a sigmoid function, to obtain a scalar value λ i ranging from 0 to 1. The more value λ i , the higher the degree of correlation between the text to be translated and the i-th sentence following the text to be translated, and vice versa.

[166] Как можно видеть, коэффициенты {Х12,…,Хk} корреляции для соответствующих последующих предложений в последующем исходном тексте могут быть вычислены с помощью формулы (3).[166] As can be seen, the correlation coefficients {X 1 ,X 2 ,...,X k } for the respective subsequent sentences in the following source text can be calculated using formula (3).

[167] На шаге С2 выполняют обработку начального результата кодирования в соответствии с определенным результатом кодирования и определенной степенью корреляции.[167] In step C2, an initial encoding result is processed according to the determined encoding result and the determined degree of correlation.

[168] После вычисления коэффициентов {Х-k-k-1,…,Х-1} корреляции, отвечающих соответствующим предшествующим предложениям предшествующего исходного текста, предшествующие предложения могут выбираться динамически в соответствии с их коэффициентами корреляции; аналогично, после вычисления коэффициентов {Х12,…,Хk} корреляции, отвечающих соответствующим последующим предложениям последующего исходного текста, последующие предложения могут выбираться динамически на основе этих коэффициентов корреляции. Эта процедура описана более подробно ниже.[168] After calculating the coefficients {X -k ,X -k-1 ,...,X -1 } of the correlation corresponding to the respective previous sentences of the previous source text, the previous sentences can be dynamically selected in accordance with their correlation coefficients; likewise, after computing the correlation coefficients {X 1 ,X 2 ,...,X k } corresponding to the respective subsequent sentences of the subsequent source text, subsequent sentences may be dynamically selected based on these correlation coefficients. This procedure is described in more detail below.

[169] На основе начального результата кодирования Н={h1,h2,…,hn} текста, подлежащего переводу, который получают на шаге S401 во втором варианте осуществления настоящего изобретения, для соответствующего hi(i=1,2…n) каждого слова в тексте, подлежащем переводу, может быть введена контекстная информация в соответствии со следующей формулой:[169] Based on the initial encoding result H={h 1 ,h 2 ,...,h n } of the text to be translated, which is obtained in step S401 in the second embodiment of the present invention, for the corresponding h i (i=1.2... n) for each word in the text to be translated, contextual information can be entered according to the following formula:

[170]

Figure 00000096
[170]
Figure 00000096

[171] где {Х-k-k-1,…,Х-1} - коэффициенты корреляции, отвечающие соответствующим предшествующим предложениям и полученные с помощью шлюзовой сети, {Х12,…,Хk} - коэффициенты корреляции, отвечающие соответствующим последующим предложениям и полученные с помощью шлюзовой сети,

Figure 00000097
- результаты кодирования соответствующих предшествующих предложений, и
Figure 00000098
Figure 00000099
- результаты кодирования соответствующих последующих предложений.[171] where {X -k ,X -k-1 ,…,X -1 } are the correlation coefficients corresponding to the respective previous proposals and obtained using the gateway network, {X 1 ,X 2 ,…,X k } are the coefficients correlations corresponding to the corresponding subsequent sentences and obtained using the gateway network,
Figure 00000097
- the encoding results of the corresponding preceding sentences, and
Figure 00000098
Figure 00000099
- the coding results of the corresponding subsequent sentences.

[172] Очевидно, что при помощи формулы (3) контекстная информация может вводиться по отдельности для каждого слова в тексте, подлежащем переводу.[172] Obviously, using the formula (3) context information can be entered separately for each word in the text to be translated.

Посредством описанного выше процесса кодирования семантическую информацию текста, подлежащего переводу, преобразуют в

Figure 00000100
то есть в выходные данные Нс подсистемы декодирования, как показано на фиг. 3.Through the encoding process described above, the semantic information of the text to be translated is converted into
Figure 00000100
that is, the output H from the decoding subsystem as shown in FIG. 3.

[173] Следует отметить, что Нс не только включает семантическую информацию[173] It should be noted that H c not only includes semantic information

текста, подлежащего переводу, но также учитывает {λ-k, λ-k-1, …, λ-1} и {λ1, λ2, …, λk} для динамического выбора используемой контекстной информации, что позволяет устранить избыточность информации, вызванную наложением информации, и повысить точность результата перевода.text to be translated, but also takes into account {λ -k , λ -k-1 , …, λ -1 } and {λ 1 , λ 2 , …, λ k } to dynamically select the contextual information used, which eliminates information redundancy caused by the overlay of information, and improve the accuracy of the translation result.

[174] Таким образом, способ кодирования, предлагаемый в данном варианте осуществления настоящего изобретения, позволяет ввести семантическую информацию в релевантный текст или ее часть, на кодирующем конце, а также ввести информацию о степенях корреляции между текстом, подлежащим переводу, и введенным релевантным текстом. Таким образом, обеспечивается динамический выбор контекстной информации для текста, подлежащего переводу, что не только уменьшает избыточную информацию в информации, принимаемой моделью кодирования-декодирования, но также позволяет повысить точность результата перевода текста, подлежащего переводу.[174] Thus, the encoding method proposed in this embodiment of the present invention allows you to enter semantic information in the relevant text or part thereof, at the encoding end, as well as enter information about the degrees of correlation between the text to be translated and the entered relevant text. Thus, dynamic selection of contextual information for the text to be translated is provided, which not only reduces redundant information in the information received by the encoding-decoding model, but also improves the accuracy of the translation result of the text to be translated.

[175] Четвертый вариант осуществления изобретения[175] Fourth Embodiment

[176] Данный вариант осуществления настоящего изобретения включает конкретную реализацию шага S404, упомянутого во втором варианте осуществления настоящего изобретения.[176] This embodiment of the present invention includes a specific implementation of step S404 mentioned in the second embodiment of the present invention.

[177] В данном варианте осуществления изобретения «перевод текста, подлежащего переводу, путем декодирования целевого результата кодирования» на описанном выше шаге S404 включает, в частности, декодирование, в случае, когда релевантный текст включает предшествующий целевой текст, целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования. Результат кодирования предшествующего целевого текста на шаге S402 во втором варианте осуществления настоящего изобретения может представлять собой

Figure 00000101
или
Figure 00000102
Эти результаты кодирования могут использоваться как вспомогательные при декодировании целевого результата Нс кодирования с получением перевода текста, подлежащего переводу.[177] In this embodiment, "translating the text to be translated by decoding the target encoding result" in the above step S404 includes specifically decoding, in the case where the relevant text includes the preceding target text, the target encoding result using the result encoding the preceding target text in the relevant encoding result. The encoding result of the preceding target text in step S402 in the second embodiment of the present invention may be
Figure 00000101
or
Figure 00000102
These encoding results can be used as an aid in decoding the target encoding result Hc to obtain a translation of the text to be translated.

[178] В одной из реализаций данного варианта осуществления изобретения декодирование целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования может включать описанные ниже шаги A3 и В3.[178] In one implementation of this embodiment, decoding the target encoding result using the encoding result of the previous target text in the relevant encoding result may include steps A3 and B3 described below.

[179] На шаге A3 определяют степень корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом.[179] In step A3, the degree of correlation between the text to be translated and the previous target text is determined.

[180] Предшествующий целевой текст включает результат перевода каждого предшествующего предложения в предшествующем исходном тексте (далее их будем называть переведенными предложениями). Степень корреляции между каждым переведенным предложением и текстом, подлежащим переводу, может определяться по отдельности.[180] The previous target text includes the result of the translation of each previous sentence in the previous source text (hereinafter referred to as translated sentences). The degree of correlation between each translated sentence and the text to be translated can be determined separately.

[181] В одной из реализаций шаг A3 может включать, в частности, определение степеней корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в качестве степеней корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом. В такой реализации степени корреляции между текстом, подлежащим переводу, и соответствующими переведенными предложениями предшествующего целевого текста могут быть представлены соответственно коэффициентами {λ-k, λ-k-1, …, λ-1} корреляции, отвечающими соответствующим предшествующим предложениям предшествующего исходного текста и вычисленными на шаге А2 третьего варианта осуществления настоящего изобретения. Например, λ-k представляет корреляцию между текстом, подлежащим переводу, и k-м предложением перед текстом, подлежащим переводу.[181] In one implementation, step A3 may include, in particular, determining the degrees of correlation between the text to be translated and the previous source text as the degrees of correlation between the text to be translated and the previous target text. In such an implementation, the degrees of correlation between the text to be translated and the corresponding translated sentences of the preceding target text can be respectively represented by correlation coefficients {λ -k , λ -k-1 , …, λ -1 } corresponding to the corresponding previous sentences of the preceding source text and calculated in step A2 of the third embodiment of the present invention. For example, λ -k represents the correlation between the text to be translated and the kth sentence before the text to be translated.

[182] На шаге В3 выполняют декодирование целевого результата кодирования в соответствии с определенной степенью корреляции и результатом кодирования предшествующего целевого текста.[182] In step B3, the target encoding result is decoded according to the determined degree of correlation and the encoding result of the previous target text.

[183] На этом шаге вычисление с использованием коэффициентов {λ-k, λ-k-1, …, λ-1} корреляции и результатов

Figure 00000103
кодирования (со ссылкой на шаг С1 второго варианта осуществления изобретения) для предшествующего целевого текста выполняют согласно следующей формуле:[183] In this step, the calculation using the coefficients {λ -k , λ -k-1 , ..., λ -1 } of the correlation and results
Figure 00000103
encoding (with reference to step C1 of the second embodiment of the invention) for the previous target text is performed according to the following formula:

[184]

Figure 00000104
[184]
Figure 00000104

[185] Как показано на фиг. 3,

Figure 00000105
представляет результат кодирования предшествующего целевого текста, который используют при декодировании. Когда декодируют целевой результат Нс кодирования, выполняют последовательное декодирование посредством RNN-сети. В данной реализации в любой момент в процессе декодирования может добавляться
Figure 00000106
согласно следующей формуле:[185] As shown in FIG. 3,
Figure 00000105
represents the encoding result of the preceding target text, which is used in decoding. When the target encoding result Hc is decoded, serial decoding is performed by the RNN. In this implementation, at any time during the decoding process,
Figure 00000106
according to the following formula:

[186]

Figure 00000107
[186]
Figure 00000107

[187] где g - нелинейная функция, например сигмоидная функция или LSTM-сеть; W, U и V могут быть известными параметрами обучения декодирующей сети, а Р - новый введенный параметр обучения декодирующей сети в данном варианте осуществления настоящего изобретения; sj представляет скрытое состояние в текущий момент j времени; sj-1 представляет скрытое состояние в последний момент j-1 времени; уj-1 - вектор слов результата кодирования в последний момент времени, а сj - выходная информация модели внимания, которая может представлять собой сетевую структуру в общей структуре кодирования-декодирования с использованием тех же способов кодирования и вычисления, что и в известном уровне техники.[187] where g is a non-linear function, such as a sigmoid function or an LSTM network; W, U, and V may be known decoding network learning parameters, and P is a newly introduced decoding network learning parameter in this embodiment of the present invention; s j represents the hidden state at the current time j; s j-1 represents the hidden state at the last j-1 time; y j-1 is a word vector of the encoding result at the last time point, and c j is the output of the attention model, which can be a network structure in a common encoding-decoding structure using the same encoding and calculation methods as in the prior art .

[188] После получения, путем декодирования, скрытого состояния sj в текущий момент j времени оценивают распределение вероятностей для результатов перевода слова, переводимого в текущий момент j времени, при помощи функции soft max в общей структуре кодирования-декодирования. Результат перевода переводимого слова получают в соответствии с распределением вероятностей.[188] After obtaining, by decoding, the hidden state s j at the current time j, the probability distribution for the translation results of the word being translated at the current time j is estimated using the soft max function in the overall encoding-decoding structure. The translation result of the translated word is obtained in accordance with the probability distribution.

[189] Таким образом, способ декодирования в соответствии с данным вариантом осуществления настоящего изобретения подразумевает введение результата перевода предшествующего исходного текста, то есть предшествующего целевого текста, на декодирующем конце, а также введение информации о степенях корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом. Таким образом, результат перевода текста, подлежащего переводу, может быть связан с результатом перевода предшествующего текста, что не только позволяет повысить точность перевода текста, подлежащего переводу, но также улучшает плавность всего текста перевода в целом, то есть гарантируются связность и согласованность предложений переведенного текста на уровне дискурса.[189] Thus, the decoding method according to this embodiment of the present invention includes the input of the translation result of the previous source text, that is, the previous target text, at the decoding end, as well as the input of information about the degrees of correlation between the text to be translated and the previous target text. text. Thus, the result of the translation of the text to be translated can be related to the result of the translation of the previous text, which not only improves the accuracy of the translation of the text to be translated, but also improves the smoothness of the entire text of the translation as a whole, that is, the coherence and consistency of the sentences of the translated text are guaranteed. at the discourse level.

[190] Пятый вариант осуществления изобретения[190] Fifth Embodiment

[191] В данном варианте осуществления настоящего изобретения предлагается устройство для перевода текста на уровне дискурса, при этом за соответствующим описанием следует обращаться к рассмотренным выше вариантам осуществления способа.[191] In this embodiment, the present invention provides a device for translating text at the level of discourse, while for a corresponding description, you should refer to the above embodiments of the method.

[192] На фиг. 7 показана структурная схема устройства для перевода текста на уровне дискурса в соответствии с данным вариантом осуществления настоящего изобретения. Устройство 700 содержит:[192] FIG. 7 is a block diagram of a device for translating text at the discourse level in accordance with this embodiment of the present invention. Device 700 contains:

[193] блок 701 получения текста, подлежащего переводу, который сконфигурирован для получения текста, подлежащего переводу, при этом текст, подлежащий переводу, представляет собой единицу текста в тексте на уровне дискурса, подлежащем переводу;[193] a translatable text acquisition unit 701, which is configured to acquire a translatable text, wherein the translatable text is a unit of text in a discourse-level text to be translated;

[194] блок 702 получения релевантного текста, который сконфигурирован для получения релевантного текста для текста, подлежащего переводу, при этом релевантный текст включает по меньшей мере одно из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст, причем под предшествующим исходным текстом понимают по меньшей мере одну единицу текста перед текстом, подлежащим переводу, в тексте на уровне дискурса, под последующим исходным текстом понимают по меньшей мере одну единицу текста после текста, подлежащего переводу, в тексте на уровне дискурса, а под предшествующим целевым текстом понимают текст перевода упомянутого предшествующего исходного текста, и[194] a relevant text obtaining block 702, which is configured to obtain relevant text for the text to be translated, wherein the relevant text includes at least one of the following: the previous source text, the subsequent source text, or the previous target text, and under the previous source text means at least one unit of text before the text to be translated in the text at the discourse level, the subsequent source text is understood to mean at least one unit of text after the text to be translated in the text at the discourse level, and the preceding target text is the text of the target said prior source text, and

[195] блок 703 перевода текста, подлежащего переводу, который сконфигурирован для перевода текста, подлежащего переводу, в соответствии с релевантным текстом.[195] A text to be translated unit 703 that is configured to translate the text to be translated according to the relevant text.

[196] В одной из реализаций данного варианта осуществления настоящего изобретения, блок 703 перевода текста, подлежащего переводу, может быть сконфигурирован, в частности, для перевода текста, подлежащего переводу, в соответствии с релевантным текстом с использованием заранее построенной модели кодирования-декодирования.[196] In one implementation of this embodiment of the present invention, the text-to-translate block 703 can be configured, in particular, to translate the text to be translated according to the relevant text using a pre-built encoding-decoding model.

[197] В одной из реализаций данного варианта осуществления настоящего изобретения блок 703 перевода текста, подлежащего переводу, может содержать:[197] In one implementation of this embodiment of the present invention, the translation block 703 of the text to be translated may comprise:

[198] первый подблок кодирования, сконфигурированный для получения начального результата кодирования путем кодирования текста, подлежащего переводу, при этом начальный результат кодирования представляет семантическую информацию текста, подлежащего переводу;[198] the first encoding subunit, configured to obtain the initial encoding result by encoding the text to be translated, wherein the initial encoding result represents the semantic information of the text to be translated;

[199] второй подблок кодирования, сконфигурированный для получения релевантного результата кодирования путем кодирования релевантного текста, при этом релевантный результат кодирования представляет семантическую информацию релевантного текста;[199] a second encoding subunit, configured to obtain a relevant encoding result by encoding the relevant text, wherein the relevant encoding result represents the semantic information of the relevant text;

[200] подблок обработки результата, сконфигурированный для получения целевого результата кодирования путем обработки начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования, при этом целевой результат кодирования представляет семантическую информацию текста, подлежащего переводу, и переносит всю семантическую информацию релевантного текста или ее часть, и[200] a result processing subunit configured to obtain a target encoding result by processing the initial encoding result using all or part of the encoding results in the relevant encoding result, wherein the target encoding result represents the semantic information of the text to be translated and carries all the semantic information of the relevant text or part of it, and

[201] подблок выполнения декодирования, сконфигурированный для перевода текста, подлежащего переводу, путем декодирования целевого результата кодирования.[201] A decoding execution sub-unit configured to translate text to be translated by decoding a target encoding result.

[202] В одной из реализаций данного варианта осуществления настоящего изобретения первый подблок кодирования может быть сконфигурирован, в частности, для получения начального результата кодирования путем кодирования каждого слова текста, подлежащего переводу.[202] In one implementation of this embodiment of the present invention, the first encoding subunit may be configured, in particular, to obtain the initial encoding result by encoding each word of the text to be translated.

[203] Соответственно, второй подблок кодирования может быть сконфигурирован, в частности, для кодирования слов каждой единицы текста в релевантном тексте для получения результатов кодирования, отвечающих соответствующим единицам текста, и определения упомянутых результатов кодирования в качестве релевантного результата кодирования.[203] Accordingly, the second encoding sub-unit may be configured specifically to encode the words of each text unit in the relevant text to obtain encoding results corresponding to the respective text units and to determine said encoding results as the relevant encoding result.

[204] В одной из реализаций данного варианта осуществления настоящего изобретения блок 703 перевода текста, подлежащего переводу, может также содержать:[204] In one implementation of this embodiment of the present invention, the translation block 703 of the text to be translated may also comprise:

[205] первый подблок сложения, сконфигурированный для сложения вместе, после кодирования слов текста, подлежащего переводу, результатов кодирования слов текста, подлежащего переводу, с получением суммарного результата, соответствующего тексту, подлежащему переводу, и[205] the first addition sub-unit, configured to add together, after encoding the words of the text to be translated, the results of encoding the words of the text to be translated, obtaining a total result corresponding to the text to be translated, and

[206] второй блок сложения, сконфигурированный для сложения вместе, после кодирования слов каждой единицы текста в релевантном тексте, результатов кодирования слов каждой единицы текста в предшествующем исходном тексте в случае, когда релевантный текст включает предшествующий исходный текст, с получением суммарного результата, соответствующего каждой единице текста, сложения вместе результатов кодирования слов каждой единицы текста в последующем исходном тексте в случае, когда релевантный текст включает последующий исходный текст, с получением суммарного результата, соответствующего каждой единице текста, и сложения вместе результатов кодирования слов каждой единицы текста в предшествующем целевом тексте в случае, когда релевантный текст включает предшествующий целевой текст, с получением суммарного результата, соответствующего каждой единице текста.[206] A second adder configured to add together, after encoding the words of each text unit in the relevant text, the word encoding results of each text unit in the preceding source text in the case where the relevant text includes the preceding source text, to obtain a total result corresponding to each unit of text, adding together the word encoding results of each text unit in the subsequent source text, in the case where the relevant text includes the subsequent source text, to obtain a total result corresponding to each text unit, and adding together the word encoding results of each text unit in the previous target text in when the relevant text includes the previous target text, with a total result corresponding to each unit of text.

[207] В одной из реализаций данного варианта осуществления настоящего изобретения подблок обработки результата содержит:[207] In one implementation of this embodiment of the present invention, the result processing subunit comprises:

[208] первый подблок определения, сконфигурированный для определения, в случае, когда релевантный текст включает предшествующий исходный текст, результата кодирования предшествующего исходного текста из релевантного результата кодирования;[208] the first determination sub-unit, configured to determine, in the case where the relevant text includes the previous source text, an encoding result of the previous source text from the relevant encoding result;

[209] второй подблок определения, сконфигурированный для определения, в случае, когда релевантный текст включает последующий исходный текст, результата кодирования последующего исходного текста из релевантного результата кодирования, и[209] a second determination sub-unit, configured to determine, in the case where the relevant text includes the subsequent source text, an encoding result of the subsequent source text from the relevant encoding result, and

[210] подблок получения результата, сконфигурированный для обработки начального результата кодирования в соответствии с определенным результатом кодирования, с получением целевого результата кодирования.[210] a result obtaining subunit configured to process the initial encoding result according to the determined encoding result to obtain a target encoding result.

[211] В одной из реализаций данного варианта осуществления настоящего изобретения подблок получения результата содержит:[211] In one implementation of this embodiment of the present invention, the result obtaining sub-unit comprises:

[212] первый подблок определения степени корреляции, сконфигурированный для определения, в случае, когда релевантный текст включает предшествующий исходный текст, степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования предшествующего исходного текста,[212] the first correlation degree determination sub-unit, configured to determine, in the case where the relevant text includes the previous source text, the degree of correlation between the text to be translated and the previous source text according to the initial encoding result of the text to be translated and the encoding result the previous source text,

[213] второй подблок определения степени корреляции, сконфигурированный для определения, в случае, когда релевантный текст включает последующий исходный текст, степени корреляции между текстом, подлежащим переводу, и последующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования последующего исходного текста, и[213] a second correlation degree determination sub-unit, configured to determine, in the case where the relevant text includes the subsequent source text, the degrees of correlation between the text to be translated and the subsequent source text according to the initial encoding result of the text to be translated and the encoding result subsequent source text, and

[214] подблок получения целевого результата, сконфигурированный для обработки начального результата кодирования в соответствии с определенным результатом кодирования и определенной степенью корреляции, с получением целевого результата кодирования.[214] a target result obtaining sub-unit, configured to process the initial encoding result in accordance with the determined encoding result and the determined degree of correlation, to obtain the target encoding result.

[215] В одной из реализаций данного варианта осуществления настоящего изобретения подблок выполнения декодирования сконфигурирован, в частности, для декодирования, в случае, когда релевантный текст включает предшествующий целевой текст, целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования.[215] In one implementation of this embodiment of the present invention, the decoding execution subunit is specifically configured to decode, in the case where the relevant text includes the previous target text, the target encoding result using the encoding result of the previous target text in the relevant encoding result.

[216] В одной из реализаций данного варианта осуществления настоящего изобретения подблок выполнения декодирования содержит:[216] In one implementation of this embodiment of the present invention, the decoding execution subunit comprises:

[217] третий подблок определения степени корреляции, сконфигурированный для определения степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом, и[217] a third correlation degree determination sub-unit, configured to determine the degree of correlation between the text to be translated and the preceding target text, and

[218] подблок обработки результата кодирования, сконфигурированный для декодирования целевого результата кодирования в соответствии с определенной степенью корреляции и результатом кодирования предшествующего целевого текста.[218] An encoding result processing sub-unit, configured to decode the target encoding result according to the determined degree of correlation and the encoding result of the previous target text.

[219] В одной из реализаций данного варианта осуществления настоящего изобретения третий подблок определения степени корреляции сконфигурирован, в частности, для определения степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в качестве степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом.[219] In one implementation of this embodiment of the present invention, the third correlation degree determination subunit is configured to specifically determine the degree of correlation between the text to be translated and the previous source text as the degree of correlation between the text to be translated and the previous target text. .

[220] Шестой вариант осуществления изобретения[220] Sixth embodiment of the invention

[221] В данном варианте осуществления настоящего изобретения предлагается еще одно устройство для перевода текста на уровне дискурса, при этом за соответствующим описанием следует обращаться к рассмотренным выше вариантам осуществления способа.[221] In this embodiment of the present invention, another device for translating text at the discourse level is proposed, and for a corresponding description, refer to the above embodiments of the method.

[222] На фиг. 8 показана аппаратная структурная схема устройства для перевода текста на уровне дискурса в соответствии с данным вариантом осуществления настоящего изобретения. Устройство 800 голосового взаимодействия включает память 801, приемник 802 и процессор 803, связанный с памятью 801 и приемником 802, при этом память 801 сконфигурирована для хранения набора программный инструкций, а процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующих операций:[222] FIG. 8 is a hardware block diagram of a device for translating text at the discourse level in accordance with this embodiment of the present invention. The voice interaction device 800 includes a memory 801, a receiver 802, and a processor 803 associated with the memory 801 and the receiver 802, wherein the memory 801 is configured to store a set of program instructions, and the processor 803 is configured to call the program instructions stored in the memory 801 to perform the following operations:

[223] получение текста, подлежащего переводу, при этом текст, подлежащий переводу, представляет собой единицу текста в тексте на уровне дискурса, подлежащем переводу;[223] obtaining the text to be translated, wherein the text to be translated is a unit of text in the text at the discourse level to be translated;

[224] получение релевантного текста для текста, подлежащего переводу, при этом релевантный текст включает по меньшей мере одно из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст,[224] obtaining relevant text for the text to be translated, wherein the relevant text includes at least one of the following: the previous source text, the subsequent source text, or the previous target text,

[225] при этом под предшествующим исходным текстом понимают по меньшей мере одну единицу текста перед текстом, подлежащим переводу, в тексте на уровне дискурса, под последующим исходным текстом понимают по меньшей мере одну единицу текста после текста, подлежащего переводу, в тексте на уровне дискурса, а под предшествующим целевым текстом понимают текст перевода упомянутого предшествующего исходного текста, и[225] while the preceding source text is understood to be at least one unit of text before the text to be translated in the text at the discourse level, the subsequent source text is understood to be at least one unit of text after the text to be translated in the text at the discourse level , and by the previous target text is meant the text of the translation of the said previous source text, and

[226] перевод текста, подлежащего переводу, в соответствии с релевантным текстом.[226] translation of the text to be translated according to the relevant text.

[227] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующей операции:[227] In one implementation of this embodiment of the present invention, the processor 803 is configured to call program instructions stored in memory 801 to perform the following operation:

[228] перевод текста, подлежащего переводу, в соответствии с релевантным текстом с использованием заранее построенной модели кодирования-декодирования.[228] translating the text to be translated according to the relevant text using a pre-built encoding-decoding model.

[229] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующих операций:[229] In one implementation of this embodiment of the present invention, the processor 803 is configured to call program instructions stored in memory 801 to perform the following operations:

[230] получение начального результата кодирования путем кодирования текста, подлежащего переводу, при этом начальный результат кодирования представляет семантическую информацию текста, подлежащего переводу;[230] obtaining an initial encoding result by encoding the text to be translated, wherein the initial encoding result represents the semantic information of the text to be translated;

[231] получение релевантного результата кодирования путем кодирования релевантного текста, при этом релевантный результат кодирования представляет семантическую информацию релевантного текста;[231] obtaining a relevant encoding result by encoding the relevant text, wherein the relevant encoding result represents the semantic information of the relevant text;

[232] получение целевого результата кодирования путем обработки начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования, при этом целевой результат кодирования представляет семантическую информацию текста, подлежащего переводу, и переносит всю семантическую информацию релевантного текста или ее часть, и[232] obtaining a target encoding result by processing the initial encoding result using all or part of the encoding results in the relevant encoding result, wherein the target encoding result represents the semantic information of the text to be translated and carries all or part of the semantic information of the relevant text, and

[233] перевод текста, подлежащего переводу, путем декодирования целевого результата кодирования.[233] translating the text to be translated by decoding the target encoding result.

[234] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующих операций:[234] In one implementation of this embodiment of the present invention, the processor 803 is configured to call program instructions stored in memory 801 to perform the following operations:

[235] получение начального результата кодирования путем кодирования слов текста, подлежащего переводу, и[235] obtaining the initial encoding result by encoding the words of the text to be translated, and

[236] кодирование слов каждой единицы текста в релевантном тексте для получения результатов кодирования, отвечающих соответствующим единицам текста, и определение упомянутых результатов кодирования в качестве релевантного результата кодирования.[236] encoding the words of each text unit in the relevant text to obtain encoding results corresponding to the corresponding text units, and determining said encoding results as the relevant encoding result.

[237] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующих операций:[237] In one implementation of this embodiment of the present invention, the processor 803 is configured to call program instructions stored in memory 801 to perform the following operations:

[238] получение суммарного результата, соответствующего тексту, подлежащему переводу, путем сложения вместе результатов кодирования слов текста, подлежащего переводу;[238] obtaining a total result corresponding to the text to be translated by adding together the results of encoding the words of the text to be translated;

[239] в случае, когда релевантный текст включает предшествующий исходный текст, сложение вместе результатов кодирования слов каждой единицы текста в предшествующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста;[239] in the case where the relevant text includes the preceding source text, adding together the word encoding results of each text unit in the preceding source text to obtain a total result corresponding to each text unit;

[240] в случае, когда релевантный текст включает последующий исходный текст, сложение вместе результатов кодирования слов каждой единицы текста в последующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста, и,[240] in the case where the relevant text includes subsequent source text, adding together the word encoding results of each text unit in the subsequent source text to obtain a total result corresponding to each text unit, and,

[241] в случае, когда релевантный текст включает предшествующий целевой текст, сложение вместе результатов кодирования слов каждой единицы текста в предшествующем целевом тексте, для получения суммарного результата, соответствующего каждой единице текста.[241] in the case where the relevant text includes the preceding target text, adding together the word encoding results of each text unit in the preceding target text to obtain a total result corresponding to each text unit.

[242] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующих операций:[242] In one implementation of this embodiment of the present invention, the processor 803 is configured to call program instructions stored in memory 801 to perform the following operations:

[243] определение, в случае, когда релевантный текст включает предшествующий исходный текст, результата кодирования предшествующего исходного текста из релевантного результата кодирования;[243] determining, in the case where the relevant text includes the previous source text, the encoding result of the previous source text from the relevant encoding result;

[244] определение, в случае, когда релевантный текст включает последующий исходный текст, результата кодирования последующего исходного текста из релевантного результата кодирования и[244] determining, in the case where the relevant text includes the subsequent source text, the encoding result of the subsequent source text from the relevant encoding result, and

[245] обработку начального результата кодирования в соответствии с определенным результатом кодирования.[245] processing the initial encoding result according to the determined encoding result.

[246] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующих операций:[246] In one implementation of this embodiment of the present invention, the processor 803 is configured to call program instructions stored in memory 801 to perform the following operations:

[247] определение, в случае, когда релевантный текст включает предшествующий исходный текст, степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования предшествующего исходного текста;[247] determining, in the case where the relevant text includes the previous source text, the degree of correlation between the text to be translated and the previous source text according to the initial encoding result of the text to be translated and the encoding result of the previous source text;

[248] определение, в случае, когда релевантный текст включает последующий исходный текст, степени корреляции между текстом, подлежащим переводу, и последующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования последующего исходного текста и[248] determining, in the case where the relevant text includes subsequent source text, the degree of correlation between the text to be translated and the subsequent source text according to the initial encoding result of the text to be translated and the encoding result of the subsequent source text, and

[249] обработка начального результата кодирования в соответствии с определенным результатом кодирования и определенной степенью корреляции.[249] processing the initial encoding result in accordance with the determined encoding result and the determined degree of correlation.

[250] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующей операции:[250] In one implementation of this embodiment of the present invention, the processor 803 is configured to call program instructions stored in memory 801 to perform the following operation:

[251] декодирование, в случае, когда релевантный текст включает предшествующий целевой текст, целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования.[251] decoding, in the case where the relevant text includes the previous target text, the encoding target result using the encoding result of the previous target text in the relevant encoding result.

[252] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующих операций:[252] In one implementation of this embodiment of the present invention, the processor 803 is configured to call program instructions stored in memory 801 to perform the following operations:

[253] определение степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом и[253] determining the degree of correlation between the text to be translated and the previous target text, and

[254] декодирование целевого результата кодирования в соответствии с определенной степенью корреляции и результатом кодирования предшествующего целевого текста.[254] decoding the target encoding result in accordance with the determined degree of correlation and the encoding result of the previous target text.

[255] В одной из реализаций данного варианта осуществления настоящего изобретения процессор 803 сконфигурирован для вызова программных инструкций, хранимых в памяти 801, для выполнения следующей операции:[255] In one implementation of this embodiment of the present invention, the processor 803 is configured to call program instructions stored in memory 801 to perform the following operation:

[256] определение степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в качестве степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом.[256] determining the degree of correlation between the text to be translated and the previous source text as the degree of correlation between the text to be translated and the previous target text.

[257] В некоторых из вариантов осуществления настоящего изобретения процессор 803 может быть центральным процессорным блоком (Central Processing Unit, CPU), память 801 может быть внутренним хранилищем в виде памяти с произвольным доступом (Random Access Memory, RAM), а приемник 802 может включать стандартный физический интерфейс, который может быть интерфейсом Ethernet или интерфейсом с асинхронным режимом передачи (Asynchronous Transfer Mode, ATM). Процессор 803, приемник 802 и память 801 могут быть интегрированы в одну или более независимых схем или аппаратных блоков, например в заказные интегральные схемы (Application Specific Integrated Circuit, ASIC).[257] In some embodiments of the present invention, processor 803 may be a Central Processing Unit (CPU), memory 801 may be internal storage in the form of Random Access Memory (RAM), and receiver 802 may include A standard physical interface, which can be an Ethernet interface or an Asynchronous Transfer Mode (ATM) interface. Processor 803, receiver 802, and memory 801 may be integrated into one or more independent circuits or hardware units, such as custom integrated circuits (Application Specific Integrated Circuit, ASIC).

[258] В соответствии с данным вариантом осуществления настоящего изобретения предлагается машиночитаемый носитель данных. Машиночитаемый носитель данных содержит инструкции, которые при их исполнении на компьютере обеспечивают выполнение, этим компьютером, любых из описанных выше способов перевода текста на уровне дискурса[258] In accordance with this embodiment of the present invention, a computer-readable storage medium is provided. A computer-readable storage medium contains instructions that, when executed on a computer, cause that computer to perform any of the above-described methods of translating text at the discourse level.

[259] В соответствии с данным вариантом осуществления настоящего изобретения предлагается также компьютерный программный продукт, который при его исполнении на терминальном устройство обеспечивает выполнение, этим терминальным устройством, любых из описанных выше способов перевода текста на уровне дискурса.[259] According to this embodiment, the present invention also provides a computer program product that, when executed on a terminal device, causes that terminal device to perform any of the discourse-level text translation methods described above.

[260] Из приведенного выше описания вариантов осуществления настоящего изобретения специалистам в данной области техники очевидно, что все шаги или часть шагов в рассмотренных вариантах осуществления способов могут быть реализованы с помощью программного обеспечения на соответствующей стандартной аппаратной платформе. Следовательно, сущность или та часть предлагаемых технических решений, которая вносит вклад в известный уровень техники, может быть реализована в виде программного продукта. Компьютерный программный продукт может храниться на носителе данных, например, в памяти ROM/RAM, на магнитном или оптическом диске, или аналогичном носителе, содержащем набор инструкций, обеспечивающих выполнение, компьютерным устройством (которое может быть персональным компьютером, сервером или сетевым устройством связи, таким как медиа-шлюз и т.п.), способов согласно различным вариантам осуществления настоящего изобретения или их частям.[260] From the above description of the embodiments of the present invention, it will be apparent to those skilled in the art that all or part of the steps in the discussed embodiments of the methods may be implemented by software on an appropriate standard hardware platform. Therefore, the essence or that part of the proposed technical solutions, which contributes to the prior art, can be implemented as a software product. The computer program product may be stored on a storage medium, such as ROM/RAM memory, a magnetic or optical disk, or similar medium containing a set of instructions to enable execution, by a computing device (which may be a personal computer, a server, or a network communication device such as as a media gateway, etc.), methods according to various embodiments of the present invention or parts thereof.

[261] Следует отметить, что различные варианты осуществления настоящего изобретения, рассмотренные в данной заявке, приведены последовательно, при этом подчеркнуты отличия каждого из вариантов осуществления изобретения от остальных; поэтому за описанием идентичных или аналогичных частей в различных вариантах осуществления настоящего изобретения можно обращаться к другим вариантам. Устройство, соответствующее вариантам осуществления настоящего изобретения, описано кратко, поскольку оно соответствует способу согласно вариантам осуществления настоящего изобретения, и за описанием соответствующих частей можно обращаться к описанию способа.[261] It should be noted that the various embodiments of the present invention discussed in this application are listed sequentially, with the differences of each of the embodiments of the invention from the rest; therefore, for a description of identical or similar parts in various embodiments of the present invention, you can refer to other options. The device according to the embodiments of the present invention is described briefly as it corresponds to the method according to the embodiments of the present invention, and the description of the method can be referred to for a description of the relevant parts.

[262] Следует также понимать, что термины, указывающие на отношения, такие как «первый» или «второй», применяются в данном документе исключительно для различения одного объекта или операции от другого объекта или другой операции, и не обязательно подразумевают или требуют наличия фактического порядка или отношения между этими объектами или операциями. Кроме того, термины «включает», «содержит» и любые их варианты подразумевают не исключающее включение, так что процесс, способ, объект или устройство, включающее набор элементов, может включать не только эти элементы, но и любые другие, не перечисленные явно, или элементы, присущие процессу, способу, объекту или устройству. Без дополнительного ограничения, выражение «включает», указанное перед элементом, не исключает наличие других таких же элементов в процессе, способе, объекте или устройстве, включающих упомянутый элемент.[262] It should also be understood that terms indicating relationships, such as "first" or "second", are used herein solely to distinguish one entity or operation from another entity or operation, and do not necessarily imply or require the existence of an actual order or relationship between these objects or operations. In addition, the terms "comprises", "comprises" and any variations thereof are intended to be non-exclusive, so that a process, method, object, or device incorporating a set of elements may include not only these elements, but any others not explicitly listed, or elements inherent in a process, method, object, or device. Without further limitation, the expression "includes" before an element does not exclude the presence of other such elements in a process, method, object, or device that includes said element.

[263] Приведенное выше описание вариантов осуществления изобретения дает возможность специалистам в данной области техники реализовать настоящее изобретение или применить его на практике. Специалистам в данной области техники могут быть очевидны различные модификации вариантов осуществления настоящего изобретения, при этом раскрытый здесь общий принцип изобретения может быть реализован и в других вариантах его осуществления, в пределах сущности настоящего изобретения. Соответственно, настоящее изобретение не ограничено описанными здесь вариантами его осуществления, и его сущность определяется в наиболее широком объеме в соответствии с принципом и новыми признаками изобретения.[263] The above description of the embodiments of the invention enables those skilled in the art to make or practice the present invention. Various modifications of the embodiments of the present invention may be apparent to those skilled in the art, and the general principle of the invention disclosed herein may be implemented in other embodiments thereof, within the spirit of the present invention. Accordingly, the present invention is not limited to the embodiments described herein, and its essence is defined in the broadest scope in accordance with the principle and new features of the invention.

Claims (39)

1. Компьютерно-реализуемый способ перевода текста на уровне дискурса, включающий: 1. A computer-implemented method of translating text at the discourse level, including: получение текста, подлежащего переводу, при этом текст, подлежащий переводу, представляет собой единицу текста в тексте на уровне дискурса, подлежащем переводу, receiving the text to be translated, while the text to be translated is a unit of text in the text at the discourse level to be translated, получение релевантного текста для текста, подлежащего переводу, при этом релевантный текст включает по меньшей мере одно из следующего: предшествующий исходный текст, последующий исходный текст или предшествующий целевой текст, obtaining the relevant text for the text to be translated, wherein the relevant text includes at least one of the following: the previous source text, the subsequent source text, or the previous target text, причем предшествующий исходный текст представляет собой по меньшей мере одну единицу текста перед текстом, подлежащим переводу, в тексте на уровне дискурса, последующий исходный текст представляет собой по меньшей мере одну единицу текста после текста, подлежащего переводу, в тексте на уровне дискурса, а предшествующий целевой текст представляет собой текст перевода упомянутого предшествующего исходного текста, и wherein the preceding source text is at least one unit of text before the text to be translated in the text at the discourse level, the subsequent source text is at least one unit of text after the text to be translated in the text at the discourse level, and the preceding target the text is the translation text of said prior source text, and перевод текста, подлежащего переводу, в соответствии с релевантным текстом, translation of the text to be translated according to the relevant text, при этом перевод текста, подлежащего переводу, в соответствии с релевантным текстом включает: while the translation of the text to be translated, in accordance with the relevant text, includes: получение начального результата кодирования путем кодирования текста, подлежащего переводу, при этом начальный результат кодирования представляет семантическую информацию текста, подлежащего переводу; obtaining an initial encoding result by encoding the text to be translated, wherein the initial encoding result represents the semantic information of the text to be translated; получение релевантного результата кодирования путем кодирования релевантного текста, при этом релевантный результат кодирования представляет семантическую информацию релевантного текста; obtaining a relevant encoding result by encoding the relevant text, wherein the relevant encoding result represents the semantic information of the relevant text; получение целевого результата кодирования путем обработки начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования; и obtaining a target encoding result by processing the initial encoding result using all or part of the encoding results in the relevant encoding result; and перевод текста, подлежащего переводу, путем декодирования целевого результата кодирования. translating the text to be translated by decoding the target encoding result. 2. Способ по п. 1, в котором перевод текста, подлежащего переводу, в соответствии с релевантным текстом включает: перевод текста, подлежащего переводу, в соответствии с релевантным текстом с использованием заранее построенной модели кодирования-декодирования. 2. The method of claim 1, wherein translating the text to be translated according to the relevant text includes: translating the text to be translated according to the relevant text using a prebuilt encoding-decoding model. 3. Способ по п. 2, в котором целевой результат кодирования представляет семантическую информацию текста, подлежащего переводу, и переносит всю семантическую информацию релевантного текста или ее часть. 3. The method of claim 2, wherein the target encoding result represents the semantic information of the text to be translated and carries all or part of the semantic information of the relevant text. 4. Способ по п. 3, в котором получение начального результата кодирования путем кодирования текста, подлежащего переводу, включает: 4. The method according to claim 3, wherein obtaining the initial encoding result by encoding the text to be translated includes: получение начального результата кодирования путем кодирования слов текста, подлежащего переводу, при этом соответственно получение релевантного результата кодирования путем кодирования релевантного текста включает: obtaining the initial encoding result by encoding the words of the text to be translated, while accordingly obtaining the relevant encoding result by encoding the relevant text includes: кодирование слов каждой единицы текста в релевантном тексте для получения результатов кодирования, отвечающих соответствующим единицам текста, и определение упомянутых результатов кодирования в качестве релевантного результата кодирования. encoding the words of each text unit in the relevant text to obtain encoding results corresponding to the respective text units, and determining said encoding results as the relevant encoding result. 5. Способ по п. 4, также включающий, после кодирования слов текста, подлежащего переводу: 5. The method according to claim 4, also including, after encoding the words of the text to be translated: получение суммарного результата, соответствующего тексту, подлежащему переводу, путем сложения вместе результатов кодирования слов текста, подлежащего переводу, при этом соответственно после кодирования слов каждой единицы текста в релевантном тексте способ также включает: obtaining an overall result corresponding to the text to be translated by adding together the results of encoding the words of the text to be translated, whereby, respectively, after encoding the words of each unit of text in the relevant text, the method also includes: в случае, когда релевантный текст включает предшествующий исходный текст, сложение вместе результатов кодирования слов каждой единицы текста в предшествующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста; in the case where the relevant text includes the preceding source text, adding together the word encoding results of each text unit in the preceding source text to obtain a total result corresponding to each text unit; в случае, когда релевантный текст включает последующий исходный текст, сложение вместе результатов кодирования слов каждой единицы текста в последующем исходном тексте для получения суммарного результата, соответствующего каждой единице текста, и in the case where the relevant text includes subsequent source text, adding together the word encoding results of each text unit in the subsequent source text to obtain a total result corresponding to each text unit, and в случае, когда релевантный текст включает предшествующий целевой текст, сложение вместе результатов кодирования слов каждой единицы текста в предшествующем целевом тексте для получения суммарного результата, соответствующего каждой единице текста. in the case where the relevant text includes the preceding target text, adding together the word encoding results of each text unit in the preceding target text to obtain a total result corresponding to each text unit. 6. Способ по п. 3, в котором обработка начального результата кодирования с использованием всех или части результатов кодирования в релевантном результате кодирования включает: 6. The method of claim 3, wherein processing the initial encoding result using all or part of the encoding results in the relevant encoding result comprises: определение, в случае, когда релевантный текст включает предшествующий исходный текст, результата кодирования предшествующего исходного текста из релевантного результата кодирования; determining, in the case where the relevant text includes the preceding source text, an encoding result of the preceding source text from the relevant encoding result; определение, в случае, когда релевантный текст включает последующий исходный текст, результата кодирования последующего исходного текста из релевантного результата кодирования и determining, in the case where the relevant text includes the subsequent source text, the encoding result of the subsequent source text from the relevant encoding result, and обработку начального результата кодирования в соответствии с определенным результатом кодирования. processing the initial encoding result in accordance with the determined encoding result. 7. Способ по п. 6, в котором обработка начального результата кодирования в соответствии с определенным результатом кодирования включает: 7. The method of claim 6, wherein processing the initial encoding result according to the determined encoding result comprises: Определение, в случае, когда релевантный текст включает предшествующий исходный текст, степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования предшествующего исходного текста; Determining, in the case where the relevant text includes the previous source text, the degree of correlation between the text to be translated and the previous source text according to the initial encoding result of the text to be translated and the encoding result of the previous source text; определение, в случае, когда релевантный текст включает последующий исходный текст, степени корреляции между текстом, подлежащим переводу, и последующим исходным текстом в соответствии с начальным результатом кодирования текста, подлежащего переводу, и результатом кодирования последующего исходного текста и determining, in the case where the relevant text includes the subsequent source text, the degree of correlation between the text to be translated and the subsequent source text according to the initial encoding result of the text to be translated and the encoding result of the subsequent source text, and обработку начального результата кодирования в соответствии с определенным результатом кодирования и определенной степенью корреляции. processing the initial encoding result in accordance with the determined encoding result and the determined degree of correlation. 8. Способ по любому из пп. 3−7, в котором перевод текста, подлежащего переводу, путем декодирования целевого результата кодирования включает: 8. The method according to any one of paragraphs. 3-7, in which the translation of the text to be translated by decoding the target encoding result includes: декодирование, в случае, когда релевантный текст включает предшествующий целевой текст, целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования. decoding, in the case where the relevant text includes the preceding target text, of the encoding target result using the encoding result of the previous target text in the relevant encoding result. 9. Способ по п. 8, в котором декодирование целевого результата кодирования с использованием результата кодирования предшествующего целевого текста в релевантном результате кодирования включает: 9. The method of claim 8, wherein decoding the target encoding result using the encoding result of the preceding target text in the relevant encoding result includes: определение степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом и determining the degree of correlation between the text to be translated and the previous target text, and декодирование целевого результата кодирования в соответствии с определенной степенью корреляции и результатом кодирования предшествующего целевого текста. decoding the target encoding result in accordance with the determined degree of correlation and the encoding result of the previous target text. 10. Способ по п. 9, в котором определение степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом включает: 10. The method of claim 9, wherein determining the degree of correlation between the text to be translated and the previous target text includes: определение степени корреляции между текстом, подлежащим переводу, и предшествующим исходным текстом в качестве степени корреляции между текстом, подлежащим переводу, и предшествующим целевым текстом. determining the degree of correlation between the text to be translated and the previous source text as the degree of correlation between the text to be translated and the previous target text. 11. Устройство для перевода текста на уровне дискурса, содержащее: 11. A device for translating text at the discourse level, comprising: процессор, память и системную шину, processor, memory and system bus, при этом процессор и память связаны друг с другом посредством системной шины и память сконфигурирована для хранения одной или более компьютерных программ, содержащих инструкции, которые при их исполнении процессором обеспечивают выполнение, этим процессором, способа по любому из пп. 1−10. wherein the processor and memory are coupled to each other via a system bus, and the memory is configured to store one or more computer programs containing instructions that, when executed by the processor, cause the processor to execute the method of any one of claims. 1−10. 12. Машиночитаемый носитель данных, содержащий инструкции, которые при их исполнении на компьютере обеспечивают выполнение этим компьютером способа по любому из пп. 1−10.12. A computer-readable storage medium containing instructions that, when executed on a computer, cause that computer to execute the method according to any one of paragraphs. 1−10.
RU2020139212A 2018-05-15 2019-04-10 Method and device for text translation at discourse level RU2779526C2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810463138.3 2018-05-15

Publications (2)

Publication Number Publication Date
RU2020139212A RU2020139212A (en) 2022-06-17
RU2779526C2 true RU2779526C2 (en) 2022-09-08

Family

ID=

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2518946C1 (en) * 2012-11-27 2014-06-10 Александр Александрович Харламов Method for automatic semantic indexing of natural language text
CN105912533A (en) * 2016-04-12 2016-08-31 苏州大学 Method and device for long statement segmentation aiming at neural machine translation
CN106126507A (en) * 2016-06-22 2016-11-16 哈尔滨工业大学深圳研究生院 A kind of based on character-coded degree of depth nerve interpretation method and system
RU172882U1 (en) * 2016-07-20 2017-07-28 Общество с ограниченной ответственностью "Технологии управления переводом" DEVICE FOR AUTOMATIC TEXT TRANSLATION
RU2628202C1 (en) * 2016-04-11 2017-08-15 Михаил Маркович Гольдреер Adaptive context-thematic machine translation
US20180101522A1 (en) * 2015-05-25 2018-04-12 Panasonic Intellectual Property Corporation Of America Machine translation method for performing translation between languages

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2518946C1 (en) * 2012-11-27 2014-06-10 Александр Александрович Харламов Method for automatic semantic indexing of natural language text
US20180101522A1 (en) * 2015-05-25 2018-04-12 Panasonic Intellectual Property Corporation Of America Machine translation method for performing translation between languages
RU2628202C1 (en) * 2016-04-11 2017-08-15 Михаил Маркович Гольдреер Adaptive context-thematic machine translation
CN105912533A (en) * 2016-04-12 2016-08-31 苏州大学 Method and device for long statement segmentation aiming at neural machine translation
CN106126507A (en) * 2016-06-22 2016-11-16 哈尔滨工业大学深圳研究生院 A kind of based on character-coded degree of depth nerve interpretation method and system
RU172882U1 (en) * 2016-07-20 2017-07-28 Общество с ограниченной ответственностью "Технологии управления переводом" DEVICE FOR AUTOMATIC TEXT TRANSLATION

Similar Documents

Publication Publication Date Title
CN111368565B (en) Text translation method, text translation device, storage medium and computer equipment
US11775777B2 (en) Artificial intelligence system using phrase tables to evaluate and improve neural network based machine translation
US10592607B2 (en) Iterative alternating neural attention for machine reading
JP2022177220A (en) Method for training text recognition model, method for recognizing text, and device for recognizing text
JP7457125B2 (en) Translation methods, devices, electronic equipment and computer programs
JP7335300B2 (en) Knowledge pre-trained model training method, apparatus and electronic equipment
AU2019204399A1 (en) A neural dialog state tracker for spoken dialog systems using dynamic memory networks
CN111241789A (en) Text generation method and device
US20220156467A1 (en) Hybrid Natural Language Understanding
JP2021033995A (en) Text processing apparatus, method, device, and computer-readable storage medium
CN113158687B (en) Semantic disambiguation method and device, storage medium and electronic device
KR20190045650A (en) System and method for coreference resolution using hierarchical pointer networks
WO2023045184A1 (en) Text category recognition method and apparatus, computer device, and medium
KR102550340B1 (en) Chapter-level text translation method and device
CN110287498B (en) Hierarchical translation method, device and storage medium
JP7211103B2 (en) Sequence labeling device, sequence labeling method, and program
RU2779526C2 (en) Method and device for text translation at discourse level
CN112395880A (en) Error correction method and device for structured triples, computer equipment and storage medium
CN116562263A (en) Method, device, equipment and storage medium for evaluating document link continuity
CN116108157A (en) Method for training text generation model, text generation method and device
CN114398875A (en) Training method of error correction model, search word error correction method, device and medium
CN110442706B (en) Text abstract generation method, system, equipment and storage medium
US20200279024A1 (en) Non-transitory computer readable medium
CN113987143A (en) Method, device and storage medium for improving conversation model prediction quality
RU2812301C2 (en) Method and server for performing context-sensitive translation