RU2419142C2 - Method to organise synchronous interpretation of oral speech from one language to another by means of electronic transceiving system - Google Patents

Method to organise synchronous interpretation of oral speech from one language to another by means of electronic transceiving system Download PDF

Info

Publication number
RU2419142C2
RU2419142C2 RU2008137398/08A RU2008137398A RU2419142C2 RU 2419142 C2 RU2419142 C2 RU 2419142C2 RU 2008137398/08 A RU2008137398/08 A RU 2008137398/08A RU 2008137398 A RU2008137398 A RU 2008137398A RU 2419142 C2 RU2419142 C2 RU 2419142C2
Authority
RU
Russia
Prior art keywords
text
language
communication terminal
speech
terminal
Prior art date
Application number
RU2008137398/08A
Other languages
Russian (ru)
Other versions
RU2008137398A (en
Inventor
Юрий Константинович Низиенко (RU)
Юрий Константинович Низиенко
Виктор Абрамович Белиловский (RU)
Виктор Абрамович Белиловский
Original Assignee
Юрий Константинович Низиенко
Виктор Абрамович Белиловский
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Юрий Константинович Низиенко, Виктор Абрамович Белиловский filed Critical Юрий Константинович Низиенко
Priority to RU2008137398/08A priority Critical patent/RU2419142C2/en
Publication of RU2008137398A publication Critical patent/RU2008137398A/en
Application granted granted Critical
Publication of RU2419142C2 publication Critical patent/RU2419142C2/en

Links

Images

Abstract

FIELD: information technologies.
SUBSTANCE: process of electronic interpretation of a code text form (KTF) in the input language in KTF in the output language is organised in two stages. At the first stage the input language KTF is converted into the intermediate language KTF. At the second stage the intermediate language KTF is converted into the output language KTF. At the same time interpretation of a text into a text is organised as machine searching of separate word combinations, phrases or groups of phrases from the data base of interpretations, which were previously made by professional interpreters and stored in a mobile network, for instance, Internet. The data base of the mobile network translations is continuously supplemented since text forms requested for translation but unavailable in the data base of translations are displayed in the open access and are proposed for translation, for instance, on a commercial basis to professional interpreters. Besides, before using the communication terminal, the communication terminal owner speech is once verified at it compared to its written form, which is programmatically structured by means of this communication terminal.
EFFECT: increased accuracy of converting an audio signal in voice form entering the transmitting terminal into a coded text form in the input language, provided a memory with relatively small memory volume is available for use in this terminal.
6 cl, 4 dwg

Description

Настоящее изобретение относится к области электроники, в частности к способам и системам (устройствам) для перевода фраз с первого языка на второй, в частности, но не исключительно, к таким системам, которые вырабатывают речевой аудиосигнал на выходе (на выходном, языке) из речевого аудиосигнала на входе (на входном, языке).The present invention relates to the field of electronics, in particular to methods and systems (devices) for translating phrases from the first language into the second, in particular, but not exclusively, to such systems that generate a speech audio signal at the output (at the output, language) from the speech audio signal at the input (at the input, language).

Длительное время идет поиск электронной системы, которая могла бы в автоматическом режиме осуществлять синхронный перевод, в частности устный, с одного языка на другой. Однако несмотря на огромные успехи в современном уровне развития вычислительной техники (в частности, средств и методов распознавания и синтеза речи за последние годы) такие системы обладают существенными недостатками в области верификации речи владельца передающего мобильного терминала и, как следствие, в части достоверности передаваемой информации после ее перевода и озвучивания на выходе принимающего терминала.For a long time, there has been a search for an electronic system that could automatically carry out simultaneous translation, in particular interpretation, from one language to another. However, despite the huge successes in the modern level of development of computer technology (in particular, speech recognition and synthesis tools and synthesis in recent years), such systems have significant shortcomings in the field of speech verification of the owner of a transmitting mobile terminal and, as a consequence, in terms of the reliability of transmitted information after its translation and scoring at the output of the receiving terminal.

В области автоматического электронного перевода текста на первом языке в текст на втором языке были проведены интенсивные исследовательские работы с применением современных вычислительных систем и программного обеспечения. Однако помимо очень ограниченных применений (например, перевод прогнозов погоды) ранее отсутствовали электронные системы синхронного перевода речи с первого языка на второй, способные автоматически в режиме реального времени осуществлять точные переводы и, следовательно, заменять профессиональных переводчиков. Как правило, проблемы перевода речи усугубляются ошибками в распознавании речи (т.е. ее верификации) на основе дополнительной информации для верификации, содержащейся в акустико-лингвистических особенностях речи, характерных для каждого индивидуума (абонента связи).In the field of automatic electronic translation of text in the first language into text in the second language, intensive research was carried out using modern computer systems and software. However, in addition to very limited applications (for example, translating weather forecasts), previously there were no electronic systems for simultaneous translation of speech from the first language to the second, capable of automatically performing accurate translations in real time and, therefore, replacing professional translators. Typically, speech translation problems are exacerbated by errors in speech recognition (i.e., its verification) based on additional information for verification contained in the acoustic-linguistic features of speech characteristic of each individual (communication subscriber).

Существующие пакеты автоматического электронного перевода текстов по тем или иным причинам неэффективны и не отвечают требованиям, предъявляемым к системам речевого перевода. Большая часть таких пакетов разработана в помощь профессиональным переводчикам и результат работы таких пакетов должен быть отредактирован, прежде чем он примет приемлемый вид на том языке, на который осуществляется перевод. Большинство таких пакетов является диалоговыми или интерактивными и работают в относительно медленном режиме пакетной обработки и ни один из них не способен работать в реальном масштабе времени с речевым вводом информации.Existing packages of automatic electronic translation of texts for one reason or another are inefficient and do not meet the requirements for speech translation systems. Most of these packages are designed to help professional translators, and the result of such packages must be edited before it takes on an acceptable look in the language into which the translation is being done. Most of these packages are interactive or interactive and operate in a relatively slow mode of batch processing, and none of them is capable of working in real time with voice input of information.

Кроме того, пакеты программ, использующиеся для текстового перевода, неподвижны, поскольку идиомы и другие исключения из правил вполне могут вызвать ошибку на выходе, т.е. пользователь не имеет полной гарантии, что полученный текст переведен правильно. Существующие системы, кроме того, весьма интенсивно используют центральный процессор, что делает их дорогими в эксплуатации и, следовательно, недоступными для широкого круга индивидуальных абонентов сетей мобильной связи.In addition, the software packages used for text translation are immobile, since idioms and other exceptions to the rules may well cause an output error, i.e. the user does not have full guarantee that the received text is translated correctly. Existing systems, in addition, very intensively use the central processor, which makes them expensive to operate and, therefore, inaccessible to a wide range of individual subscribers of mobile communication networks.

Из уровня техники известен способ организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы, согласно которому в запоминающее устройство терминала связи электронной системы (функционально являющегося передающим) вводят входящий аналоговый аудиосигнал в речевой форме на входном языке; осуществляют аналого-цифровую обработку и преобразование речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; обеспечивают электронный перевод кодовой формы текста на входном языке в кодовую форму текста на выходном языке; преобразуют кодовую форму текста на выходном языке в аналоговый аудиосигнал в речевой форме на выходном языке и выводят речевую форму аналогового аудиосигнала на выходном языке через терминал связи, функционально являющийся принимающим (RU №2070734, 1996 г.).The prior art method of organizing the simultaneous translation of oral speech from one language to another by means of an electronic transceiver system, according to which the input analog audio signal in speech form in the input language is input into the storage device of the communication terminal of the electronic system (functionally transmitting); carry out analog-to-digital processing and converting the speech form of an analog audio signal into a code text form in the input language; provide electronic translation of the code form of the text in the input language into the code form of the text in the output language; convert the code form of the text in the output language into an analog audio signal in speech form in the output language and output the speech form of the analog audio signal in the output language through the communication terminal, which is functionally receiving (RU No. 2070734, 1996).

Из уровня техники также известна электронная приемопередающая система с функцией синхронного перевода фраз из нескольких слов с одного языка на другой, включающая приемопередающую структуру входящего аналогового аудиосигнала в речевой форме на одном языке в выходящий аналоговый аудиосигнал в речевой форме на другом языке, которая содержит: энергонезависимое запоминающее устройство (преимущественно флэш-память); средства ввода речевой формы аналогового аудиосигнала на входном языке в передающий терминал связи упомянутой структуры; средства аналого-цифрового преобразования и обработки речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; систему перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке; средства цифро-аналогового преобразования и обработки кодовой формы текста на выходном языке в аналоговый аудиосигнал в речевой форме, а также средства вывода речевой формы аналогового аудиосигнала на выходном языке через принимающий терминал связи (RU №2070734, 1996 г.).The prior art also knows an electronic transceiver system with the function of synchronously translating phrases from several words from one language to another, including the transceiving structure of the incoming analog audio signal in speech form in one language into the output analog audio signal in speech form in another language, which contains: non-volatile memory device (mainly flash memory); speech input means of an analog audio signal in an input language into a transmitting communication terminal of said structure; means for analog-to-digital conversion and processing of the speech form of an analog audio signal into a code text form in the input language; a system for translating a code form of text in an input language into a code form of text in an output language; means for digital-to-analog conversion and processing of the code form of the text in the output language into an analog audio signal in speech form, as well as means for outputting the speech form of an analog audio signal in the output language through a receiving communication terminal (RU No. 2070734, 1996).

К недостаткам данных известных из уровня техники решений (как в отношении объекта изобретения «способ», так и в отношении объекта изобретения «устройство») следует отнести относительно низкие функциональные и технические характеристики, вследствие значительных погрешностей преобразования речевой формы вводимого в передающий терминал аудиосигнала в кодовую текстовую форму.The disadvantages of the data of solutions known from the prior art (both in relation to the subject matter of the invention “method” and in relation to the subject matter of the invention “device”) include relatively low functional and technical characteristics due to significant errors in the conversion of the speech form of the audio signal input into the transmitting terminal into a code signal text form.

В качестве еще одного недостатка данных известных из уровня техники решений целесообразно отметить необходимость оснащения передающего терминала (при передачи информации на удаленный, принимающий терминал) запоминающим устройством с достаточно большим объемом памяти, в особенности при осуществлении приемопередачи с одного входного языка на несколько выходных языков, поскольку весь процесс текстового перевода с одного языка (входного) на другой (выходной) осуществляется в пределах операционной системы (микропроцессора) передающего терминала, вследствие чего в памяти данного терминала должна содержаться расширенная номенклатура словарей, в том числе и для редко используемых языков, например хинди.As another drawback of the data of the solutions known from the prior art, it is advisable to note the need to equip the transmitting terminal (when transmitting information to the remote receiving terminal) with a memory device with a sufficiently large amount of memory, especially when transmitting from one input language to several output languages, since the whole process of text translation from one language (input) to another (output) is carried out within the operating system (microprocessor) transmitting t terminal, as a result of which the memory of this terminal should contain an expanded nomenclature of dictionaries, including for rarely used languages, such as Hindi.

Таким образом, основным техническим результатом, реализуемым посредством заявленных изобретений, является повышение точности преобразования входящего в передающий терминал аудиосигнала в речевой форме в кодированную текстовую форму на входном языке при обеспечении возможности применения в данном терминале запоминающего устройства с относительно небольшим объемом памяти, за счет необходимости перевода кодовой текстовой формы входного аудиосигнала всегда на один и тот же промежуточный английский язык.Thus, the main technical result realized by the claimed inventions is to increase the accuracy of converting the speech signal input to the transmitting terminal into a coded text form in the input language, while providing the possibility of using a memory device with a relatively small amount of memory in this terminal, due to the need for translation the code text form of the input audio signal is always in the same intermediate English language.

Указанный технический результат в отношении объекта изобретения «способ» достигается посредством того, что в способе организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы, согласно которому в запоминающее устройство терминала связи электронной приемопередающей системы, функционально являющегося передающим, вводят входящий аналоговый аудиосигнал в речевой форме на входном языке; программно осуществляют аналого-цифровую обработку и преобразование речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; программно обеспечивают электронный перевод кодовой формы текста на входном языке в кодовую форму текста на выходном языке; преобразуют кодовую форму текста на выходном языке в аналоговый аудиосигнал в речевой форме на выходном языке и выводят речевую форму аналогового аудиосигнала на выходном языке через терминал связи, функционально являющийся принимающим, согласно изобретению в качестве электронной приемопередающей системы используют структуру с, по меньшей мере, двумя независимыми структурно идентичными терминалами связи; процесс электронного перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке организуют в два этапа; причем на первом этапе, который осуществляют посредством терминала связи, функционально являющегося в данный момент времени передающим, обеспечивают преобразования кодовой формы текста на входном языке в кодовую форму текста на промежуточном английском языке; на втором этапе, который осуществляют посредством терминала связи, функционально являющегося в данный момент времени принимающим, обеспечивают преобразования кодовой формы текста на промежуточном английском языке в кодовую форму текста на выходном языке; причем перед началом использования терминала связи, функционально являющегося передающим, на данном терминале однократно осуществляют верификацию устной речи владельца данного терминала связи относительно ее письменной формы, программно структурируемой посредством данного терминала связи, для чего программным путем осуществляют выделение и запоминание данных о характерных акустико-лингвистических признаках устной речи владельца этого терминала для обеспечения их программной адаптации относительно эталонных фонемов, заложенных в базе данных этого терминала.The indicated technical result with respect to the subject matter of the invention, the “method” is achieved by the fact that in the method of organizing the simultaneous translation of oral speech from one language into another by means of an electronic transceiver system, according to which an input analog audio signal in speech form in the input language; software carry out analog-to-digital processing and converting the speech form of an analog audio signal into a code text form in the input language; software provide electronic translation of the code form of the text in the input language into the code form of the text in the output language; convert the code form of the text in the output language into an analog audio signal in speech form in the output language and output the speech form of the analog audio signal in the output language through a communication terminal that is functionally receiving, according to the invention, a structure with at least two independent ones is used as an electronic transceiver system structurally identical communication terminals; the process of electronic translation of the code form of the text in the input language into the code form of the text in the output language is organized in two stages; moreover, in the first stage, which is carried out by means of a communication terminal, which is functionally currently transmitting, the code form of the text in the input language is converted to the code form of the text in intermediate English; at the second stage, which is carried out by means of a communication terminal, which is functionally currently receiving, provide the conversion of the code form of the text in intermediate English into the code form of the text in the output language; moreover, before using the communication terminal, which is functionally transmitting, the terminal verifies once the spoken language of the owner of the given communication terminal regarding its written form, programmatically structured by means of this communication terminal, for which the data on the characteristic acoustic-linguistic features are selected and stored oral speech of the owner of this terminal to ensure their software adaptation with respect to reference phonemes laid down in the database of this terminal.

В качестве передающего и принимающего терминалов функционально используют пространственно удаленные один от другого структурно идентичные терминалы связи, которые виртуально коммутируют посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет».As transmitting and receiving terminals, structurally identical structurally identical communication terminals are functionally used that are virtually switched by means of a global mobile communication system of the GSM standard and the Internet.

Технический результат в отношении объекта изобретения «устройство» достигается посредством того, что в электронной приемопередающей системе с функцией синхронного перевода устной речи с одного языка на другой, включающую приемопередающую структуру входящего аналогового аудиосигнала в речевой форме на одном языке в выходящий аналоговый аудиосигнал в речевой форме на другом языке, которая содержит: энергонезависимое запоминающее устройство; средства ввода речевой формы аналогового аудиосигнала на входном языке в передающий терминал связи упомянутой структуры; средства аналого-цифрового преобразования и обработки речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; систему перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке; средства цифро-аналогового преобразования и обработки кодовой формы текста на выходном языке в аналоговый аудиосигнал на этом же языке в речевой форме, а также средства вывода речевой формы аналогового аудиосигнала сигнала на выходном языке через принимающий терминал связи, согласно изобретению приемопередающая структура включает, по меньшей мере, два независимых, пространственно удаленных, структурно идентичных терминала связи; структура терминала связи, функционально являющегося передающим, оснащена средством верификации устной речи владельца терминала относительно ее письменной формы, программно структурируемой посредством данного терминала; структура системы перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке организована двухуровневой; причем первый уровень оснащен средством перевода кодовой формы текста на входном языке в кодовую форму текста на промежуточном английском языке, а второй уровень - средством перевода кодовой формы текста на промежуточном английском языке в кодовую форму текста на выходном языке.The technical result in relation to the object of the invention “device” is achieved by the fact that in an electronic transceiver system with the function of simultaneous translation of oral speech from one language to another, including the transceiver structure of the incoming analog audio signal in speech form in one language into the output analog audio signal in speech form on another language that contains: non-volatile storage device; speech input means of an analog audio signal in an input language into a transmitting communication terminal of said structure; means for analog-to-digital conversion and processing of the speech form of an analog audio signal into a code text form in the input language; a system for translating a code form of text in an input language into a code form of text in an output language; means for digital-to-analog conversion and processing of the code form of the text in the output language into an analog audio signal in the same language in speech form, as well as means for outputting the speech form of the analog audio signal in the output language through the receiving communication terminal, according to the invention, the transceiver structure includes at least , two independent, spatially remote, structurally identical communication terminals; the structure of the communication terminal, which is functionally transmitting, is equipped with a means of verifying the oral speech of the owner of the terminal regarding its written form, programmatically structured by means of this terminal; the structure of the system for translating the code form of text in the input language into the code form of the text in the output language is organized two-level; moreover, the first level is equipped with a means of translating the code form of text in the input language into the code form of the text in intermediate English, and the second level is equipped with the means of translating the code form of the text in intermediate English into the code form of the text in the output language.

Проведенный заявителем анализ уровня техники, включающий поиск по патентным и научно-техническим источникам информации и выявление источников, содержащих сведения об аналогах заявленных изобретений, позволил установить, что не обнаружены аналоги, характеризующиеся признаками и связями между ними, идентичными всем существенным признакам заявленных технических решений, а выбранный из выявленных аналогов прототип, как наиболее близкий по совокупности признаков аналог, позволил выявить совокупность существенных (по отношению к усматриваемому заявителем техническому результату) отличительных признаков в заявленных объектах изобретения, изложенных в формуле изобретения.The analysis of the prior art by the applicant, including a search by patent and scientific and technical sources of information and identification of sources containing information about analogues of the claimed inventions, made it possible to find that no analogues were found that are characterized by signs and relationships between them, identical to all the essential features of the claimed technical solutions, and the prototype selected from the identified analogues, as the analogue closest in terms of the totality of features, made it possible to identify the essential set (in relation to proposed by the applicant the technical result) of the distinguishing features in the claimed objects of the invention set forth in the claims.

Следовательно, заявленные технические решения соответствуют условию патентоспособности «новизна» по действующему законодательству.Therefore, the claimed technical solutions meet the condition of patentability "novelty" under the current law.

Для проверки соответствия заявленных изобретений требованию условию патентоспособности «изобретательский уровень» заявитель провел дополнительный поиск известных технических решений с целью выявления признаков, совпадающих с отличительными от прототипа признаками заявленных изобретений, результаты которого показывают, что заявленные изобретения не следует для специалиста явным образом из известного уровня техники, поскольку из уровня техники, определенного заявителем, не выявлено влияние предусматриваемых существенными признаками заявленных изобретений преобразований на достижение усматриваемого заявителем технического результата.To verify the conformity of the claimed inventions with the patentability requirement “inventive step”, the applicant conducted an additional search for known technical solutions in order to identify features that match the distinctive features of the claimed inventions, the results of which show that the claimed invention does not explicitly follow from the prior art , since the level of technology determined by the applicant has not revealed the impact of the essential by the claimed inventions of transformations to achieve the technical result perceived by the applicant.

В частности, заявленными изобретениями не предусматриваются следующие преобразования известных объектов-прототипов:In particular, the claimed inventions do not provide for the following transformations of known prototype objects:

- дополнение известного объекта каким-либо известным признаком, присоединяемым к нему по известным правилам, для достижения технического результата, в отношении которого установлено влияние именно таких дополнений;- addition of a well-known object by any well-known sign, attached to it according to known rules, to achieve a technical result, in respect of which the influence of such additions is established;

- замена какого-либо признака известного объекта другим известным признаком для достижения технического результата, в отношении которого установлено влияние именно такой замены;- replacement of any sign of a known object with another well-known sign to achieve a technical result, in respect of which the influence of such a replacement is established;

- исключение какого-либо признака известного объекта с одновременным исключением обусловленной наличием этого признака функции и достижением при этом обычного для такого исключения результата;- the exclusion of any sign of a known object with the simultaneous exclusion due to the presence of this sign of the function and the achievement of the usual result for this exclusion;

- увеличение количества однотипных признаков в известном объекте для усиления технического результата, обусловленного наличием в объекте именно таких признаков;- an increase in the number of similar features in a known object to enhance the technical result due to the presence of just such signs in the object;

- выполнение известного объекта или его части из известного материала для достижения технического результата, обусловленного известными свойствами материала;- the implementation of a known object or part of it from a known material to achieve a technical result due to the known properties of the material;

- создание объекта, включающего известные признаки, выбор которых и связь между ними осуществлены на основании известных правил и достигаемый при этом технический результат обусловлен только известными свойствами признаков этого объекта и связей между ними.- the creation of an object that includes known features, the choice of which and the relationship between them are based on known rules and the technical result achieved in this case is due only to the known properties of the features of this object and the relationships between them.

Следовательно, заявленные изобретения соответствует требованию условия патентоспособности «изобретательский уровень» по действующему законодательству.Therefore, the claimed invention meets the requirement of the patentability condition "inventive step" under applicable law.

Изобретения поясняется чертежами.The invention is illustrated by drawings.

Фиг.1 - блок-схема 1-го терминала связи, функционирующего в режиме приема-передачи в паре со 2-м пространственно удаленным терминалом связи (тонкими линиями с прозрачными стрелками условно продублирован входящий со 2-го терминала канал связи).Figure 1 - block diagram of the 1st communication terminal, operating in the transmit-receive mode paired with the 2nd spatially remote communication terminal (thin lines with transparent arrows conditionally duplicated the incoming communication channel from the 2nd terminal).

Фиг.2 - блок-схема 2-го терминала связи, функционирующего в режиме приема-передачи в паре с 1-м пространственно удаленным терминалом связи.Figure 2 is a block diagram of a 2nd communication terminal operating in a transmit-receive mode paired with a 1st spatially remote communication terminal.

Фиг.3 - алгоритм функционирования системы (средства) верификации устной речи владельца терминала.Figure 3 - algorithm of the functioning of the system (means) of verbal verification of the owner of the terminal.

Фиг.4 - алгоритм функционирования электронной приемопередающей системы с пространственно удаленными 1-м и 2-м структурно аналогичными терминалами связи.Figure 4 - algorithm of the operation of the electronic transceiver system with spatially remote 1st and 2nd structurally similar communication terminals.

На чертежах некоторые существенные блоки и средства коммуникации (такие как кнопочная панель, аккумулятор, флеш-накопитель /флеш-память/, цифровой микропроцессор и др.) условно не показаны, поскольку они являются общеизвестными и их функциональная принадлежность к рассматриваемым приемопередающим системам неоспорима, к тому же они не являются принципиальными объектами заявленных изобретений (см., например, RU №2324296 C1).In the drawings, some essential blocks and means of communication (such as a keypad, battery, flash drive / flash memory /, digital microprocessor, etc.) are not conventionally shown, since they are well-known and their functional affiliation with the considered transceiver systems is undeniable, moreover, they are not principal objects of the claimed inventions (see, for example, RU No. 224296 C1).

На чертежах пунктиром условно изображены блоки и коммутационные связи, не являющиеся функционально необходимыми в рамках реализации настоящих изобретений.In the drawings, the dashed lines conventionally depict blocks and switching connections that are not functionally necessary in the framework of the implementation of the present inventions.

На чертежах функциональные блоки, средства и системы обозначены следующими позициями:In the drawings, functional blocks, means and systems are indicated by the following positions:

1 - 1-й терминал связи;1 - 1st communication terminal;

2 - средство речевого ввода информации на 1-м, входном, языке (для 1-го терминала 1 связи);2 - means of voice input of information in the 1st, input, language (for the 1st communication terminal 1);

3 - средство верификации речи на 1-м, входном, языке (для 1-го терминала 1 связи);3 - means of verifying speech in the 1st, input, language (for the 1st communication terminal 1);

4 - средство распознавания речи на 1-м, входном, языке (для 1-го терминала 1 связи);4 - means of speech recognition in the 1st, input, language (for the 1st communication terminal 1);

5 - устройство запоминающее (для 1-го терминала 1 связи);5 - storage device (for the 1st communication terminal 1);

6 - средство текстового перевода с 1-го языка (входного) на 2-й язык (промежуточный) - (для 1-го терминала 1 связи);6 - means of text translation from the 1st language (input) to the 2nd language (intermediate) - (for the 1st communication terminal 1);

7 - преобразователь тексто-речевой для 1-го, входного, языка (для 1-го терминала 1 связи);7 - text-to-speech converter for the 1st, input, language (for the 1st communication terminal 1);

8 - синтезатор речи на 1-м, входном, языке (для 1-го терминала 1 связи);8 - speech synthesizer in the 1st, input, language (for the 1st communication terminal 1);

9 - динамик (выход на 1-м, входном, языке для 1-го терминала 1 связи);9 - speaker (output on the 1st, input, language for the 1st communication terminal 1);

10 - средство альтернативного ввода информации в виде текста на 1-м, входном, языке (для 1-го терминала 1 связи);10 - means of alternative input of information in the form of text in the 1st, input, language (for the 1st communication terminal 1);

11 - средство подтверждения альтернативного ввода информации в виде текста на 1-м, входном, языке (для 1-го терминала 1 связи);11 - means for confirming alternative input of information in the form of text in the 1st, input, language (for the 1st communication terminal 1);

12 - средство подтверждения речевого ввода информации в виде текста на 1-м, входном, языке (для 1-го терминала 1 связи);12 - means for verifying voice input of information in the form of text in the 1st, input, language (for the 1st communication terminal 1);

13 - 2-й терминал связи;13 - 2nd communication terminal;

14 - средство речевого ввода информации на 3-м, выходном, языке (для 2-го терминала 13 связи)14 - means of voice input of information in the 3rd, output, language (for the 2nd communication terminal 13)

15 - средство верификации речи на 3-м, выходном, языке (для 2-го терминала 13 связи);15 - means of verifying speech in the 3rd, output, language (for the 2nd communication terminal 13);

16 - средство распознавания речи на 3-м, выходном, языке (для 2-го терминала 13 связи);16 - speech recognition means in the 3rd, output, language (for the 2nd communication terminal 13);

17 - запоминающее устройство (для 2-го терминала 13 связи);17 - storage device (for the 2nd communication terminal 13);

18 - средство текстового перевода с 3-го (выходного) языка на 2-й (промежуточный) язык (для 2-го терминала 13 связи);18 - means of text translation from the 3rd (output) language to the 2nd (intermediate) language (for the 2nd communication terminal 13);

19 - преобразователь тексто-речевой (для 2-го терминала 13 связи);19 - text-to-speech converter (for the 2nd communication terminal 13);

20 - синтезатор речи на 3-м, выходном, языке (для 2-го терминала 13 связи);20 - speech synthesizer in 3rd, output, language (for the 2nd communication terminal 13);

21 - динамик (выход на 3-м языке, выходном, для 2-го терминала 13 связи);21 - speaker (output in 3 languages, output, for the 2nd communication terminal 13);

22 - средство альтернативного ввода текста на 3-м, выходном, языке (для 2-го терминала 13 связи);22 - means of alternative text input in the 3rd, output, language (for the 2nd communication terminal 13);

23 - средство подтверждения альтернативного ввода текста на 3-м, выходном, языке (для 2-го терминала 13 связи);23 - means for confirming alternative text input in the 3rd, output, language (for the 2nd communication terminal 13);

24 - средство подтверждения речевого ввода на 3-м, выходном, языке (для 2-го терминала 13 связи);24 - means of verifying voice input in the 3rd, output, language (for the 2nd communication terminal 13);

25 - средство альтернативного вывода текста на 3-м, выходном, языке (для 2-го терминала 13 связи);25 - means of alternative text output in the 3rd, output, language (for the 2nd communication terminal 13);

26 - микрофон.26 is a microphone.

Заявленный способ организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы характеризуется следующими необходимыми и достаточными (существенными) признаками.The claimed method of organizing simultaneous translation of oral speech from one language to another by means of an electronic transceiver system is characterized by the following necessary and sufficient (essential) features.

Согласно заявленному способу в запоминающее устройство 5 (фиг.1), коммутационно связанное с аналого-цифровым преобразователем /АЦП/ 1-го терминала 1 связи электронной системы (функционально являющегося в данном рассмотрении - передающим), вводят входящий аналоговый аудиосигнал в речевой форме на входном языке. Затем посредством АЦП осуществляют аналого-цифровую обработку и преобразование речевой формы аналогового аудиосигнала в кодовую текстовую форму на 1-м, входном, языке, В процессе обмена информационными кодовыми сигналами (в текстовой форме) между 1-м терминалом 1 связи и вторым (принимающим) терминалом 13 обеспечивают электронный перевод кодовой текстовой формы на 1-м, входном, языке передающего 1-го терминала 1 в кодовую текстовую форму на 3-м, выходном, языке 2-го (принимающего) терминала 13. На конечном этапе приемопередачи преобразуют кодовую форму текста на 3-м, выходном, языке 2-го терминала 13 в аналоговый аудиосигнал в речевой форме на 3-м, выходном, языке этого 2-го терминала 13 (фиг.2), посредством синтезатора 20 речи и выводят речевую форму аналогового аудиосигнала на 3-м, выходном, языке через динамик 21 2-го терминала 13 связи (функционально являющегося, в рассматриваемом случае - принимающим).According to the claimed method, in the storage device 5 (Fig. 1), switching connected with the analog-to-digital converter / ADC / 1 terminal of the electronic system communication terminal 1 (functionally transmitting in this consideration), an input analog audio signal is inputted in speech form at the input language. Then, through the ADC, analog-to-digital processing and conversion of the speech form of an analog audio signal into a textual code form are carried out in the 1st, input, language. In the process of exchanging informational code signals (in text form) between the 1st communication terminal 1 and the second (receiving) terminal 13 provides electronic translation of the code text form in the 1st, input, language of the transmitting 1st terminal 1 into the code text form in the 3rd, output, language of the 2nd (receiving) terminal 13. At the final stage of the transceiver, the code is converted the text form on the 3rd, output, language of the 2nd terminal 13 into an analog audio signal in a speech form on the 3rd, output, language of this 2nd terminal 13 (Fig. 2), by means of a speech synthesizer 20 and the analog speech form is output the audio signal in the 3rd, output, language through the speaker 21 of the 2nd communication terminal 13 (which is functionally, in this case, the receiver).

Отличительными особенностями заявленного способа является следующее.Distinctive features of the claimed method is the following.

В качестве приемопередающей системы используют структуру с, по меньшей мере, двумя независимыми, структурно идентичными терминалами 1 и 13 связи.As a transceiver system, a structure with at least two independent, structurally identical communication terminals 1 and 13 is used.

Процесс электронного перевода кодовой формы текста на 1-м, входном, языке в кодовую форму текста на 3-м, выходном языке организуют в два этапа:The process of electronic translation of the code form of the text in the 1st, input language into the code form of the text in the 3rd, output language is organized in two stages:

- на первом этапе (который осуществляют посредством терминала связи функционально являющегося в данный момент времени передающим) обеспечивают преобразования кодовой формы текста на входном (родном для владельца данного терминала) языке в кодовую форму текста на промежуточном английском языке;- at the first stage (which is carried out by means of a communication terminal which is functionally currently transmitting), the code form of the text in the input (native to the owner of this terminal) language is converted into the code form of the text in intermediate English;

- на втором этапе (который осуществляют посредством терминала связи, функционально являющегося в данный момент времени принимающим) обеспечивают преобразования кодовой формы текста на промежуточном английском языке в кодовую форму текста на выходном (родном для владельца данного терминала) языке.- at the second stage (which is carried out by means of a communication terminal, which is functionally currently receiving), the code form of the text in intermediate English is converted into the code form of the text in the output (native language for the owner of this terminal) language.

Причем, перед началом использования терминала связи, функционально являющегося передающим, на данном терминале однократно осуществляют верификацию устной речи владельца данного терминала связи относительно ее письменной формы, программно структурируемой посредством данного терминала связи. Для этого осуществляют выделение и запоминание данных о характерных акустико-лингвистических признаках устной речи владельца этого (передающего) терминала для осуществления программной адаптации их относительно эталонных фонемов, заложенных в базе данных этого (передающего) терминала.Moreover, before using the communication terminal, which is functionally transmitting, the terminal once verifies the speech of the owner of the given communication terminal regarding its written form, programmatically structured by means of this communication terminal. For this purpose, data on characteristic acoustic-linguistic features of oral speech of the owner of this (transmitting) terminal are extracted and stored for software adaptation of them relative to reference phonemes embedded in the database of this (transmitting) terminal.

Система автоматического перевода речь в речь структурно похожа на процесс профессионального перевода кинофильма. Так, вначале речь на языке оригинала переводят в текстовую форму также на языке оригинала, данный текст переводят в текстовую форму на языке проката фильма и затем актеры (носители языка проката фильма) озвучивают этот текст.A speech-to-speech automatic translation system is structurally similar to a professional movie translation process. So, first the speech in the original language is translated into a text form also in the original language, this text is translated into a text form in the film rental language and then the actors (native speakers of the film rental language) voice this text.

Совершенно очевидно, что процессы кодовых текстовых переводов согласно настоящему изобретению можно осуществлять и с использованием соответствующих баз данных из глобальной мировой сети «Интернет». Алгоритм подобной виртуальной коммутации терминала связи с упомянутыми базами данных широко известен, см., например, RU №2324296 С1.It is obvious that the code-based text translation processes according to the present invention can also be carried out using appropriate databases from the global Internet network. An algorithm for such virtual switching of the communication terminal with the mentioned databases is widely known, see, for example, RU No. 224296 C1.

В программном плане такие части процесса, как преобразование речи в текст и текста в речь, в настоящее время достаточно развиты для коммерческого применения, постоянно совершенствуются и могут использоваться как готовые блоки программы переводчика.Programmatically, parts of the process, such as the conversion of speech into text and text to speech, are currently sufficiently developed for commercial use, are constantly being improved and can be used as ready-made blocks of a translator program.

Основная трудность программы заключается в переводе текста в текст.The main difficulty of the program is the translation of text into text.

В предпочтительном варианте целесообразно организовать перевод текста в текст как машинный поиск групп предложений или отдельных предложений из базы переводов, выполненных профессиональными переводчиками и хранящимися в сети «Интернет». При этом для постоянного пополнения соответствующей базы переводов предложения, которые запрашиваются для перевода, но отсутствуют в базе переводов, выставляются с учетом их частотности в открытый доступ и могут предлагаться, например, для перевода на коммерческой основе переводчикам.In a preferred embodiment, it is advisable to organize the translation of text into text as a machine search for groups of sentences or individual sentences from a translation database made by professional translators and stored on the Internet. At the same time, for constant replenishment of the corresponding translation base, proposals that are requested for translation but are not in the translation base are exposed for open frequency taking into account their frequency and can be offered, for example, for translation on a commercial basis to translators.

При такой организации процесса перевод текста в текст будет выполнять целая армия переводчиков, связанная с пользователем сетью «Интернет», а электронно-вычислительная машина будет лишь проводить выбор соответствующего текста из базы заранее выполненных переводов. Предполагается наличие обратной связи пользователя с переводчиками, т.е. при неудовлетворительном переводе пользователь простым нажатием кнопки может послать соответствующую информацию в базу переводов.With this organization of the process, text-to-text translation will be carried out by a whole army of translators associated with the Internet user, and the electronic computer will only select the appropriate text from the database of pre-made translations. User feedback with translators is assumed, i.e. in case of unsatisfactory translation, the user can send the relevant information to the translation database with a simple click of a button.

В этом случае полнота базы переводов, их качество и скорость пополнения базы будут в основном зависеть от качества организации структуры Интернет-переводчиков, мотивации их активности и т.д.In this case, the completeness of the translation database, their quality and the speed of replenishment of the database will mainly depend on the quality of the organization of the structure of Internet translators, the motivation for their activity, etc.

В дальнейшем, по мере развития техники база переводов и программа-поисковик в каком-то виде при необходимости смогут храниться и автономно в мобильном терминале (телефоне) с функцией синхронного перевода «речь в речь».In the future, as the technology develops, the translation base and the search program in some form, if necessary, can be stored autonomously in a mobile terminal (telephone) with the function of simultaneous translation “speech to speech”.

В рамках настоящей заявки целесообразно раскрыть технический смысл терминов «процесс распознавания» и «процесс верификации» применительно к цифровой электронной технике (в частности, микропроцессорам, используемым в мобильных телефонных аппаратах /терминалах/ связи).In the framework of this application, it is advisable to disclose the technical meaning of the terms “recognition process” and “verification process” as applied to digital electronic equipment (in particular, microprocessors used in mobile telephones / terminals / communications).

«Процесс распознавания» - процесс обработки системой (средством) распознавания введенного в компьютер некоего аудиосигнала, например, речевого с характерными акустико-лингвистическими признаками, в результате чего система распознавания приписывает этому аудиосигналу и/или его характерным признакам программный (компьютерный) идентификационный код.“Recognition process” - the process of processing a system (means) of recognition of an audio signal introduced into a computer, for example, a speech signal with characteristic acoustic-linguistic features, as a result of which the recognition system assigns a program (computer) identification code to this audio signal and / or its characteristic features.

«Процесс верификации» - производимое человеком и/или заменяющим его устройством, и/или компьютерной программой сличение (определение адекватности) компьютерных кодов (символов) с аудиосигналом (например, в речевой форме) и/или с его характерными акустико-лингвистическими признаками, введенными в электронное устройство (например, компьютер, аппарат мобильной связи и т.п.).“Verification process” - a comparison made by a person and / or a device and / or computer program (determination of adequacy) of computer codes (symbols) with an audio signal (for example, in speech form) and / or with its characteristic acoustic-linguistic features introduced into an electronic device (e.g. computer, mobile phone device, etc.).

Разумно верификацию устной речи владельца терминалов 1 и 13 связи осуществлять следующим образом:It is reasonable to verify the oral speech of the owner of the communication terminals 1 and 13 as follows:

- владелец озвучивает заложенный в программу и/или произвольный текст;- the owner voices the program and / or arbitrary text embedded in the program;

- озвученный и введенный в запоминающее устройство 5, 17 соответствующего терминала связи аналоговый сигнал в речевой форме анализируют по характерным акустико-лингвистическим признакам и программно адаптируют их применительно к эталонному текстовому аналогу речи, заложенному в памяти (базе данных) этого терминала;- the analogue signal voiced and entered into the storage device 5, 17 of the corresponding communication terminal in speech form is analyzed by characteristic acoustic-linguistic features and programmatically adapt them as applied to the reference textual speech analogue stored in the memory (database) of this terminal;

- сохраняют информацию об отсутствующих в эталонной базе данных терминала характерных акустико-лингвистических признаках владельца;- save information about the characteristic acoustic-linguistic features of the owner that are absent in the reference database of the terminal;

- затем владелец озвучивает произвольный текст и проверяет его письменную форму, отображаемую на дисплее терминала связи;- then the owner voices an arbitrary text and checks its written form displayed on the display of the communication terminal;

- после чего осуществляют зацикливание этих двух методов верификации речи владельца между собой в операционной системе терминала, для чего владелец терминала озвучивает текст с дисплея терминала связи, аналоговую версию которого программно преобразуют в письменную форму и сравнивают с исходным текстом на дисплее;- after which these two methods of verifying the speech of the owner among themselves are looped in the terminal operating system, for which the owner of the terminal reads the text from the display of the communication terminal, the analog version of which is programmatically converted to writing and compared with the source text on the display;

- при совпадении первоначального и полученного из аналоговой версии произнесенного владельцем текста процесс верификации данного текста завершается;- if the original and received from the analogue version of the text pronounced by the owner coincide, the verification process of this text ends;

- при несовпадении указанных текстов программно обеспечивают переход к следующему тексту для верификации, заложенному в памяти этого терминала связи, и дублируют вышеописанный процесс верификации.- if these texts do not match, the software provides the transition to the next verification text stored in the memory of this communication terminal and duplicates the verification process described above.

Совершенно очевидно, что процесс верификации в заявленных изобретениях можно осуществлять и иными известными из уровня техники методами и средствами (см., например, патенты RU №2200369 и №2166207).It is completely obvious that the verification process in the claimed inventions can be carried out by other methods and means known from the prior art (see, for example, patents RU No. 2200369 and No. 2166207).

В качестве передающего и принимающего терминала 1 или 13 можно функционально использовать пространственно удаленные один от другого структурно идентичные терминалы 1 и 13 связи, которые виртуально коммутируют посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет».As the transmitting and receiving terminal 1 or 13, it is possible to use functionally spatially remote from each other structurally identical communication terminals 1 and 13, which are virtually switched by means of a global mobile communication system of the GSM standard and the Internet.

В качестве терминала 1 или 13 связи допустимо использовать мобильное электронное устройство, адаптированное к глобальной системе мобильной связи стандарта GSM и сети «Интернет».As a communication terminal 1 or 13, it is permissible to use a mobile electronic device adapted to the global GSM mobile communication system and the Internet.

В качестве терминала 1 или 13 связи допустимо также использовать мобильное электронное устройство, преимущественно, персональный компьютер типа «ноутбук», адаптированное к сети «Интернет».It is also permissible to use a mobile electronic device as a communication terminal 1 or 13, mainly a personal computer such as a laptop adapted to the Internet.

Оптимально, чтобы в передающей и принимающей структурах каждого терминала были бы предусмотрены дополнительные альтернативные средства ввода-вывода передаваемой информации в текстовой форме на соответствующих языках.It is optimal that in the transmitting and receiving structures of each terminal additional alternative means of input-output of the transmitted information in text form in the corresponding languages would be provided.

То есть структура терминалов 1 и 13 может быть дополнительно оснащена такими функциональными средствами, как: средство 10 альтернативного ввода информации в виде текста на 1-м, входном языке; средство 11 подтверждения альтернативного ввода информации в виде текста на 1-м, входном языке; средство подтверждения речевого ввода информации в виде речи на 1-м, входном языке; средство 25 альтернативного вывода информации в виде текста на 3-м, выходном, языке.That is, the structure of terminals 1 and 13 can be additionally equipped with such functional means as: means 10 for alternative input of information in the form of text in the 1st, input language; means 11 for confirming alternative input of information in the form of text in the 1st input language; means for verifying voice input of information in the form of speech in the 1st input language; means 25 alternative output of information in the form of text in the 3rd, day off, language.

Одним из конкретных частных приложений технической реализации заявленного способа является электронная приемопередающая система с функцией синхронного перевода устной речи с одного языка на другой между, по меньшей мере, двумя независимыми, пространственно удаленными, структурно идентичными 1-м терминалом 1 и вторым терминалом 13 (фиг.1 и 2).One of the particular private applications of the technical implementation of the claimed method is an electronic transceiver system with the function of simultaneous translation of oral speech from one language to another between at least two independent, spatially remote, structurally identical 1st terminals 1 and second terminals 13 (FIG. 1 and 2).

Данная система включает, по меньшей мере, два приемопередающих терминала 1 и 13 связи входящего аналогового аудиосигнала в речевой форме, каждый из которых содержит, соответственно: запоминающее устройство 5 (фиг.1) и 17 (фиг.2) с энергонезависимой памятью, преимущественно, флэш-памятью; средства 2 (фиг.1) и 14 (фиг.2) речевого ввода (с использованием микрофона 26) аналогового аудиосигнала в речевой форме на 1-м, входном (фиг.1) или 3-м, выходном (фиг.2) языке в соответствующий терминал 1 и 13 связи, функционально являющийся передающим; аналого-цифровой преобразователь (АЦП) для обработки речевой формы аналогового аудиосигнала (входящего через микрофон 26) в кодовую текстовую форму на 1-м, входном, языке (фиг.1) или на 3-м, выходном, языке (фиг.2); программно-организованную систему перевода кодовой формы текста на 1-м, входном, языке или на 3-м, выходном, языке в кодовую форму текста на 3-м, выходном, языке или на 1-м, входном, языке, соответственно; тексто-речевой преобразователь 7 (фиг.1) и 19 (фиг.2), функционально являющийся средством цифро-аналогового преобразования (ЦАП) и обработки текста на 3-м, выходном, языке (фиг.2) или на 1-м, входном, языке (фиг.1), соответственно, в аналоговый аудиосигнал в речевой форме; а также средства вывода речевой формы аналогового аудиосигнала на 1-м, входном, языке (фиг.1) или 3-м, выходном, языке (фиг.2), соответственно, через терминал связи 1 и 13, функционально являющийся на данный момент принимающим, с использованием синтезатора речи 8 и 20 на 1-м, входном, языке (фиг.1) или на 3-м, выходном, языке (фиг.2), соответственно.This system includes at least two transceiver terminals 1 and 13 for communication of an incoming analog audio signal in speech form, each of which contains, respectively: a storage device 5 (Fig. 1) and 17 (Fig. 2) with non-volatile memory, mainly flash memory; means 2 (FIG. 1) and 14 (FIG. 2) of voice input (using microphone 26) of an analog audio signal in speech form in the 1st, input (FIG. 1) or 3rd, output (FIG. 2) language to the corresponding communication terminal 1 and 13, which is functionally transmitting; analog-to-digital converter (ADC) for processing the speech form of an analog audio signal (input via microphone 26) into a code text form in the 1st, input, language (Fig. 1) or in the 3rd, output, language (Fig. 2) ; a software-organized system for translating the code form of text in the 1st, input, language or in the 3rd, output, language into the code form of the text in the 3rd, output, language or in the 1st, input, language, respectively; a text-to-speech converter 7 (Fig. 1) and 19 (Fig. 2), which is functionally a means of digital-to-analog conversion (DAC) and text processing on the 3rd, output, language (Fig. 2) or on the 1st, input, language (figure 1), respectively, into an analog audio signal in speech form; as well as means for outputting the speech form of the analog audio signal in the 1st, input, language (Fig. 1) or 3rd, output, language (Fig. 2), respectively, through the communication terminal 1 and 13, which is currently receiving functionally using a speech synthesizer 8 and 20 in the 1st, input, language (Fig. 1) or in the 3rd, output, language (Fig. 2), respectively.

Терминал связи 1 или 13, функционально являющийся передающим, оснащен средством 3 (фиг.1) и 15 (фиг.12 верификации устной речи владельца терминала относительно ее письменной формы, структурируемой посредством данного терминала 1 и 13 связи). Структура системы перевода программно организованной кодовой формы текста на 1-м, входном, языке в текст на 3-м, выходном, языке и текста на 3-м, выходном, языке в текст на 1-м, входном, языке организована двухуровневой. Причем первый уровень входит в состав терминала связи, функционально являющегося передающим и оснащен средством преобразования кодовой формы текста на 1-м, входном, языке (фиг.1) или кодовой формы текста на 3-м, выходном, языке (фиг.2) в кодовую форму текста на общепринятом в мировой практике 2-м, промежуточном английском языке; а второй уровень входит в состав терминала связи, функционально являющегося на данный момент времени принимающим и оснащен средством преобразования кодовой формы текста на 2-м, промежуточном английском языке в кодовую форму текста на 3-м (фиг.2), выходном, языке или в кодовую форму текста на 1-м, входном, языке (фиг.1).The communication terminal 1 or 13, which is functionally transmitting, is equipped with means 3 (FIG. 1) and 15 (FIG. 12 of verifying the speech of the owner of the terminal regarding its writing structured by this communication terminal 1 and 13). The structure of the system for translating a programmatically organized code form of text in the 1st, input, language into text in the 3rd, output, language and text in the 3rd, output, language into text in the 1st, input, language is organized two-level. Moreover, the first level is part of the communication terminal, functionally transmitting and equipped with a means of converting the code form of the text in the 1st, input, language (Fig. 1) or the code form of the text in the 3rd, output, language (Fig. 2) the code form of the text in the generally accepted in the world practice 2nd, intermediate English; and the second level is part of the communication terminal, functionally currently receiving and equipped with means for converting the code form of text in the 2nd, intermediate English into the code form of the text in the 3rd (figure 2), output, language or the code form of the text in the 1st, input, language (figure 1).

В электронной приемопередающей системе в качестве передающего и принимающего терминала 1 и 13 функционально могут использоваться два и более пространственно удаленных один от другого структурно идентичных терминала связи (фиг.1 и 2), виртуально скоммутированных посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет». В данном случае система функционирует как приемо-передатчик между удаленными абонентами связи с функцией синхронного перевода и ввода-вывода информации в речевой форме.In the electronic transceiver system, two or more spatially remote structurally identical communication terminals (FIGS. 1 and 2) which are virtually switched by means of the global GSM mobile communication system and the Internet can functionally be used as transmitting and receiving terminals 1 and 13; . In this case, the system functions as a transceiver between remote communication subscribers with the function of simultaneous translation and input-output of information in speech form.

Структура электронной приемопередающей системы может предусматривать в передающем и принимающем терминалах дополнительные альтернативные средства 10, 11, 12 и 22, 23, 24 и 25 ввода-вывода информации в текстовой и/или речевой форме на соответствующих языках.The structure of the electronic transceiver system may include additional alternative means 10, 11, 12 and 22, 23, 24 and 25 of input / output of information in text and / or speech form in the corresponding languages in the transmitting and receiving terminals.

В электронной приемопередающей системе в качестве терминалов 1 и 13 связи могут быть использованы мобильные электронные устройства (преимущественно сотовый мобильный телефон), адаптированные к глобальной системе мобильной связи стандарта GSM и сети «Интернет».In an electronic transceiver system, mobile electronic devices (primarily a cellular mobile phone) adapted to the global GSM and Internet mobile communication system can be used as communication terminals 1 and 13.

В электронной приемопередающей системе в качестве терминалов 1 и 13 связи могут быть использованы мобильные электронные устройства (преимущественно персональный компьютер типа «ноутбук»), адаптированные к сети «Интернет».In the electronic transceiver system, mobile electronic devices (mainly a personal computer such as a “laptop”) adapted to the Internet can be used as communication terminals 1 and 13.

Алгоритмы программной организации соответствующих структур рассматриваемых технических решений представлены на фиг.3 и 4.Algorithms for the software organization of the corresponding structures of the considered technical solutions are presented in figures 3 and 4.

Таким образом, согласно настоящим изобретениям обеспечивается возможность исключения наиболее проблемных средств (блоков) системы синхронного перевода («речь в речь»).Thus, according to the present invention, it is possible to exclude the most problematic means (blocks) of the simultaneous translation system (“speech to speech”).

А именно исключены средства распознавания родной, но акустико-лингвистически озвученной различными (носителями родного языка) индивидами речи, и особенно чужой разноязычной и разновариантной (с акустико-лингвистической точки зрения) речи.Namely, the means of recognizing native, but acoustically linguistically voiced by various (native speakers) individuals of speech, and especially alien multilingual and multivariate (from the acoustic-linguistic point of view) speech, are excluded.

Взамен этого в каждом индивидуальном терминале связи предусмотрен блок верификации речи владельца, т.е. однократно настраиваемое владельцем и программно адаптируемое к эталонным данным (т.е. исходной базе данных, заложенной в энергонезависимую флеш-память) программно реализуемое средство преобразования устной речи владельца терминала в кодовую письменную форму (текст).Instead, each individual communication terminal is provided with an owner’s speech verification unit, i.e. once configurable by the owner and programmatically adaptable to the reference data (i.e., the original database embedded in a non-volatile flash memory), a software-implemented means of converting the spoken language of the terminal owner into code writing (text).

Средства перевода «текст в текст» достаточно хорошо известны из современного уровня техники, промышленно реализованы с высокой степенью достоверности электронной версии перевода и интенсивно развиваются на современном этапе развития электронной техники (например, система «Travados», система машинного (электронного) перевода «Promt»).Means of translation “text to text” are well known from the modern level of technology, are industrially implemented with a high degree of reliability of the electronic version of the translation and are intensively developed at the present stage of development of electronic equipment (for example, the “Travados” system, the machine (electronic) system “Promt” )

Системы озвучивания различных кодовых электронных текстов на различных языках также достаточно хорошо развиты. Таким образом, в заявленной архитектуре перевода снимается основная на сегодняшний день проблема в автоматизации процесса электронного синхронного перевода «речь в речь» и взамен предлагается архитектура перевода, основанная на использовании сравнительно простых и достаточно эффективно действующих на сегодняшний день унифицированных электронных блоков (функциональных средств).Sound systems for various code electronic texts in various languages are also quite well developed. Thus, the claimed translation architecture removes the main problem today in automating the process of electronic simultaneous translation “speech to speech” and instead proposes a translation architecture based on the use of relatively simple and fairly effective unified electronic units (functional tools) operating today.

Процесс осуществления всех переводов через один промежуточный английский язык, в целом существенно упрощает разработку задачи перевода, т.к. исключается разработка специальных программируемых средств и программного обеспечения для осуществления перекрестных переводов, обеспечивающих множественную комбинаторику совокупности различных языков и языковых диалектов.The process of making all translations through one intermediate English language, in general, greatly simplifies the development of the translation task, because it excludes the development of special programmable tools and software for cross-translation, providing multiple combinatorics of a combination of different languages and language dialects.

Таким образом, согласно настоящим изобретениям для осуществления кодированного текста с одного языка на другой в соответствующем терминале связи для приемопередачи кодированной текстовой информации на множестве различных языков необходимо иметь для любого языка (из упомянутого множества) программный блок (программируемое средство) текстового перевода входящего (первого) языка на английский язык в текстовой форме и обратно.Thus, according to the present invention, for the implementation of encoded text from one language to another in the corresponding communication terminal for the transmission of encoded text information in a variety of different languages, it is necessary to have a program unit (programmable tool) for text translation of the incoming (first) for any language (from the said set) Language to English in text form and vice versa.

Настоящие изобретения могут быть широко использованы в среде владельцев мобильных телефонов, в рамках реализации функций преобразования разговорной речи на языке владельца телефона (терминала) в озвученную разговорную речь и/или письменную информацию (текст) на языке его иностранного собеседника.The present invention can be widely used among mobile phone owners, in the framework of the implementation of the functions of converting colloquial speech in the language of the owner of the phone (terminal) into voiced colloquial speech and / or written information (text) in the language of his foreign interlocutor.

Для этого, как ранее указывалось, преобразователь устной речи владельца терминала настраивается на характерные акустико-лингвистические особенности голоса владельца, путем аудиовоспроизведения владельцем специальных и/или произвольных текстов, появляющихся на дисплее терминала связи в процессе верификации характерных признаков голоса владельца. Алгоритм процесса верификации подробно раскрыт в предыдущем описании и графически отображен на фиг.3.For this, as previously indicated, the owner’s oral speech transducer is tuned to the characteristic acoustic-linguistic features of the owner’s voice by means of the audio reproduction by the owner of special and / or arbitrary texts appearing on the display of the communication terminal during verification of the characteristic features of the owner’s voice. The algorithm of the verification process is described in detail in the previous description and graphically displayed in Fig.3.

Кодовое преобразование письменного текста с языка владельца терминала в письменный текст на языке собеседника проводится с помощью программ электронного машинного перевода, преимущественно, Translation Memory, например, компании «Trades». Из максимально полных и постоянно пополняемых баз переводов, хранящихся, например, в системе «Интернет» с использованием мощных процессоров, также находящихся в данной системе, может проводиться выборка текстов, максимально совпадающих с текстом перевода. При этом сначала проводится поиск предложения целиком или группы предложений, выделенных паузой при произнесении текста. Если предложения целиком или группы предложений в задействованных базах переводов нет, то проводится разбиение предложения или их группы на две, три и более частей, вплоть до отдельных слов и слогов до момента обнаружения в задействованной базе данных идентичного фонема (аналога). Однако вышеуказанное отсутствующее предложение в целом в дальнейшем должно быть дополнено в исходную базу переводов.Code conversion of written text from the language of the terminal owner to written text in the interlocutor's language is carried out using electronic machine translation programs, mainly Translation Memory, for example, Trades. From the most complete and constantly updated translation databases stored, for example, in the Internet system using powerful processors also located in this system, texts can be selected that match the translation text as closely as possible. At the same time, a search is made for the whole sentence or a group of sentences highlighted by a pause when pronouncing the text. If there is no whole sentence or sentence group in the involved translation databases, then a sentence or a group of sentences is divided into two, three or more parts, up to individual words and syllables until an identical phoneme (analogue) is found in the involved database. However, the above missing sentence as a whole should be further supplemented in the original translation database.

Второе преобразование кодовой текстовой формы с промежуточного английского языка в кодовую текстовую форму на языке собеседника (владельца второго терминала), если собеседник не владеет английским языком, проводится аналогично первому письменному преобразованию с использованием баз переводов.The second conversion of the code text form from intermediate English into the code text form in the language of the interlocutor (owner of the second terminal), if the interlocutor does not speak English, is carried out similarly to the first written conversion using translation databases.

В процессе преобразования кодовой текстовой формы сообщения на третьем выходном языке в выходной аудиосигнал в виде устной речи на языке владельца 2-го терминала может осуществляться преобразование голоса диктора программы озвучивания текста с целью приближения акустико-лингвистических особенностей голоса диктора к соответствующим характерным признакам голоса владельца 1-го терминала.In the process of converting a code text form of a message in a third output language into an audio output signal in the form of spoken language in the language of the owner of the 2nd terminal, the voice of the speaker of the text-reading program can be converted in order to approximate the acoustic-linguistic features of the voice of the speaker to the corresponding characteristic features of the voice of the owner 1- th terminal.

Таким образом, заявленные технические решения могут быть широко использованы в области электроники, в частности в способах и системах (устройствах) для перевода фраз с первого языка на второй, в частности, но не исключительно, в таких системах, которые вырабатывают речевой аудиосигнал на выходе (на выходном языке) из речевого аудиосигнала на входе (на входном языке).Thus, the claimed technical solutions can be widely used in the field of electronics, in particular in methods and systems (devices) for translating phrases from the first language into the second, in particular, but not exclusively, in such systems that generate an audio speech signal at the output ( in the output language) from the speech audio signal at the input (in the input language).

Таким образом, вышеизложенные сведения свидетельствуют о выполнении при использовании заявленных технических решений следующей совокупности условий:Thus, the above information indicates the fulfillment of the following set of conditions when using the claimed technical solutions:

- объекты, воплощающие заявленные технические решения, при их осуществлении предназначены для использования в области электроники для реализации известными мобильными терминалами связи функции синхронного перевода речевой информации с одного языка на другой.- objects that embody the claimed technical solutions, when implemented, are intended for use in the field of electronics for the implementation by well-known mobile communication terminals of the function of simultaneous translation of voice information from one language to another.

- для заявленных объектов в том виде, как они охарактеризованы в независимых пунктах нижеизложенной формулы, подтверждена возможность их осуществления с помощью вышеописанных в заявке или известных из уровня техники на дату приоритета средств и методов;- for the declared objects as described in the independent clauses of the formula below, the possibility of their implementation using the means and methods described above or known from the prior art on the priority date is confirmed;

- объекты, воплощающие заявленные технические решения, при их осуществлении способны обеспечить достижение усматриваемого заявителем технического результата.- objects that embody the claimed technical solutions, when implemented, are able to ensure the achievement of the technical result perceived by the applicant.

Следовательно, заявленные объекты соответствуют требованию условия патентоспособности «промышленная применимость» по действующему законодательству.Therefore, the claimed objects comply with the requirements of the patentability condition "industrial applicability" under applicable law.

Claims (6)

1. Способ организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы, согласно которому в запоминающее устройство терминала связи электронной системы, функционально являющегося передающим, вводят входящий аналоговый аудиосигнал в речевой форме на входном языке; программно осуществляют аналого-цифровую обработку и преобразование речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; программно обеспечивают электронный перевод кодовой формы текста на входном языке в кодовую форму текста на выходном языке; преобразуют кодовую форму текста на выходном языке в аналоговый аудиосигнал в речевой форме на выходном языке и выводят речевую форму аналогового аудиосигнала на выходном языке через терминал связи, функционально являющийся принимающим, отличающийся тем, что процесс электронного перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке организуют в два этапа; причем на первом этапе, который осуществляют посредством терминала связи, функционально являющегося передающим, обеспечивают преобразования кодовой формы текста на входном языке в кодовую форму текста на втором промежуточном языке, преимущественно английском; на втором этапе, который осуществляют посредством терминала связи, функционально являющегося принимающим, обеспечивают преобразования кодовой формы текста на втором промежуточном языке в кодовую форму текста на выходном языке; при этом перевод текста в текст как на первом, так и на втором из вышеуказанных этапов организуют как машинный поиск отдельных словосочетаний, предложений или групп предложений из базы данных переводов, предварительно выполненных профессиональными переводчиками и хранящимися в мобильной сети, например «Интернет»; кроме того, упомянутую базу данных переводов мобильной сети постоянно пополняют преимущественно в интерактивном режиме посредством того, что текстовые формы в виде отдельных словосочетаний, предложений или групп предложений, которые запрашиваются для перевода, но отсутствуют в базе переводов, выставляют с учетом частоты их использования в открытый доступ и предлагают для перевода, например, на коммерческой основе профессиональным переводчикам; а также перед началом использования терминала связи, функционально являющегося передающим, на данном терминале однократно осуществляют верификацию устной речи владельца данного терминала связи относительно ее письменной формы, программно структурируемой посредством данного терминала связи, для чего программным путем осуществляют выделение и запоминание данных о характерных акустико-лингвистических признаках устной речи владельца этого терминала для обеспечения их программной адаптации относительно эталонных фонемов, заложенных в базе данных этого терминала.1. A method of organizing a simultaneous translation of oral speech from one language to another by means of an electronic transceiver system, according to which an input analog audio signal is input into speech memory in an input language into a storage device of a communication terminal of an electronic system functionally transmitting; software carry out analog-to-digital processing and converting the speech form of an analog audio signal into a code text form in the input language; software provide electronic translation of the code form of the text in the input language into the code form of the text in the output language; convert the code form of the text in the output language into an analog audio signal in a speech form in the output language and output the speech form of the analog audio signal in the output language through a communication terminal, which is functionally receiving, characterized in that the process of electronic translation of the code form of the text in the input language into the code text form in the output language they organize in two stages; moreover, in the first stage, which is carried out by means of a communication terminal that is functionally transmitting, the code form of the text in the input language is converted to the code form of the text in the second intermediate language, mainly English; at the second stage, which is carried out by means of a communication terminal, which is functionally receiving, provide the conversion of the code form of the text in the second intermediate language into the code form of the text in the output language; at the same time, the translation of text into text at both the first and second of the above stages is organized as a machine search for individual phrases, sentences or groups of sentences from a translation database previously performed by professional translators and stored on a mobile network, for example, the Internet; in addition, the mentioned database of mobile network translations is constantly replenished mainly in the interactive mode by means of the fact that text forms in the form of separate phrases, sentences or groups of sentences that are requested for translation but are not in the translation database are set up taking into account their frequency of use in the open access and offer for translation, for example, on a commercial basis to professional translators; as well as before starting to use the communication terminal, which is functionally transmitting, the terminal verifies once the spoken language of the owner of the given communication terminal regarding its written form programmatically structured by means of this communication terminal, for which the data on the characteristic acoustic-linguistic data are extracted and stored signs of spoken language by the owner of this terminal to ensure their software adaptation with respect to reference phonemes laid down in the database of this terminal. 2. Способ по п.1, отличающийся тем, что верификацию устной речи владельца терминала связи осуществляют следующим образом: владелец озвучивает заложенный в программу и/или произвольный текст; озвученный и введенный в запоминающее устройство терминала связи аналоговый аудиосигнал в речевой форме программным путем анализируют по характерным акустико-лингвистическим признакам и программно адаптируют их применительно к эталонному текстовому аналогу речи - фонему, заложенному в базе данных этого терминала; сохраняют информацию об отсутствующих в эталонной базе данных терминала характерных акустико-лингвистических признаках владельца; затем владелец озвучивает произвольный текст и проверяет его письменную форму, отображаемую на дисплее терминала связи; после чего осуществляют зацикливание этих двух методов верификации речи владельца в операционной системе терминала, для чего владелец терминала озвучивает текст с дисплея терминала связи, аналоговую версию которого программно преобразуют в письменную форму и сравнивают с исходным текстом на дисплее; при совпадении первоначального и полученного из аналоговой версии произнесенного владельцем текста процесс верификации данного текста завершается; при несовпадении указанных текстов программно обеспечивают переход к следующему тексту для верификации, заложенному в памяти этого терминала связи, и дублируют вышеописанный процесс верификации.2. The method according to claim 1, characterized in that the verification of the oral speech of the owner of the communication terminal is as follows: the owner voices the program and / or arbitrary text; the analogue audio signal voiced and entered into the storage device of the communication terminal in a speech form is analyzed programmatically by characteristic acoustic-linguistic features and programmatically adapted to the reference textual analogue of speech - the phoneme stored in the database of this terminal; save information about the characteristic acoustic-linguistic features of the owner that are absent in the terminal’s reference database; then the owner voices an arbitrary text and checks its written form displayed on the display of the communication terminal; after which these two methods of verifying the speech of the owner are looped in the terminal operating system, for which the terminal owner reads the text from the display of the communication terminal, the analog version of which is programmatically converted to writing and compared with the source text on the display; if the original and received from the analog version of the text pronounced by the owner coincide, the verification process of this text ends; if these texts do not coincide, the software provides the transition to the next verification text stored in the memory of this communication terminal and duplicates the verification process described above. 3. Способ по п.1, отличающийся тем, что в качестве передающего и принимающего терминала функционально используют один и тот же терминал связи.3. The method according to claim 1, characterized in that the same communication terminal is functionally used as the transmitting and receiving terminal. 4. Способ по п.1, отличающийся тем, что в качестве передающего и принимающего терминала функционально используют пространственно удаленные один от другого конструктивно идентичные терминалы связи, которые виртуально коммутируют посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет».4. The method according to claim 1, characterized in that the transmitting and receiving terminals functionally use structurally identical communication terminals that are spatially remote from one another and which virtually switch by means of a global mobile communication system of the GSM standard and the Internet. 5. Способ по п.1, отличающийся тем, что в качестве терминала связи используют мобильное электронное устройство, адаптированное к глобальной системе мобильной связи стандарта GSM и сети «Интернет».5. The method according to claim 1, characterized in that a mobile electronic device adapted to the global GSM mobile communication system and the Internet is used as a communication terminal. 6. Способ по п.1, отличающийся тем, что в качестве терминала связи используют мобильное электронное устройство, преимущественно персональный компьютер типа «ноутбук», адаптированное к сети «Интернет». 6. The method according to claim 1, characterized in that as the communication terminal use a mobile electronic device, mainly a personal computer of the type "laptop", adapted to the network "Internet".
RU2008137398/08A 2008-09-19 2008-09-19 Method to organise synchronous interpretation of oral speech from one language to another by means of electronic transceiving system RU2419142C2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2008137398/08A RU2419142C2 (en) 2008-09-19 2008-09-19 Method to organise synchronous interpretation of oral speech from one language to another by means of electronic transceiving system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2008137398/08A RU2419142C2 (en) 2008-09-19 2008-09-19 Method to organise synchronous interpretation of oral speech from one language to another by means of electronic transceiving system

Publications (2)

Publication Number Publication Date
RU2008137398A RU2008137398A (en) 2010-03-27
RU2419142C2 true RU2419142C2 (en) 2011-05-20

Family

ID=42137951

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008137398/08A RU2419142C2 (en) 2008-09-19 2008-09-19 Method to organise synchronous interpretation of oral speech from one language to another by means of electronic transceiving system

Country Status (1)

Country Link
RU (1) RU2419142C2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2585974C2 (en) * 2014-01-31 2016-06-10 Владимир Александрович Елин Method of providing communication between people speaking in different languages
RU2604984C1 (en) * 2015-05-25 2016-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Translating service based on electronic community

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2010124351A (en) * 2010-06-17 2011-12-27 Владимир Витальевич Мирошниченко (RU) INTERACTION OF VIRTUAL MIMIC AND / OR VIRTUAL GESTICULATION WITH A MESSAGE
RU2010151821A (en) * 2010-12-17 2012-06-27 Виталий Евгеньевич Пилкин (RU) METHOD FOR AUTOMATED TRANSFER OF INFORMATION
WO2012091608A1 (en) * 2010-12-31 2012-07-05 Nizienko Yuri Konstantinovich Electronic receiving and transmitting system with the function of synchronous translation of verbal speech from one language into another
US8606682B1 (en) 2012-02-21 2013-12-10 Bank Of America Corporation System for providing a correlation index
CN105912531B (en) * 2016-02-03 2021-03-12 冯忠 Translation system and method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2585974C2 (en) * 2014-01-31 2016-06-10 Владимир Александрович Елин Method of providing communication between people speaking in different languages
RU2604984C1 (en) * 2015-05-25 2016-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Translating service based on electronic community

Also Published As

Publication number Publication date
RU2008137398A (en) 2010-03-27

Similar Documents

Publication Publication Date Title
US7593842B2 (en) Device and method for translating language
RU2419142C2 (en) Method to organise synchronous interpretation of oral speech from one language to another by means of electronic transceiving system
US7552045B2 (en) Method, apparatus and computer program product for providing flexible text based language identification
US8862478B2 (en) Speech translation system, first terminal apparatus, speech recognition server, translation server, and speech synthesis server
EP2571023B1 (en) Machine translation-based multilingual human-machine dialog
US9761219B2 (en) System and method for distributed text-to-speech synthesis and intelligibility
US20020103646A1 (en) Method and apparatus for performing text-to-speech conversion in a client/server environment
Ince Digital Speech Processing: Speech Coding, Synthesis and Recognition
CN101008942A (en) Machine translation device and method thereof
EP1463031A1 (en) Front-end architecture for a multi-lingual text-to-speech system
WO2005074630A2 (en) Multilingual text-to-speech system with limited resources
CN111161695B (en) Song generation method and device
Gibbon et al. Spoken language system and corpus design
CN113380221A (en) Chinese and English mixed speech synthesis method and device, electronic equipment and storage medium
CN113380222A (en) Speech synthesis method, speech synthesis device, electronic equipment and storage medium
RU80603U1 (en) ELECTRONIC TRANSMISSION SYSTEM WITH THE FUNCTION OF SYNCHRONOUS TRANSLATION OF ORAL SPEECH FROM ONE LANGUAGE TO ANOTHER
CN115578995B (en) Speech synthesis method, system and storage medium for speech dialogue scene
CN115762471A (en) Voice synthesis method, device, equipment and storage medium
CN116504223A (en) Speech translation method and device, electronic equipment and storage medium
US11620978B2 (en) Automatic interpretation apparatus and method
WO2012091608A1 (en) Electronic receiving and transmitting system with the function of synchronous translation of verbal speech from one language into another
KR102376552B1 (en) Voice synthetic apparatus and voice synthetic method
Sakti et al. Distributed speech translation technologies for multiparty multilingual communication
CN111489742A (en) Acoustic model training method, voice recognition method, device and electronic equipment
CN111916062A (en) Voice recognition method, device and system

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20100618

FZ9A Application not withdrawn (correction of the notice of withdrawal)

Effective date: 20100901

MM4A The patent is invalid due to non-payment of fees

Effective date: 20120920