RU2419142C2 - Method to organise synchronous interpretation of oral speech from one language to another by means of electronic transceiving system - Google Patents
Method to organise synchronous interpretation of oral speech from one language to another by means of electronic transceiving system Download PDFInfo
- Publication number
- RU2419142C2 RU2419142C2 RU2008137398/08A RU2008137398A RU2419142C2 RU 2419142 C2 RU2419142 C2 RU 2419142C2 RU 2008137398/08 A RU2008137398/08 A RU 2008137398/08A RU 2008137398 A RU2008137398 A RU 2008137398A RU 2419142 C2 RU2419142 C2 RU 2419142C2
- Authority
- RU
- Russia
- Prior art keywords
- text
- language
- communication terminal
- speech
- terminal
- Prior art date
Links
Images
Abstract
Description
Настоящее изобретение относится к области электроники, в частности к способам и системам (устройствам) для перевода фраз с первого языка на второй, в частности, но не исключительно, к таким системам, которые вырабатывают речевой аудиосигнал на выходе (на выходном, языке) из речевого аудиосигнала на входе (на входном, языке).The present invention relates to the field of electronics, in particular to methods and systems (devices) for translating phrases from the first language into the second, in particular, but not exclusively, to such systems that generate a speech audio signal at the output (at the output, language) from the speech audio signal at the input (at the input, language).
Длительное время идет поиск электронной системы, которая могла бы в автоматическом режиме осуществлять синхронный перевод, в частности устный, с одного языка на другой. Однако несмотря на огромные успехи в современном уровне развития вычислительной техники (в частности, средств и методов распознавания и синтеза речи за последние годы) такие системы обладают существенными недостатками в области верификации речи владельца передающего мобильного терминала и, как следствие, в части достоверности передаваемой информации после ее перевода и озвучивания на выходе принимающего терминала.For a long time, there has been a search for an electronic system that could automatically carry out simultaneous translation, in particular interpretation, from one language to another. However, despite the huge successes in the modern level of development of computer technology (in particular, speech recognition and synthesis tools and synthesis in recent years), such systems have significant shortcomings in the field of speech verification of the owner of a transmitting mobile terminal and, as a consequence, in terms of the reliability of transmitted information after its translation and scoring at the output of the receiving terminal.
В области автоматического электронного перевода текста на первом языке в текст на втором языке были проведены интенсивные исследовательские работы с применением современных вычислительных систем и программного обеспечения. Однако помимо очень ограниченных применений (например, перевод прогнозов погоды) ранее отсутствовали электронные системы синхронного перевода речи с первого языка на второй, способные автоматически в режиме реального времени осуществлять точные переводы и, следовательно, заменять профессиональных переводчиков. Как правило, проблемы перевода речи усугубляются ошибками в распознавании речи (т.е. ее верификации) на основе дополнительной информации для верификации, содержащейся в акустико-лингвистических особенностях речи, характерных для каждого индивидуума (абонента связи).In the field of automatic electronic translation of text in the first language into text in the second language, intensive research was carried out using modern computer systems and software. However, in addition to very limited applications (for example, translating weather forecasts), previously there were no electronic systems for simultaneous translation of speech from the first language to the second, capable of automatically performing accurate translations in real time and, therefore, replacing professional translators. Typically, speech translation problems are exacerbated by errors in speech recognition (i.e., its verification) based on additional information for verification contained in the acoustic-linguistic features of speech characteristic of each individual (communication subscriber).
Существующие пакеты автоматического электронного перевода текстов по тем или иным причинам неэффективны и не отвечают требованиям, предъявляемым к системам речевого перевода. Большая часть таких пакетов разработана в помощь профессиональным переводчикам и результат работы таких пакетов должен быть отредактирован, прежде чем он примет приемлемый вид на том языке, на который осуществляется перевод. Большинство таких пакетов является диалоговыми или интерактивными и работают в относительно медленном режиме пакетной обработки и ни один из них не способен работать в реальном масштабе времени с речевым вводом информации.Existing packages of automatic electronic translation of texts for one reason or another are inefficient and do not meet the requirements for speech translation systems. Most of these packages are designed to help professional translators, and the result of such packages must be edited before it takes on an acceptable look in the language into which the translation is being done. Most of these packages are interactive or interactive and operate in a relatively slow mode of batch processing, and none of them is capable of working in real time with voice input of information.
Кроме того, пакеты программ, использующиеся для текстового перевода, неподвижны, поскольку идиомы и другие исключения из правил вполне могут вызвать ошибку на выходе, т.е. пользователь не имеет полной гарантии, что полученный текст переведен правильно. Существующие системы, кроме того, весьма интенсивно используют центральный процессор, что делает их дорогими в эксплуатации и, следовательно, недоступными для широкого круга индивидуальных абонентов сетей мобильной связи.In addition, the software packages used for text translation are immobile, since idioms and other exceptions to the rules may well cause an output error, i.e. the user does not have full guarantee that the received text is translated correctly. Existing systems, in addition, very intensively use the central processor, which makes them expensive to operate and, therefore, inaccessible to a wide range of individual subscribers of mobile communication networks.
Из уровня техники известен способ организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы, согласно которому в запоминающее устройство терминала связи электронной системы (функционально являющегося передающим) вводят входящий аналоговый аудиосигнал в речевой форме на входном языке; осуществляют аналого-цифровую обработку и преобразование речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; обеспечивают электронный перевод кодовой формы текста на входном языке в кодовую форму текста на выходном языке; преобразуют кодовую форму текста на выходном языке в аналоговый аудиосигнал в речевой форме на выходном языке и выводят речевую форму аналогового аудиосигнала на выходном языке через терминал связи, функционально являющийся принимающим (RU №2070734, 1996 г.).The prior art method of organizing the simultaneous translation of oral speech from one language to another by means of an electronic transceiver system, according to which the input analog audio signal in speech form in the input language is input into the storage device of the communication terminal of the electronic system (functionally transmitting); carry out analog-to-digital processing and converting the speech form of an analog audio signal into a code text form in the input language; provide electronic translation of the code form of the text in the input language into the code form of the text in the output language; convert the code form of the text in the output language into an analog audio signal in speech form in the output language and output the speech form of the analog audio signal in the output language through the communication terminal, which is functionally receiving (RU No. 2070734, 1996).
Из уровня техники также известна электронная приемопередающая система с функцией синхронного перевода фраз из нескольких слов с одного языка на другой, включающая приемопередающую структуру входящего аналогового аудиосигнала в речевой форме на одном языке в выходящий аналоговый аудиосигнал в речевой форме на другом языке, которая содержит: энергонезависимое запоминающее устройство (преимущественно флэш-память); средства ввода речевой формы аналогового аудиосигнала на входном языке в передающий терминал связи упомянутой структуры; средства аналого-цифрового преобразования и обработки речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; систему перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке; средства цифро-аналогового преобразования и обработки кодовой формы текста на выходном языке в аналоговый аудиосигнал в речевой форме, а также средства вывода речевой формы аналогового аудиосигнала на выходном языке через принимающий терминал связи (RU №2070734, 1996 г.).The prior art also knows an electronic transceiver system with the function of synchronously translating phrases from several words from one language to another, including the transceiving structure of the incoming analog audio signal in speech form in one language into the output analog audio signal in speech form in another language, which contains: non-volatile memory device (mainly flash memory); speech input means of an analog audio signal in an input language into a transmitting communication terminal of said structure; means for analog-to-digital conversion and processing of the speech form of an analog audio signal into a code text form in the input language; a system for translating a code form of text in an input language into a code form of text in an output language; means for digital-to-analog conversion and processing of the code form of the text in the output language into an analog audio signal in speech form, as well as means for outputting the speech form of an analog audio signal in the output language through a receiving communication terminal (RU No. 2070734, 1996).
К недостаткам данных известных из уровня техники решений (как в отношении объекта изобретения «способ», так и в отношении объекта изобретения «устройство») следует отнести относительно низкие функциональные и технические характеристики, вследствие значительных погрешностей преобразования речевой формы вводимого в передающий терминал аудиосигнала в кодовую текстовую форму.The disadvantages of the data of solutions known from the prior art (both in relation to the subject matter of the invention “method” and in relation to the subject matter of the invention “device”) include relatively low functional and technical characteristics due to significant errors in the conversion of the speech form of the audio signal input into the transmitting terminal into a code signal text form.
В качестве еще одного недостатка данных известных из уровня техники решений целесообразно отметить необходимость оснащения передающего терминала (при передачи информации на удаленный, принимающий терминал) запоминающим устройством с достаточно большим объемом памяти, в особенности при осуществлении приемопередачи с одного входного языка на несколько выходных языков, поскольку весь процесс текстового перевода с одного языка (входного) на другой (выходной) осуществляется в пределах операционной системы (микропроцессора) передающего терминала, вследствие чего в памяти данного терминала должна содержаться расширенная номенклатура словарей, в том числе и для редко используемых языков, например хинди.As another drawback of the data of the solutions known from the prior art, it is advisable to note the need to equip the transmitting terminal (when transmitting information to the remote receiving terminal) with a memory device with a sufficiently large amount of memory, especially when transmitting from one input language to several output languages, since the whole process of text translation from one language (input) to another (output) is carried out within the operating system (microprocessor) transmitting t terminal, as a result of which the memory of this terminal should contain an expanded nomenclature of dictionaries, including for rarely used languages, such as Hindi.
Таким образом, основным техническим результатом, реализуемым посредством заявленных изобретений, является повышение точности преобразования входящего в передающий терминал аудиосигнала в речевой форме в кодированную текстовую форму на входном языке при обеспечении возможности применения в данном терминале запоминающего устройства с относительно небольшим объемом памяти, за счет необходимости перевода кодовой текстовой формы входного аудиосигнала всегда на один и тот же промежуточный английский язык.Thus, the main technical result realized by the claimed inventions is to increase the accuracy of converting the speech signal input to the transmitting terminal into a coded text form in the input language, while providing the possibility of using a memory device with a relatively small amount of memory in this terminal, due to the need for translation the code text form of the input audio signal is always in the same intermediate English language.
Указанный технический результат в отношении объекта изобретения «способ» достигается посредством того, что в способе организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы, согласно которому в запоминающее устройство терминала связи электронной приемопередающей системы, функционально являющегося передающим, вводят входящий аналоговый аудиосигнал в речевой форме на входном языке; программно осуществляют аналого-цифровую обработку и преобразование речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; программно обеспечивают электронный перевод кодовой формы текста на входном языке в кодовую форму текста на выходном языке; преобразуют кодовую форму текста на выходном языке в аналоговый аудиосигнал в речевой форме на выходном языке и выводят речевую форму аналогового аудиосигнала на выходном языке через терминал связи, функционально являющийся принимающим, согласно изобретению в качестве электронной приемопередающей системы используют структуру с, по меньшей мере, двумя независимыми структурно идентичными терминалами связи; процесс электронного перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке организуют в два этапа; причем на первом этапе, который осуществляют посредством терминала связи, функционально являющегося в данный момент времени передающим, обеспечивают преобразования кодовой формы текста на входном языке в кодовую форму текста на промежуточном английском языке; на втором этапе, который осуществляют посредством терминала связи, функционально являющегося в данный момент времени принимающим, обеспечивают преобразования кодовой формы текста на промежуточном английском языке в кодовую форму текста на выходном языке; причем перед началом использования терминала связи, функционально являющегося передающим, на данном терминале однократно осуществляют верификацию устной речи владельца данного терминала связи относительно ее письменной формы, программно структурируемой посредством данного терминала связи, для чего программным путем осуществляют выделение и запоминание данных о характерных акустико-лингвистических признаках устной речи владельца этого терминала для обеспечения их программной адаптации относительно эталонных фонемов, заложенных в базе данных этого терминала.The indicated technical result with respect to the subject matter of the invention, the “method” is achieved by the fact that in the method of organizing the simultaneous translation of oral speech from one language into another by means of an electronic transceiver system, according to which an input analog audio signal in speech form in the input language; software carry out analog-to-digital processing and converting the speech form of an analog audio signal into a code text form in the input language; software provide electronic translation of the code form of the text in the input language into the code form of the text in the output language; convert the code form of the text in the output language into an analog audio signal in speech form in the output language and output the speech form of the analog audio signal in the output language through a communication terminal that is functionally receiving, according to the invention, a structure with at least two independent ones is used as an electronic transceiver system structurally identical communication terminals; the process of electronic translation of the code form of the text in the input language into the code form of the text in the output language is organized in two stages; moreover, in the first stage, which is carried out by means of a communication terminal, which is functionally currently transmitting, the code form of the text in the input language is converted to the code form of the text in intermediate English; at the second stage, which is carried out by means of a communication terminal, which is functionally currently receiving, provide the conversion of the code form of the text in intermediate English into the code form of the text in the output language; moreover, before using the communication terminal, which is functionally transmitting, the terminal verifies once the spoken language of the owner of the given communication terminal regarding its written form, programmatically structured by means of this communication terminal, for which the data on the characteristic acoustic-linguistic features are selected and stored oral speech of the owner of this terminal to ensure their software adaptation with respect to reference phonemes laid down in the database of this terminal.
В качестве передающего и принимающего терминалов функционально используют пространственно удаленные один от другого структурно идентичные терминалы связи, которые виртуально коммутируют посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет».As transmitting and receiving terminals, structurally identical structurally identical communication terminals are functionally used that are virtually switched by means of a global mobile communication system of the GSM standard and the Internet.
Технический результат в отношении объекта изобретения «устройство» достигается посредством того, что в электронной приемопередающей системе с функцией синхронного перевода устной речи с одного языка на другой, включающую приемопередающую структуру входящего аналогового аудиосигнала в речевой форме на одном языке в выходящий аналоговый аудиосигнал в речевой форме на другом языке, которая содержит: энергонезависимое запоминающее устройство; средства ввода речевой формы аналогового аудиосигнала на входном языке в передающий терминал связи упомянутой структуры; средства аналого-цифрового преобразования и обработки речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; систему перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке; средства цифро-аналогового преобразования и обработки кодовой формы текста на выходном языке в аналоговый аудиосигнал на этом же языке в речевой форме, а также средства вывода речевой формы аналогового аудиосигнала сигнала на выходном языке через принимающий терминал связи, согласно изобретению приемопередающая структура включает, по меньшей мере, два независимых, пространственно удаленных, структурно идентичных терминала связи; структура терминала связи, функционально являющегося передающим, оснащена средством верификации устной речи владельца терминала относительно ее письменной формы, программно структурируемой посредством данного терминала; структура системы перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке организована двухуровневой; причем первый уровень оснащен средством перевода кодовой формы текста на входном языке в кодовую форму текста на промежуточном английском языке, а второй уровень - средством перевода кодовой формы текста на промежуточном английском языке в кодовую форму текста на выходном языке.The technical result in relation to the object of the invention “device” is achieved by the fact that in an electronic transceiver system with the function of simultaneous translation of oral speech from one language to another, including the transceiver structure of the incoming analog audio signal in speech form in one language into the output analog audio signal in speech form on another language that contains: non-volatile storage device; speech input means of an analog audio signal in an input language into a transmitting communication terminal of said structure; means for analog-to-digital conversion and processing of the speech form of an analog audio signal into a code text form in the input language; a system for translating a code form of text in an input language into a code form of text in an output language; means for digital-to-analog conversion and processing of the code form of the text in the output language into an analog audio signal in the same language in speech form, as well as means for outputting the speech form of the analog audio signal in the output language through the receiving communication terminal, according to the invention, the transceiver structure includes at least , two independent, spatially remote, structurally identical communication terminals; the structure of the communication terminal, which is functionally transmitting, is equipped with a means of verifying the oral speech of the owner of the terminal regarding its written form, programmatically structured by means of this terminal; the structure of the system for translating the code form of text in the input language into the code form of the text in the output language is organized two-level; moreover, the first level is equipped with a means of translating the code form of text in the input language into the code form of the text in intermediate English, and the second level is equipped with the means of translating the code form of the text in intermediate English into the code form of the text in the output language.
Проведенный заявителем анализ уровня техники, включающий поиск по патентным и научно-техническим источникам информации и выявление источников, содержащих сведения об аналогах заявленных изобретений, позволил установить, что не обнаружены аналоги, характеризующиеся признаками и связями между ними, идентичными всем существенным признакам заявленных технических решений, а выбранный из выявленных аналогов прототип, как наиболее близкий по совокупности признаков аналог, позволил выявить совокупность существенных (по отношению к усматриваемому заявителем техническому результату) отличительных признаков в заявленных объектах изобретения, изложенных в формуле изобретения.The analysis of the prior art by the applicant, including a search by patent and scientific and technical sources of information and identification of sources containing information about analogues of the claimed inventions, made it possible to find that no analogues were found that are characterized by signs and relationships between them, identical to all the essential features of the claimed technical solutions, and the prototype selected from the identified analogues, as the analogue closest in terms of the totality of features, made it possible to identify the essential set (in relation to proposed by the applicant the technical result) of the distinguishing features in the claimed objects of the invention set forth in the claims.
Следовательно, заявленные технические решения соответствуют условию патентоспособности «новизна» по действующему законодательству.Therefore, the claimed technical solutions meet the condition of patentability "novelty" under the current law.
Для проверки соответствия заявленных изобретений требованию условию патентоспособности «изобретательский уровень» заявитель провел дополнительный поиск известных технических решений с целью выявления признаков, совпадающих с отличительными от прототипа признаками заявленных изобретений, результаты которого показывают, что заявленные изобретения не следует для специалиста явным образом из известного уровня техники, поскольку из уровня техники, определенного заявителем, не выявлено влияние предусматриваемых существенными признаками заявленных изобретений преобразований на достижение усматриваемого заявителем технического результата.To verify the conformity of the claimed inventions with the patentability requirement “inventive step”, the applicant conducted an additional search for known technical solutions in order to identify features that match the distinctive features of the claimed inventions, the results of which show that the claimed invention does not explicitly follow from the prior art , since the level of technology determined by the applicant has not revealed the impact of the essential by the claimed inventions of transformations to achieve the technical result perceived by the applicant.
В частности, заявленными изобретениями не предусматриваются следующие преобразования известных объектов-прототипов:In particular, the claimed inventions do not provide for the following transformations of known prototype objects:
- дополнение известного объекта каким-либо известным признаком, присоединяемым к нему по известным правилам, для достижения технического результата, в отношении которого установлено влияние именно таких дополнений;- addition of a well-known object by any well-known sign, attached to it according to known rules, to achieve a technical result, in respect of which the influence of such additions is established;
- замена какого-либо признака известного объекта другим известным признаком для достижения технического результата, в отношении которого установлено влияние именно такой замены;- replacement of any sign of a known object with another well-known sign to achieve a technical result, in respect of which the influence of such a replacement is established;
- исключение какого-либо признака известного объекта с одновременным исключением обусловленной наличием этого признака функции и достижением при этом обычного для такого исключения результата;- the exclusion of any sign of a known object with the simultaneous exclusion due to the presence of this sign of the function and the achievement of the usual result for this exclusion;
- увеличение количества однотипных признаков в известном объекте для усиления технического результата, обусловленного наличием в объекте именно таких признаков;- an increase in the number of similar features in a known object to enhance the technical result due to the presence of just such signs in the object;
- выполнение известного объекта или его части из известного материала для достижения технического результата, обусловленного известными свойствами материала;- the implementation of a known object or part of it from a known material to achieve a technical result due to the known properties of the material;
- создание объекта, включающего известные признаки, выбор которых и связь между ними осуществлены на основании известных правил и достигаемый при этом технический результат обусловлен только известными свойствами признаков этого объекта и связей между ними.- the creation of an object that includes known features, the choice of which and the relationship between them are based on known rules and the technical result achieved in this case is due only to the known properties of the features of this object and the relationships between them.
Следовательно, заявленные изобретения соответствует требованию условия патентоспособности «изобретательский уровень» по действующему законодательству.Therefore, the claimed invention meets the requirement of the patentability condition "inventive step" under applicable law.
Изобретения поясняется чертежами.The invention is illustrated by drawings.
Фиг.1 - блок-схема 1-го терминала связи, функционирующего в режиме приема-передачи в паре со 2-м пространственно удаленным терминалом связи (тонкими линиями с прозрачными стрелками условно продублирован входящий со 2-го терминала канал связи).Figure 1 - block diagram of the 1st communication terminal, operating in the transmit-receive mode paired with the 2nd spatially remote communication terminal (thin lines with transparent arrows conditionally duplicated the incoming communication channel from the 2nd terminal).
Фиг.2 - блок-схема 2-го терминала связи, функционирующего в режиме приема-передачи в паре с 1-м пространственно удаленным терминалом связи.Figure 2 is a block diagram of a 2nd communication terminal operating in a transmit-receive mode paired with a 1st spatially remote communication terminal.
Фиг.3 - алгоритм функционирования системы (средства) верификации устной речи владельца терминала.Figure 3 - algorithm of the functioning of the system (means) of verbal verification of the owner of the terminal.
Фиг.4 - алгоритм функционирования электронной приемопередающей системы с пространственно удаленными 1-м и 2-м структурно аналогичными терминалами связи.Figure 4 - algorithm of the operation of the electronic transceiver system with spatially remote 1st and 2nd structurally similar communication terminals.
На чертежах некоторые существенные блоки и средства коммуникации (такие как кнопочная панель, аккумулятор, флеш-накопитель /флеш-память/, цифровой микропроцессор и др.) условно не показаны, поскольку они являются общеизвестными и их функциональная принадлежность к рассматриваемым приемопередающим системам неоспорима, к тому же они не являются принципиальными объектами заявленных изобретений (см., например, RU №2324296 C1).In the drawings, some essential blocks and means of communication (such as a keypad, battery, flash drive / flash memory /, digital microprocessor, etc.) are not conventionally shown, since they are well-known and their functional affiliation with the considered transceiver systems is undeniable, moreover, they are not principal objects of the claimed inventions (see, for example, RU No. 224296 C1).
На чертежах пунктиром условно изображены блоки и коммутационные связи, не являющиеся функционально необходимыми в рамках реализации настоящих изобретений.In the drawings, the dashed lines conventionally depict blocks and switching connections that are not functionally necessary in the framework of the implementation of the present inventions.
На чертежах функциональные блоки, средства и системы обозначены следующими позициями:In the drawings, functional blocks, means and systems are indicated by the following positions:
1 - 1-й терминал связи;1 - 1st communication terminal;
2 - средство речевого ввода информации на 1-м, входном, языке (для 1-го терминала 1 связи);2 - means of voice input of information in the 1st, input, language (for the 1st communication terminal 1);
3 - средство верификации речи на 1-м, входном, языке (для 1-го терминала 1 связи);3 - means of verifying speech in the 1st, input, language (for the 1st communication terminal 1);
4 - средство распознавания речи на 1-м, входном, языке (для 1-го терминала 1 связи);4 - means of speech recognition in the 1st, input, language (for the 1st communication terminal 1);
5 - устройство запоминающее (для 1-го терминала 1 связи);5 - storage device (for the 1st communication terminal 1);
6 - средство текстового перевода с 1-го языка (входного) на 2-й язык (промежуточный) - (для 1-го терминала 1 связи);6 - means of text translation from the 1st language (input) to the 2nd language (intermediate) - (for the 1st communication terminal 1);
7 - преобразователь тексто-речевой для 1-го, входного, языка (для 1-го терминала 1 связи);7 - text-to-speech converter for the 1st, input, language (for the 1st communication terminal 1);
8 - синтезатор речи на 1-м, входном, языке (для 1-го терминала 1 связи);8 - speech synthesizer in the 1st, input, language (for the 1st communication terminal 1);
9 - динамик (выход на 1-м, входном, языке для 1-го терминала 1 связи);9 - speaker (output on the 1st, input, language for the 1st communication terminal 1);
10 - средство альтернативного ввода информации в виде текста на 1-м, входном, языке (для 1-го терминала 1 связи);10 - means of alternative input of information in the form of text in the 1st, input, language (for the 1st communication terminal 1);
11 - средство подтверждения альтернативного ввода информации в виде текста на 1-м, входном, языке (для 1-го терминала 1 связи);11 - means for confirming alternative input of information in the form of text in the 1st, input, language (for the 1st communication terminal 1);
12 - средство подтверждения речевого ввода информации в виде текста на 1-м, входном, языке (для 1-го терминала 1 связи);12 - means for verifying voice input of information in the form of text in the 1st, input, language (for the 1st communication terminal 1);
13 - 2-й терминал связи;13 - 2nd communication terminal;
14 - средство речевого ввода информации на 3-м, выходном, языке (для 2-го терминала 13 связи)14 - means of voice input of information in the 3rd, output, language (for the 2nd communication terminal 13)
15 - средство верификации речи на 3-м, выходном, языке (для 2-го терминала 13 связи);15 - means of verifying speech in the 3rd, output, language (for the 2nd communication terminal 13);
16 - средство распознавания речи на 3-м, выходном, языке (для 2-го терминала 13 связи);16 - speech recognition means in the 3rd, output, language (for the 2nd communication terminal 13);
17 - запоминающее устройство (для 2-го терминала 13 связи);17 - storage device (for the 2nd communication terminal 13);
18 - средство текстового перевода с 3-го (выходного) языка на 2-й (промежуточный) язык (для 2-го терминала 13 связи);18 - means of text translation from the 3rd (output) language to the 2nd (intermediate) language (for the 2nd communication terminal 13);
19 - преобразователь тексто-речевой (для 2-го терминала 13 связи);19 - text-to-speech converter (for the 2nd communication terminal 13);
20 - синтезатор речи на 3-м, выходном, языке (для 2-го терминала 13 связи);20 - speech synthesizer in 3rd, output, language (for the 2nd communication terminal 13);
21 - динамик (выход на 3-м языке, выходном, для 2-го терминала 13 связи);21 - speaker (output in 3 languages, output, for the 2nd communication terminal 13);
22 - средство альтернативного ввода текста на 3-м, выходном, языке (для 2-го терминала 13 связи);22 - means of alternative text input in the 3rd, output, language (for the 2nd communication terminal 13);
23 - средство подтверждения альтернативного ввода текста на 3-м, выходном, языке (для 2-го терминала 13 связи);23 - means for confirming alternative text input in the 3rd, output, language (for the 2nd communication terminal 13);
24 - средство подтверждения речевого ввода на 3-м, выходном, языке (для 2-го терминала 13 связи);24 - means of verifying voice input in the 3rd, output, language (for the 2nd communication terminal 13);
25 - средство альтернативного вывода текста на 3-м, выходном, языке (для 2-го терминала 13 связи);25 - means of alternative text output in the 3rd, output, language (for the 2nd communication terminal 13);
26 - микрофон.26 is a microphone.
Заявленный способ организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы характеризуется следующими необходимыми и достаточными (существенными) признаками.The claimed method of organizing simultaneous translation of oral speech from one language to another by means of an electronic transceiver system is characterized by the following necessary and sufficient (essential) features.
Согласно заявленному способу в запоминающее устройство 5 (фиг.1), коммутационно связанное с аналого-цифровым преобразователем /АЦП/ 1-го терминала 1 связи электронной системы (функционально являющегося в данном рассмотрении - передающим), вводят входящий аналоговый аудиосигнал в речевой форме на входном языке. Затем посредством АЦП осуществляют аналого-цифровую обработку и преобразование речевой формы аналогового аудиосигнала в кодовую текстовую форму на 1-м, входном, языке, В процессе обмена информационными кодовыми сигналами (в текстовой форме) между 1-м терминалом 1 связи и вторым (принимающим) терминалом 13 обеспечивают электронный перевод кодовой текстовой формы на 1-м, входном, языке передающего 1-го терминала 1 в кодовую текстовую форму на 3-м, выходном, языке 2-го (принимающего) терминала 13. На конечном этапе приемопередачи преобразуют кодовую форму текста на 3-м, выходном, языке 2-го терминала 13 в аналоговый аудиосигнал в речевой форме на 3-м, выходном, языке этого 2-го терминала 13 (фиг.2), посредством синтезатора 20 речи и выводят речевую форму аналогового аудиосигнала на 3-м, выходном, языке через динамик 21 2-го терминала 13 связи (функционально являющегося, в рассматриваемом случае - принимающим).According to the claimed method, in the storage device 5 (Fig. 1), switching connected with the analog-to-digital converter / ADC / 1 terminal of the electronic system communication terminal 1 (functionally transmitting in this consideration), an input analog audio signal is inputted in speech form at the input language. Then, through the ADC, analog-to-digital processing and conversion of the speech form of an analog audio signal into a textual code form are carried out in the 1st, input, language. In the process of exchanging informational code signals (in text form) between the
Отличительными особенностями заявленного способа является следующее.Distinctive features of the claimed method is the following.
В качестве приемопередающей системы используют структуру с, по меньшей мере, двумя независимыми, структурно идентичными терминалами 1 и 13 связи.As a transceiver system, a structure with at least two independent, structurally
Процесс электронного перевода кодовой формы текста на 1-м, входном, языке в кодовую форму текста на 3-м, выходном языке организуют в два этапа:The process of electronic translation of the code form of the text in the 1st, input language into the code form of the text in the 3rd, output language is organized in two stages:
- на первом этапе (который осуществляют посредством терминала связи функционально являющегося в данный момент времени передающим) обеспечивают преобразования кодовой формы текста на входном (родном для владельца данного терминала) языке в кодовую форму текста на промежуточном английском языке;- at the first stage (which is carried out by means of a communication terminal which is functionally currently transmitting), the code form of the text in the input (native to the owner of this terminal) language is converted into the code form of the text in intermediate English;
- на втором этапе (который осуществляют посредством терминала связи, функционально являющегося в данный момент времени принимающим) обеспечивают преобразования кодовой формы текста на промежуточном английском языке в кодовую форму текста на выходном (родном для владельца данного терминала) языке.- at the second stage (which is carried out by means of a communication terminal, which is functionally currently receiving), the code form of the text in intermediate English is converted into the code form of the text in the output (native language for the owner of this terminal) language.
Причем, перед началом использования терминала связи, функционально являющегося передающим, на данном терминале однократно осуществляют верификацию устной речи владельца данного терминала связи относительно ее письменной формы, программно структурируемой посредством данного терминала связи. Для этого осуществляют выделение и запоминание данных о характерных акустико-лингвистических признаках устной речи владельца этого (передающего) терминала для осуществления программной адаптации их относительно эталонных фонемов, заложенных в базе данных этого (передающего) терминала.Moreover, before using the communication terminal, which is functionally transmitting, the terminal once verifies the speech of the owner of the given communication terminal regarding its written form, programmatically structured by means of this communication terminal. For this purpose, data on characteristic acoustic-linguistic features of oral speech of the owner of this (transmitting) terminal are extracted and stored for software adaptation of them relative to reference phonemes embedded in the database of this (transmitting) terminal.
Система автоматического перевода речь в речь структурно похожа на процесс профессионального перевода кинофильма. Так, вначале речь на языке оригинала переводят в текстовую форму также на языке оригинала, данный текст переводят в текстовую форму на языке проката фильма и затем актеры (носители языка проката фильма) озвучивают этот текст.A speech-to-speech automatic translation system is structurally similar to a professional movie translation process. So, first the speech in the original language is translated into a text form also in the original language, this text is translated into a text form in the film rental language and then the actors (native speakers of the film rental language) voice this text.
Совершенно очевидно, что процессы кодовых текстовых переводов согласно настоящему изобретению можно осуществлять и с использованием соответствующих баз данных из глобальной мировой сети «Интернет». Алгоритм подобной виртуальной коммутации терминала связи с упомянутыми базами данных широко известен, см., например, RU №2324296 С1.It is obvious that the code-based text translation processes according to the present invention can also be carried out using appropriate databases from the global Internet network. An algorithm for such virtual switching of the communication terminal with the mentioned databases is widely known, see, for example, RU No. 224296 C1.
В программном плане такие части процесса, как преобразование речи в текст и текста в речь, в настоящее время достаточно развиты для коммерческого применения, постоянно совершенствуются и могут использоваться как готовые блоки программы переводчика.Programmatically, parts of the process, such as the conversion of speech into text and text to speech, are currently sufficiently developed for commercial use, are constantly being improved and can be used as ready-made blocks of a translator program.
Основная трудность программы заключается в переводе текста в текст.The main difficulty of the program is the translation of text into text.
В предпочтительном варианте целесообразно организовать перевод текста в текст как машинный поиск групп предложений или отдельных предложений из базы переводов, выполненных профессиональными переводчиками и хранящимися в сети «Интернет». При этом для постоянного пополнения соответствующей базы переводов предложения, которые запрашиваются для перевода, но отсутствуют в базе переводов, выставляются с учетом их частотности в открытый доступ и могут предлагаться, например, для перевода на коммерческой основе переводчикам.In a preferred embodiment, it is advisable to organize the translation of text into text as a machine search for groups of sentences or individual sentences from a translation database made by professional translators and stored on the Internet. At the same time, for constant replenishment of the corresponding translation base, proposals that are requested for translation but are not in the translation base are exposed for open frequency taking into account their frequency and can be offered, for example, for translation on a commercial basis to translators.
При такой организации процесса перевод текста в текст будет выполнять целая армия переводчиков, связанная с пользователем сетью «Интернет», а электронно-вычислительная машина будет лишь проводить выбор соответствующего текста из базы заранее выполненных переводов. Предполагается наличие обратной связи пользователя с переводчиками, т.е. при неудовлетворительном переводе пользователь простым нажатием кнопки может послать соответствующую информацию в базу переводов.With this organization of the process, text-to-text translation will be carried out by a whole army of translators associated with the Internet user, and the electronic computer will only select the appropriate text from the database of pre-made translations. User feedback with translators is assumed, i.e. in case of unsatisfactory translation, the user can send the relevant information to the translation database with a simple click of a button.
В этом случае полнота базы переводов, их качество и скорость пополнения базы будут в основном зависеть от качества организации структуры Интернет-переводчиков, мотивации их активности и т.д.In this case, the completeness of the translation database, their quality and the speed of replenishment of the database will mainly depend on the quality of the organization of the structure of Internet translators, the motivation for their activity, etc.
В дальнейшем, по мере развития техники база переводов и программа-поисковик в каком-то виде при необходимости смогут храниться и автономно в мобильном терминале (телефоне) с функцией синхронного перевода «речь в речь».In the future, as the technology develops, the translation base and the search program in some form, if necessary, can be stored autonomously in a mobile terminal (telephone) with the function of simultaneous translation “speech to speech”.
В рамках настоящей заявки целесообразно раскрыть технический смысл терминов «процесс распознавания» и «процесс верификации» применительно к цифровой электронной технике (в частности, микропроцессорам, используемым в мобильных телефонных аппаратах /терминалах/ связи).In the framework of this application, it is advisable to disclose the technical meaning of the terms “recognition process” and “verification process” as applied to digital electronic equipment (in particular, microprocessors used in mobile telephones / terminals / communications).
«Процесс распознавания» - процесс обработки системой (средством) распознавания введенного в компьютер некоего аудиосигнала, например, речевого с характерными акустико-лингвистическими признаками, в результате чего система распознавания приписывает этому аудиосигналу и/или его характерным признакам программный (компьютерный) идентификационный код.“Recognition process” - the process of processing a system (means) of recognition of an audio signal introduced into a computer, for example, a speech signal with characteristic acoustic-linguistic features, as a result of which the recognition system assigns a program (computer) identification code to this audio signal and / or its characteristic features.
«Процесс верификации» - производимое человеком и/или заменяющим его устройством, и/или компьютерной программой сличение (определение адекватности) компьютерных кодов (символов) с аудиосигналом (например, в речевой форме) и/или с его характерными акустико-лингвистическими признаками, введенными в электронное устройство (например, компьютер, аппарат мобильной связи и т.п.).“Verification process” - a comparison made by a person and / or a device and / or computer program (determination of adequacy) of computer codes (symbols) with an audio signal (for example, in speech form) and / or with its characteristic acoustic-linguistic features introduced into an electronic device (e.g. computer, mobile phone device, etc.).
Разумно верификацию устной речи владельца терминалов 1 и 13 связи осуществлять следующим образом:It is reasonable to verify the oral speech of the owner of the
- владелец озвучивает заложенный в программу и/или произвольный текст;- the owner voices the program and / or arbitrary text embedded in the program;
- озвученный и введенный в запоминающее устройство 5, 17 соответствующего терминала связи аналоговый сигнал в речевой форме анализируют по характерным акустико-лингвистическим признакам и программно адаптируют их применительно к эталонному текстовому аналогу речи, заложенному в памяти (базе данных) этого терминала;- the analogue signal voiced and entered into the storage device 5, 17 of the corresponding communication terminal in speech form is analyzed by characteristic acoustic-linguistic features and programmatically adapt them as applied to the reference textual speech analogue stored in the memory (database) of this terminal;
- сохраняют информацию об отсутствующих в эталонной базе данных терминала характерных акустико-лингвистических признаках владельца;- save information about the characteristic acoustic-linguistic features of the owner that are absent in the reference database of the terminal;
- затем владелец озвучивает произвольный текст и проверяет его письменную форму, отображаемую на дисплее терминала связи;- then the owner voices an arbitrary text and checks its written form displayed on the display of the communication terminal;
- после чего осуществляют зацикливание этих двух методов верификации речи владельца между собой в операционной системе терминала, для чего владелец терминала озвучивает текст с дисплея терминала связи, аналоговую версию которого программно преобразуют в письменную форму и сравнивают с исходным текстом на дисплее;- after which these two methods of verifying the speech of the owner among themselves are looped in the terminal operating system, for which the owner of the terminal reads the text from the display of the communication terminal, the analog version of which is programmatically converted to writing and compared with the source text on the display;
- при совпадении первоначального и полученного из аналоговой версии произнесенного владельцем текста процесс верификации данного текста завершается;- if the original and received from the analogue version of the text pronounced by the owner coincide, the verification process of this text ends;
- при несовпадении указанных текстов программно обеспечивают переход к следующему тексту для верификации, заложенному в памяти этого терминала связи, и дублируют вышеописанный процесс верификации.- if these texts do not match, the software provides the transition to the next verification text stored in the memory of this communication terminal and duplicates the verification process described above.
Совершенно очевидно, что процесс верификации в заявленных изобретениях можно осуществлять и иными известными из уровня техники методами и средствами (см., например, патенты RU №2200369 и №2166207).It is completely obvious that the verification process in the claimed inventions can be carried out by other methods and means known from the prior art (see, for example, patents RU No. 2200369 and No. 2166207).
В качестве передающего и принимающего терминала 1 или 13 можно функционально использовать пространственно удаленные один от другого структурно идентичные терминалы 1 и 13 связи, которые виртуально коммутируют посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет».As the transmitting and receiving
В качестве терминала 1 или 13 связи допустимо использовать мобильное электронное устройство, адаптированное к глобальной системе мобильной связи стандарта GSM и сети «Интернет».As a
В качестве терминала 1 или 13 связи допустимо также использовать мобильное электронное устройство, преимущественно, персональный компьютер типа «ноутбук», адаптированное к сети «Интернет».It is also permissible to use a mobile electronic device as a
Оптимально, чтобы в передающей и принимающей структурах каждого терминала были бы предусмотрены дополнительные альтернативные средства ввода-вывода передаваемой информации в текстовой форме на соответствующих языках.It is optimal that in the transmitting and receiving structures of each terminal additional alternative means of input-output of the transmitted information in text form in the corresponding languages would be provided.
То есть структура терминалов 1 и 13 может быть дополнительно оснащена такими функциональными средствами, как: средство 10 альтернативного ввода информации в виде текста на 1-м, входном языке; средство 11 подтверждения альтернативного ввода информации в виде текста на 1-м, входном языке; средство подтверждения речевого ввода информации в виде речи на 1-м, входном языке; средство 25 альтернативного вывода информации в виде текста на 3-м, выходном, языке.That is, the structure of
Одним из конкретных частных приложений технической реализации заявленного способа является электронная приемопередающая система с функцией синхронного перевода устной речи с одного языка на другой между, по меньшей мере, двумя независимыми, пространственно удаленными, структурно идентичными 1-м терминалом 1 и вторым терминалом 13 (фиг.1 и 2).One of the particular private applications of the technical implementation of the claimed method is an electronic transceiver system with the function of simultaneous translation of oral speech from one language to another between at least two independent, spatially remote, structurally
Данная система включает, по меньшей мере, два приемопередающих терминала 1 и 13 связи входящего аналогового аудиосигнала в речевой форме, каждый из которых содержит, соответственно: запоминающее устройство 5 (фиг.1) и 17 (фиг.2) с энергонезависимой памятью, преимущественно, флэш-памятью; средства 2 (фиг.1) и 14 (фиг.2) речевого ввода (с использованием микрофона 26) аналогового аудиосигнала в речевой форме на 1-м, входном (фиг.1) или 3-м, выходном (фиг.2) языке в соответствующий терминал 1 и 13 связи, функционально являющийся передающим; аналого-цифровой преобразователь (АЦП) для обработки речевой формы аналогового аудиосигнала (входящего через микрофон 26) в кодовую текстовую форму на 1-м, входном, языке (фиг.1) или на 3-м, выходном, языке (фиг.2); программно-организованную систему перевода кодовой формы текста на 1-м, входном, языке или на 3-м, выходном, языке в кодовую форму текста на 3-м, выходном, языке или на 1-м, входном, языке, соответственно; тексто-речевой преобразователь 7 (фиг.1) и 19 (фиг.2), функционально являющийся средством цифро-аналогового преобразования (ЦАП) и обработки текста на 3-м, выходном, языке (фиг.2) или на 1-м, входном, языке (фиг.1), соответственно, в аналоговый аудиосигнал в речевой форме; а также средства вывода речевой формы аналогового аудиосигнала на 1-м, входном, языке (фиг.1) или 3-м, выходном, языке (фиг.2), соответственно, через терминал связи 1 и 13, функционально являющийся на данный момент принимающим, с использованием синтезатора речи 8 и 20 на 1-м, входном, языке (фиг.1) или на 3-м, выходном, языке (фиг.2), соответственно.This system includes at least two transceiver terminals 1 and 13 for communication of an incoming analog audio signal in speech form, each of which contains, respectively: a storage device 5 (Fig. 1) and 17 (Fig. 2) with non-volatile memory, mainly flash memory; means 2 (FIG. 1) and 14 (FIG. 2) of voice input (using microphone 26) of an analog audio signal in speech form in the 1st, input (FIG. 1) or 3rd, output (FIG. 2) language to the corresponding communication terminal 1 and 13, which is functionally transmitting; analog-to-digital converter (ADC) for processing the speech form of an analog audio signal (input via microphone 26) into a code text form in the 1st, input, language (Fig. 1) or in the 3rd, output, language (Fig. 2) ; a software-organized system for translating the code form of text in the 1st, input, language or in the 3rd, output, language into the code form of the text in the 3rd, output, language or in the 1st, input, language, respectively; a text-to-speech converter 7 (Fig. 1) and 19 (Fig. 2), which is functionally a means of digital-to-analog conversion (DAC) and text processing on the 3rd, output, language (Fig. 2) or on the 1st, input, language (figure 1), respectively, into an analog audio signal in speech form; as well as means for outputting the speech form of the analog audio signal in the 1st, input, language (Fig. 1) or 3rd, output, language (Fig. 2), respectively, through the communication terminal 1 and 13, which is currently receiving functionally using a speech synthesizer 8 and 20 in the 1st, input, language (Fig. 1) or in the 3rd, output, language (Fig. 2), respectively.
Терминал связи 1 или 13, функционально являющийся передающим, оснащен средством 3 (фиг.1) и 15 (фиг.12 верификации устной речи владельца терминала относительно ее письменной формы, структурируемой посредством данного терминала 1 и 13 связи). Структура системы перевода программно организованной кодовой формы текста на 1-м, входном, языке в текст на 3-м, выходном, языке и текста на 3-м, выходном, языке в текст на 1-м, входном, языке организована двухуровневой. Причем первый уровень входит в состав терминала связи, функционально являющегося передающим и оснащен средством преобразования кодовой формы текста на 1-м, входном, языке (фиг.1) или кодовой формы текста на 3-м, выходном, языке (фиг.2) в кодовую форму текста на общепринятом в мировой практике 2-м, промежуточном английском языке; а второй уровень входит в состав терминала связи, функционально являющегося на данный момент времени принимающим и оснащен средством преобразования кодовой формы текста на 2-м, промежуточном английском языке в кодовую форму текста на 3-м (фиг.2), выходном, языке или в кодовую форму текста на 1-м, входном, языке (фиг.1).The
В электронной приемопередающей системе в качестве передающего и принимающего терминала 1 и 13 функционально могут использоваться два и более пространственно удаленных один от другого структурно идентичных терминала связи (фиг.1 и 2), виртуально скоммутированных посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет». В данном случае система функционирует как приемо-передатчик между удаленными абонентами связи с функцией синхронного перевода и ввода-вывода информации в речевой форме.In the electronic transceiver system, two or more spatially remote structurally identical communication terminals (FIGS. 1 and 2) which are virtually switched by means of the global GSM mobile communication system and the Internet can functionally be used as transmitting and receiving
Структура электронной приемопередающей системы может предусматривать в передающем и принимающем терминалах дополнительные альтернативные средства 10, 11, 12 и 22, 23, 24 и 25 ввода-вывода информации в текстовой и/или речевой форме на соответствующих языках.The structure of the electronic transceiver system may include additional alternative means 10, 11, 12 and 22, 23, 24 and 25 of input / output of information in text and / or speech form in the corresponding languages in the transmitting and receiving terminals.
В электронной приемопередающей системе в качестве терминалов 1 и 13 связи могут быть использованы мобильные электронные устройства (преимущественно сотовый мобильный телефон), адаптированные к глобальной системе мобильной связи стандарта GSM и сети «Интернет».In an electronic transceiver system, mobile electronic devices (primarily a cellular mobile phone) adapted to the global GSM and Internet mobile communication system can be used as
В электронной приемопередающей системе в качестве терминалов 1 и 13 связи могут быть использованы мобильные электронные устройства (преимущественно персональный компьютер типа «ноутбук»), адаптированные к сети «Интернет».In the electronic transceiver system, mobile electronic devices (mainly a personal computer such as a “laptop”) adapted to the Internet can be used as
Алгоритмы программной организации соответствующих структур рассматриваемых технических решений представлены на фиг.3 и 4.Algorithms for the software organization of the corresponding structures of the considered technical solutions are presented in figures 3 and 4.
Таким образом, согласно настоящим изобретениям обеспечивается возможность исключения наиболее проблемных средств (блоков) системы синхронного перевода («речь в речь»).Thus, according to the present invention, it is possible to exclude the most problematic means (blocks) of the simultaneous translation system (“speech to speech”).
А именно исключены средства распознавания родной, но акустико-лингвистически озвученной различными (носителями родного языка) индивидами речи, и особенно чужой разноязычной и разновариантной (с акустико-лингвистической точки зрения) речи.Namely, the means of recognizing native, but acoustically linguistically voiced by various (native speakers) individuals of speech, and especially alien multilingual and multivariate (from the acoustic-linguistic point of view) speech, are excluded.
Взамен этого в каждом индивидуальном терминале связи предусмотрен блок верификации речи владельца, т.е. однократно настраиваемое владельцем и программно адаптируемое к эталонным данным (т.е. исходной базе данных, заложенной в энергонезависимую флеш-память) программно реализуемое средство преобразования устной речи владельца терминала в кодовую письменную форму (текст).Instead, each individual communication terminal is provided with an owner’s speech verification unit, i.e. once configurable by the owner and programmatically adaptable to the reference data (i.e., the original database embedded in a non-volatile flash memory), a software-implemented means of converting the spoken language of the terminal owner into code writing (text).
Средства перевода «текст в текст» достаточно хорошо известны из современного уровня техники, промышленно реализованы с высокой степенью достоверности электронной версии перевода и интенсивно развиваются на современном этапе развития электронной техники (например, система «Travados», система машинного (электронного) перевода «Promt»).Means of translation “text to text” are well known from the modern level of technology, are industrially implemented with a high degree of reliability of the electronic version of the translation and are intensively developed at the present stage of development of electronic equipment (for example, the “Travados” system, the machine (electronic) system “Promt” )
Системы озвучивания различных кодовых электронных текстов на различных языках также достаточно хорошо развиты. Таким образом, в заявленной архитектуре перевода снимается основная на сегодняшний день проблема в автоматизации процесса электронного синхронного перевода «речь в речь» и взамен предлагается архитектура перевода, основанная на использовании сравнительно простых и достаточно эффективно действующих на сегодняшний день унифицированных электронных блоков (функциональных средств).Sound systems for various code electronic texts in various languages are also quite well developed. Thus, the claimed translation architecture removes the main problem today in automating the process of electronic simultaneous translation “speech to speech” and instead proposes a translation architecture based on the use of relatively simple and fairly effective unified electronic units (functional tools) operating today.
Процесс осуществления всех переводов через один промежуточный английский язык, в целом существенно упрощает разработку задачи перевода, т.к. исключается разработка специальных программируемых средств и программного обеспечения для осуществления перекрестных переводов, обеспечивающих множественную комбинаторику совокупности различных языков и языковых диалектов.The process of making all translations through one intermediate English language, in general, greatly simplifies the development of the translation task, because it excludes the development of special programmable tools and software for cross-translation, providing multiple combinatorics of a combination of different languages and language dialects.
Таким образом, согласно настоящим изобретениям для осуществления кодированного текста с одного языка на другой в соответствующем терминале связи для приемопередачи кодированной текстовой информации на множестве различных языков необходимо иметь для любого языка (из упомянутого множества) программный блок (программируемое средство) текстового перевода входящего (первого) языка на английский язык в текстовой форме и обратно.Thus, according to the present invention, for the implementation of encoded text from one language to another in the corresponding communication terminal for the transmission of encoded text information in a variety of different languages, it is necessary to have a program unit (programmable tool) for text translation of the incoming (first) for any language (from the said set) Language to English in text form and vice versa.
Настоящие изобретения могут быть широко использованы в среде владельцев мобильных телефонов, в рамках реализации функций преобразования разговорной речи на языке владельца телефона (терминала) в озвученную разговорную речь и/или письменную информацию (текст) на языке его иностранного собеседника.The present invention can be widely used among mobile phone owners, in the framework of the implementation of the functions of converting colloquial speech in the language of the owner of the phone (terminal) into voiced colloquial speech and / or written information (text) in the language of his foreign interlocutor.
Для этого, как ранее указывалось, преобразователь устной речи владельца терминала настраивается на характерные акустико-лингвистические особенности голоса владельца, путем аудиовоспроизведения владельцем специальных и/или произвольных текстов, появляющихся на дисплее терминала связи в процессе верификации характерных признаков голоса владельца. Алгоритм процесса верификации подробно раскрыт в предыдущем описании и графически отображен на фиг.3.For this, as previously indicated, the owner’s oral speech transducer is tuned to the characteristic acoustic-linguistic features of the owner’s voice by means of the audio reproduction by the owner of special and / or arbitrary texts appearing on the display of the communication terminal during verification of the characteristic features of the owner’s voice. The algorithm of the verification process is described in detail in the previous description and graphically displayed in Fig.3.
Кодовое преобразование письменного текста с языка владельца терминала в письменный текст на языке собеседника проводится с помощью программ электронного машинного перевода, преимущественно, Translation Memory, например, компании «Trades». Из максимально полных и постоянно пополняемых баз переводов, хранящихся, например, в системе «Интернет» с использованием мощных процессоров, также находящихся в данной системе, может проводиться выборка текстов, максимально совпадающих с текстом перевода. При этом сначала проводится поиск предложения целиком или группы предложений, выделенных паузой при произнесении текста. Если предложения целиком или группы предложений в задействованных базах переводов нет, то проводится разбиение предложения или их группы на две, три и более частей, вплоть до отдельных слов и слогов до момента обнаружения в задействованной базе данных идентичного фонема (аналога). Однако вышеуказанное отсутствующее предложение в целом в дальнейшем должно быть дополнено в исходную базу переводов.Code conversion of written text from the language of the terminal owner to written text in the interlocutor's language is carried out using electronic machine translation programs, mainly Translation Memory, for example, Trades. From the most complete and constantly updated translation databases stored, for example, in the Internet system using powerful processors also located in this system, texts can be selected that match the translation text as closely as possible. At the same time, a search is made for the whole sentence or a group of sentences highlighted by a pause when pronouncing the text. If there is no whole sentence or sentence group in the involved translation databases, then a sentence or a group of sentences is divided into two, three or more parts, up to individual words and syllables until an identical phoneme (analogue) is found in the involved database. However, the above missing sentence as a whole should be further supplemented in the original translation database.
Второе преобразование кодовой текстовой формы с промежуточного английского языка в кодовую текстовую форму на языке собеседника (владельца второго терминала), если собеседник не владеет английским языком, проводится аналогично первому письменному преобразованию с использованием баз переводов.The second conversion of the code text form from intermediate English into the code text form in the language of the interlocutor (owner of the second terminal), if the interlocutor does not speak English, is carried out similarly to the first written conversion using translation databases.
В процессе преобразования кодовой текстовой формы сообщения на третьем выходном языке в выходной аудиосигнал в виде устной речи на языке владельца 2-го терминала может осуществляться преобразование голоса диктора программы озвучивания текста с целью приближения акустико-лингвистических особенностей голоса диктора к соответствующим характерным признакам голоса владельца 1-го терминала.In the process of converting a code text form of a message in a third output language into an audio output signal in the form of spoken language in the language of the owner of the 2nd terminal, the voice of the speaker of the text-reading program can be converted in order to approximate the acoustic-linguistic features of the voice of the speaker to the corresponding characteristic features of the voice of the owner 1- th terminal.
Таким образом, заявленные технические решения могут быть широко использованы в области электроники, в частности в способах и системах (устройствах) для перевода фраз с первого языка на второй, в частности, но не исключительно, в таких системах, которые вырабатывают речевой аудиосигнал на выходе (на выходном языке) из речевого аудиосигнала на входе (на входном языке).Thus, the claimed technical solutions can be widely used in the field of electronics, in particular in methods and systems (devices) for translating phrases from the first language into the second, in particular, but not exclusively, in such systems that generate an audio speech signal at the output ( in the output language) from the speech audio signal at the input (in the input language).
Таким образом, вышеизложенные сведения свидетельствуют о выполнении при использовании заявленных технических решений следующей совокупности условий:Thus, the above information indicates the fulfillment of the following set of conditions when using the claimed technical solutions:
- объекты, воплощающие заявленные технические решения, при их осуществлении предназначены для использования в области электроники для реализации известными мобильными терминалами связи функции синхронного перевода речевой информации с одного языка на другой.- objects that embody the claimed technical solutions, when implemented, are intended for use in the field of electronics for the implementation by well-known mobile communication terminals of the function of simultaneous translation of voice information from one language to another.
- для заявленных объектов в том виде, как они охарактеризованы в независимых пунктах нижеизложенной формулы, подтверждена возможность их осуществления с помощью вышеописанных в заявке или известных из уровня техники на дату приоритета средств и методов;- for the declared objects as described in the independent clauses of the formula below, the possibility of their implementation using the means and methods described above or known from the prior art on the priority date is confirmed;
- объекты, воплощающие заявленные технические решения, при их осуществлении способны обеспечить достижение усматриваемого заявителем технического результата.- objects that embody the claimed technical solutions, when implemented, are able to ensure the achievement of the technical result perceived by the applicant.
Следовательно, заявленные объекты соответствуют требованию условия патентоспособности «промышленная применимость» по действующему законодательству.Therefore, the claimed objects comply with the requirements of the patentability condition "industrial applicability" under applicable law.
Claims (6)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2008137398/08A RU2419142C2 (en) | 2008-09-19 | 2008-09-19 | Method to organise synchronous interpretation of oral speech from one language to another by means of electronic transceiving system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2008137398/08A RU2419142C2 (en) | 2008-09-19 | 2008-09-19 | Method to organise synchronous interpretation of oral speech from one language to another by means of electronic transceiving system |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2008137398A RU2008137398A (en) | 2010-03-27 |
RU2419142C2 true RU2419142C2 (en) | 2011-05-20 |
Family
ID=42137951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2008137398/08A RU2419142C2 (en) | 2008-09-19 | 2008-09-19 | Method to organise synchronous interpretation of oral speech from one language to another by means of electronic transceiving system |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2419142C2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2585974C2 (en) * | 2014-01-31 | 2016-06-10 | Владимир Александрович Елин | Method of providing communication between people speaking in different languages |
RU2604984C1 (en) * | 2015-05-25 | 2016-12-20 | Общество с ограниченной ответственностью "Аби Девелопмент" | Translating service based on electronic community |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2010124351A (en) * | 2010-06-17 | 2011-12-27 | Владимир Витальевич Мирошниченко (RU) | INTERACTION OF VIRTUAL MIMIC AND / OR VIRTUAL GESTICULATION WITH A MESSAGE |
RU2010151821A (en) * | 2010-12-17 | 2012-06-27 | Виталий Евгеньевич Пилкин (RU) | METHOD FOR AUTOMATED TRANSFER OF INFORMATION |
WO2012091608A1 (en) * | 2010-12-31 | 2012-07-05 | Nizienko Yuri Konstantinovich | Electronic receiving and transmitting system with the function of synchronous translation of verbal speech from one language into another |
US8606682B1 (en) | 2012-02-21 | 2013-12-10 | Bank Of America Corporation | System for providing a correlation index |
CN105912531B (en) * | 2016-02-03 | 2021-03-12 | 冯忠 | Translation system and method |
-
2008
- 2008-09-19 RU RU2008137398/08A patent/RU2419142C2/en not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2585974C2 (en) * | 2014-01-31 | 2016-06-10 | Владимир Александрович Елин | Method of providing communication between people speaking in different languages |
RU2604984C1 (en) * | 2015-05-25 | 2016-12-20 | Общество с ограниченной ответственностью "Аби Девелопмент" | Translating service based on electronic community |
Also Published As
Publication number | Publication date |
---|---|
RU2008137398A (en) | 2010-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7593842B2 (en) | Device and method for translating language | |
RU2419142C2 (en) | Method to organise synchronous interpretation of oral speech from one language to another by means of electronic transceiving system | |
US7552045B2 (en) | Method, apparatus and computer program product for providing flexible text based language identification | |
US8862478B2 (en) | Speech translation system, first terminal apparatus, speech recognition server, translation server, and speech synthesis server | |
EP2571023B1 (en) | Machine translation-based multilingual human-machine dialog | |
US9761219B2 (en) | System and method for distributed text-to-speech synthesis and intelligibility | |
US20020103646A1 (en) | Method and apparatus for performing text-to-speech conversion in a client/server environment | |
Ince | Digital Speech Processing: Speech Coding, Synthesis and Recognition | |
CN101008942A (en) | Machine translation device and method thereof | |
EP1463031A1 (en) | Front-end architecture for a multi-lingual text-to-speech system | |
WO2005074630A2 (en) | Multilingual text-to-speech system with limited resources | |
CN111161695B (en) | Song generation method and device | |
Gibbon et al. | Spoken language system and corpus design | |
CN113380221A (en) | Chinese and English mixed speech synthesis method and device, electronic equipment and storage medium | |
CN113380222A (en) | Speech synthesis method, speech synthesis device, electronic equipment and storage medium | |
RU80603U1 (en) | ELECTRONIC TRANSMISSION SYSTEM WITH THE FUNCTION OF SYNCHRONOUS TRANSLATION OF ORAL SPEECH FROM ONE LANGUAGE TO ANOTHER | |
CN115578995B (en) | Speech synthesis method, system and storage medium for speech dialogue scene | |
CN115762471A (en) | Voice synthesis method, device, equipment and storage medium | |
CN116504223A (en) | Speech translation method and device, electronic equipment and storage medium | |
US11620978B2 (en) | Automatic interpretation apparatus and method | |
WO2012091608A1 (en) | Electronic receiving and transmitting system with the function of synchronous translation of verbal speech from one language into another | |
KR102376552B1 (en) | Voice synthetic apparatus and voice synthetic method | |
Sakti et al. | Distributed speech translation technologies for multiparty multilingual communication | |
CN111489742A (en) | Acoustic model training method, voice recognition method, device and electronic equipment | |
CN111916062A (en) | Voice recognition method, device and system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA92 | Acknowledgement of application withdrawn (lack of supplementary materials submitted) |
Effective date: 20100618 |
|
FZ9A | Application not withdrawn (correction of the notice of withdrawal) |
Effective date: 20100901 |
|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20120920 |