JP2022152805A - Simultaneous translation system and method - Google Patents
Simultaneous translation system and method Download PDFInfo
- Publication number
- JP2022152805A JP2022152805A JP2021055726A JP2021055726A JP2022152805A JP 2022152805 A JP2022152805 A JP 2022152805A JP 2021055726 A JP2021055726 A JP 2021055726A JP 2021055726 A JP2021055726 A JP 2021055726A JP 2022152805 A JP2022152805 A JP 2022152805A
- Authority
- JP
- Japan
- Prior art keywords
- language
- translation
- editing
- text
- chunks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 323
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000004044 response Effects 0.000 claims abstract description 37
- 230000005236 sound signal Effects 0.000 claims description 8
- 230000010354 integration Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000014616 translation Effects 0.000 description 288
- 238000012545 processing Methods 0.000 description 51
- 239000000872 buffer Substances 0.000 description 43
- 238000012986 modification Methods 0.000 description 26
- 230000004048 modification Effects 0.000 description 26
- 230000011218 segmentation Effects 0.000 description 24
- 230000008569 process Effects 0.000 description 17
- 238000012937 correction Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 238000012805 post-processing Methods 0.000 description 6
- 238000012706 support-vector machine Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 231100000989 no adverse effect Toxicity 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Abstract
Description
この技術は同時翻訳システムに関し、特に、翻訳後の訳文を効率的に編集できる同時翻訳システム及び方法に関する。 This technology relates to a simultaneous translation system, and more particularly to a simultaneous translation system and method capable of efficiently editing translated sentences.
最近では、様々な国の映画、テレビドラマ、ニュース等を視聴する機会が爆発的に増えている。これはインターネットを初めとする、通信技術の発達による。また、ウェブ会議に代表されるように、異なる国の人達が通信により会話又は会議をしたり、講演を視聴したりするためのシステムも非常な勢いで広がっている。 Recently, opportunities to watch movies, TV dramas, news, etc. from various countries have increased explosively. This is due to the development of communication technology including the Internet. In addition, as typified by web conferencing, systems for people from different countries to have conversations or conferences by communication, and to listen to lectures are spreading at a very rapid pace.
こうしたシステムで問題になるのは言葉の問題である。同じ言語の人だけが参加する会話のような場合には問題はないが、異なる国の人々が参加する会議、特に3種類以上の言語が使用される会議等では、同時翻訳がない限り有益な結果を得ることは難しい。 The problem with these systems is language. There is no problem in conversations where only people of the same language participate, but in meetings where people from different countries participate, especially meetings where three or more languages are used, it is useful unless there is simultaneous translation. Results are hard to come by.
従来は、こうした会議では、ある言語と別のある言語との双方に堪能な同時通訳者を言語の組合わせの数だけ準備し、それら同時通訳者による通訳のうちのいずれかを各参加者が利用していた。 Conventionally, in such meetings, simultaneous interpreters who are fluent in both one language and another are provided for the number of language combinations, and each participant receives one of the interpretations by the simultaneous interpreters. was using.
しかし、国際的な会議の機会が増加したり、様々な国のニュース等のリアルタイム性のある番組を視聴したりする機会が増加することにより、このような同時通訳者を必要な数だけ準備することは不可能ではないにしても極めて困難になっている。 However, due to the increase in opportunities for international conferences and viewing of real-time programs such as news from various countries, it is necessary to prepare the necessary number of simultaneous interpreters. It has become extremely difficult, if not impossible.
そこで、このような同時翻訳に、最近になって著しい進歩を見せている音声認識と自動翻訳とを利用することが考えられる。最終的な出力をテキストではなく音声で行う場合には、自動翻訳の結果に対して音声合成を行えばよい。最近の音声認識及び自動翻訳は速度も早く、その精度も以前と比較してはるかに高くなっている。したがって、同時翻訳にこれらの技術を利用することは非常に有効である。 Therefore, for such simultaneous translation, it is conceivable to use speech recognition and automatic translation, which have recently made remarkable progress. If the final output is not text but speech, speech synthesis may be performed on the result of automatic translation. Recent speech recognition and automatic translation are faster and more accurate than ever before. Therefore, it is very effective to use these techniques for simultaneous translation.
自動翻訳を利用した同時翻訳装置として、後掲の特許文献1に開示されたものがある。特許文献1に開示された同時翻訳装置は、第1言語の音声の入力を受けて第2言語に自動翻訳し、その結果を第2言語の音声で出力する、というものである。特許文献1では、第1言語から第2言語へ、及び第2言語から第1言語への2方向の同時翻訳を同一の自動翻訳装置により行っている。
As a simultaneous translation device using automatic translation, there is one disclosed in
しかし、特許文献1に開示された自動翻訳装置を含め、自動翻訳装置を使用する場合、特に会議等、その場で相手の発言を聞き直すことが難しい場合には、最終的な翻訳については人手で編集すること、すなわちポストエディットが必要である。というのは、途中で誤訳があったり解釈が難しい表現があったりしたときに、利用者がその後の話を正しく理解できなくなったり、議事の進行が軌道をはずれてしまったりする可能性が高くなるためである。
However, when using an automatic translation device, including the automatic translation device disclosed in
特許文献1に開示された翻訳装置では、ポストエディットの必要性については全く開示がない。仮に特許文献1に開示された翻訳装置でポストエディットを行う場合には、翻訳前の音声又はテキストと翻訳後のテキストとを見比べて訳文の正確性を判断し、必要な修正を行う編集者が必要となる。
The translation device disclosed in
しかし、そのように2つの言語の双方に堪能な通訳者の数は少ない。したがって、特許文献1に開示された翻訳装置では、信頼性の高い同時翻訳を実現するのは難しいという問題がある。
However, the number of such interpreters who are fluent in both languages is small. Therefore, the translation device disclosed in
したがって、この発明の目的は、信頼性の高い同時翻訳を実現できる同時翻訳システム及び方法を提供することである。 SUMMARY OF THE INVENTION Accordingly, an object of the present invention is to provide a simultaneous translation system and method capable of realizing highly reliable simultaneous translation.
本発明の第1の局面に係る同時翻訳システムは、第1言語の音声を第2言語に翻訳する同時翻訳システムであって、第1言語の音声信号を音声認識し、チャンクに分割して第1言語のチャンクからなるチャンク列を出力するチャンク列出力手段と、チャンク列出力手段の出力する第1言語のチャンクの各々について、第2言語への自動翻訳を行い、第2言語のチャンクを出力する自動翻訳手段と、自動翻訳手段の出力する第2言語のチャンクと、当該第2言語のチャンクに対応する第1言語のチャンクとが対照できるように、かつ第2言語のチャンクに対する第1の編集者による編集ができるように表示する表示装置を持ち、編集終了の指示を受けたことに応答して、当該編集された第2言語のテキストを出力するポストエディット手段とを含む。 A simultaneous translation system according to a first aspect of the present invention is a simultaneous translation system for translating speech in a first language into a second language, wherein a speech signal in the first language is speech-recognized, divided into chunks, and A chunk string output means for outputting a chunk string composed of chunks in one language, and each chunk in the first language output by the chunk string output means is automatically translated into a second language, and a chunk in the second language is output. so that the automatic translation means, the second language chunk output by the automatic translation means, and the first language chunk corresponding to the second language chunk can be compared, and the first language chunk for the second language chunk and post-editing means for outputting the edited text in the second language in response to receiving an instruction to end editing, the display device having a display for editing by an editor.
好ましくは、同時翻訳システムは、第2言語のチャンクを第1言語に翻訳する逆翻訳手段をさらに含み、表示装置はさらに、逆翻訳手段による逆翻訳結果を表示する。 Preferably, the simultaneous translation system further includes back-translation means for translating chunks of the second language into the first language, and the display device further displays the back-translation result by the back-translation means.
より好ましくは、ポストエディット手段は、逆翻訳手段による翻訳結果と第2言語のチャンクの原文である第1言語のチャンクとの一致度を算出する一致度算出手段をさらに含み、表示装置はさらに、一致度を第2言語のチャンクの翻訳の信頼度として表示する。 More preferably, the post-editing means further includes matching degree calculation means for calculating a degree of matching between the result of translation by the reverse translation means and the chunk in the first language, which is the original text of the chunk in the second language, and the display device further includes: Display the degree of agreement as confidence in the translation of the chunk in the second language.
さらに好ましくは、同時翻訳システムは、第1及び第2のポストエディット手段を含み、同時翻訳システムはさらに、自動翻訳手段の出力を第1又は第2のポストエディット手段に振り分けて入力し、当該入力に対する第1及び第2のポストエディット手段の出力を正しい順番で統合する第1の統合手段を含む。 Further preferably, the simultaneous translation system includes first and second post-editing means, the simultaneous translation system further distributes the output of the automatic translation means to the first or second post-editing means and inputs the input and first merging means for merging in proper order the outputs of the first and second post-editing means for .
好ましくは、チャンク列出力手段は、第1言語の音声信号を音声認識し第1言語のテキストを出力する音声認識テキスト出力手段と、音声認識テキスト出力装置の出力する第1言語のテキストを自動的にチャンクに分割して第1言語のチャンク列を出力するテキスト自動分割手段と、テキスト自動分割手段が出力する第1言語のチャンク列を、第2の編集者によるチャンク編集ができるように表示する表示装置を持ち、第2の編集者による編集終了の指示に応答して、当該表示されている第1言語のチャンク列を出力するチャンク列編集手段とを含む。 Preferably, the chunk sequence output means includes speech recognition text output means for recognizing speech signals in the first language and outputting text in the first language, and automatic text output in the first language output by the speech recognition text output device. an automatic text dividing means for dividing into chunks and outputting a chunk string of the first language, and a chunk string of the first language outputted by the automatic text dividing means are displayed so that a second editor can edit the chunks. and chunk string editing means for outputting the displayed chunk string in the first language in response to an instruction to finish editing by the second editor.
より好ましくは、チャンク列出力手段は、第1及び第2のチャンク列編集手段を含み、同時翻訳システムはさらに、テキスト自動分割手段の出力を、第1又は第2のチャンク列編集手段に振り分けて入力し、当該入力に対する第1及び第2のチャンク列編集手段の出力を正しい順番で統合する第2の統合手段を含む。 More preferably, the chunk sequence output means includes first and second chunk sequence editing means, and the simultaneous translation system further distributes the output of the automatic text segmentation means to the first or second chunk sequence editing means. A second integration means for receiving the input and integrating the outputs of the first and second chunk sequence editing means for the input in the correct order.
さらに好ましくは、音声認識テキスト出力手段は、第1言語の音声信号を音声認識し第1言語のテキストを出力する音声認識装置と、音声認識装置の出力する第1言語のテキストを、第3の編集者による編集が可能なように表示する表示装置を持ち、編集終了の指示に応答して、表示されている第1言語のテキストをテキスト自動分割手段に入力するテキスト編集手段とを含む。 More preferably, the speech recognition text output means includes a speech recognition device for recognizing a speech signal in a first language and outputting a text in the first language; Text editing means for inputting the displayed text in the first language to the automatic text division means in response to an instruction to end editing.
好ましくは、音声認識テキスト出力手段は、第1及び第2のテキスト編集手段を含み、同時翻訳システムはさらに、音声認識装置の出力を、第1又は第2のテキスト編集手段に振り分けて入力し、当該入力に対する第1及び第2のテキスト編集手段の出力を正しい順番で統合する第3の統合手段を含む。 Preferably, the speech recognition text output means includes first and second text editing means, and the simultaneous translation system further distributes and inputs the output of the speech recognition device to the first or second text editing means, It includes third merging means for merging, in correct order, the outputs of the first and second text editing means for said input.
より好ましくは、チャンク列出力手段は、第1言語の音声信号を音声認識し第1言語のテキストを出力する音声認識手段と、音声認識装置の出力する第1言語のテキストを、第3の編集者による編集が可能なように表示する表示装置を持ち、編集終了の指示に応答して、表示されている第1言語のテキストを出力するテキスト編集手段と、テキスト編集手段の出力する第1言語のテキストをチャンクに分割し第1言語のチャンク列を出力するテキスト分割手段とを含む。 More preferably, the chunk string output means includes speech recognition means for recognizing speech signals in the first language and outputting text in the first language, and text in the first language output by the speech recognition device for performing third editing. text editing means for outputting the displayed text in the first language in response to an instruction to end editing; and the first language output by the text editing means. text segmentation means for segmenting the text of the language into chunks and outputting a sequence of chunks in the first language.
さらに好ましくは、チャンク列出力手段は、第1及び第2のテキスト編集手段を含み、同時翻訳システムはさらに、音声認識手段の出力を、第1又は第2のテキスト編集手段に振り分けて入力し、当該入力に対する第1及び第2のテキスト編集手段の出力を正しい順番で統合する第2の統合手段を含む。 More preferably, the chunk string output means includes first and second text editing means, and the simultaneous translation system further distributes the output of the speech recognition means to the first or second text editing means and inputs it, It includes second merging means for merging the outputs of the first and second text editing means for the input in the correct order.
本発明の第2の局面に係る同時翻訳方法は、第1言語の音声を第2言語に翻訳する同時翻訳方法であって、コンピュータが、第1言語の音声信号を音声認識し、チャンクに分割して第1言語のチャンクからなるチャンク列を出力するステップと、コンピュータが、第1言語のチャンクの各々について、第2言語への自動翻訳を行い、第2言語のチャンクを出力するステップと、コンピュータが、第2言語のチャンクと、当該第2言語のチャンクに対応する第1言語のチャンクとが対照できるように、かつ第2言語のチャンクに対する第1の編集者による編集ができるように表示装置に表示するステップと、コンピュータが第1の編集者による第2言語のチャンクに対する編集を受け付けるステップと、コンピュータが、編集終了の指示を受けたことに応答して、編集を受け付けるステップにおいて編集された第2言語のテキストを出力するステップとを含む。 A simultaneous translation method according to a second aspect of the present invention is a simultaneous translation method for translating speech in a first language into a second language, wherein a computer recognizes a speech signal in the first language and divides it into chunks. a step of automatically translating each of the first language chunks into a second language by a computer and outputting the second language chunks; A computer displays second language chunks and first language chunks corresponding to the second language chunks for comparison and for editing by a first editor on the second language chunks. a computer accepting edits to the chunk in the second language by the first editor; and a computer accepting edits in response to receiving an instruction to end editing. and outputting the second language text.
この発明の上記及び他の目的、特徴、局面及び利点は、添付の図面と関連して理解されるこの発明に関する次の詳細な説明から明らかとなるであろう。 The above and other objects, features, aspects and advantages of the present invention will become apparent from the following detailed description of the invention taken in conjunction with the accompanying drawings.
以下の説明及び図面では、同一の部品には同一の参照番号を付してある。したがって、それらについての詳細な説明は繰返さない。 In the following description and drawings, identical parts are provided with identical reference numerals. Therefore, detailed description thereof will not be repeated.
第1 第1実施形態
1 構成
(1)全体構成
図1は、この発明の第1実施形態に係る同時翻訳システム50の全体構成を示すブロック図である。図1を参照して、同時翻訳システム50は、ネットワーク62に接続され、ネットワーク62を通じた通信により同時翻訳システム50の各機能部を統括して制御する統括サーバ60と、いずれもネットワーク62に接続された音声認識装置64、音声認識結果編集装置66、発話分割装置68、翻訳単位編集装置70、自動翻訳装置72、翻訳結果編集装置74、音声合成装置76及び翻訳結果編集装置74による翻訳結果を逆翻訳するための自動翻訳装置78とを含む。
音声認識装置64、自動翻訳装置72及び78は、用途(分野及び言語の種類)に応じて利用可能なものであればどのようなものでもよい。自動翻訳装置78は自動翻訳装置72と原言語及び訳言語の関係を逆にしたものである必要がある。この実施形態では自動翻訳装置78を自動翻訳装置72とは別に設けている。しかしそのような実施形態に限定されず、自動翻訳装置72を用いて訳言語から原言語への翻訳を行うようにしてもよい。
The
音声認識結果編集装置66は、音声認識装置64が出力する音声認識結果のテキストをリアルタイムで受け、第1の編集者が編集して編集が完了したら直ちに発話分割装置68に向けて出力するためのものである。音声認識装置64の出力するテキストは音声認識結果なので、音声認識の誤りを含むことが多い。そのため原文を高い精度で自動翻訳するためには、このテキストに含まれる誤りを修正する必要がある。この修正を自動処理によって行ってもよいが、この実施形態では精度を重んじて人手で行う。
The speech recognition
音声認識結果編集装置66が行う処理は単純なテキストの編集なので、音声認識結果編集装置66は通常のコンピュータで十分であり、特に複雑な構成は不要である。
Since the processing performed by the speech recognition
発話分割装置68は、音声認識結果編集装置66が出力する発話単位に分割されたテキストを、翻訳が精度高く行えるよう、翻訳に適した、「チャンク」と呼ばれる単位に分割する機能を持つ。テキストをどこで分割してチャンクとするかは、言語により、また分野により異なる。発話の場合、一文が長くなることが多い。文が長いと一般に自動翻訳の精度が低くなることが知られている。そこでこのようにテキストをチャンクに分割しチャンク列として各チャンクについて翻訳することで自動翻訳の精度を高くできる。いわゆる「節」等がチャンクに相当する。
The
発話分割装置68は、テキストをどのようにチャンクに分割すればよいかをいわゆる機械学習による学習で判定するものとする。この学習には、多数の文について、各トークンで文をチャンクに分割するか否かを示すラベルを各トークンに付したものを訓練データとして準備する。この訓練データを用いてSVM(Support Vector Machine)を訓練することで発話分割装置68を実現できる。また、深層学習により学習したニューラルネットワーク(DNN)を用いることもできる。
The
翻訳単位編集装置70は、発話分割装置68が出力するチャンク列について、第2の編集者が手作業によりリアルタイムで編集し出力するためのものである。発話分割装置68を訓練することはできるが、その判定が常に人間の判断と完全に一致することはあり得ない。翻訳の原文を誤って分割すれば、当然に翻訳も誤ってしまう。そこでこの実施形態では、発話分割装置68による分割結果を第2の編集者が目視で確認し、必要であれば編集することとした。
The translation
なお発話分割装置68が行う処理は単純なテキストの編集(チャンクの分割及び統合、これを便宜的に「チャンク編集」と呼ぶものとする。)だけなので、発話分割装置68は通常のコンピュータで十分であり特に特に複雑な構成は不要である。
Since the processing performed by the
翻訳結果編集装置74は、自動翻訳装置72による翻訳結果を第3の編集者が目視で確認し、必要であれば修正するためである。この実施形態では、後述するように翻訳原文のテキストと自動翻訳装置72による訳文とを対照して表示する。したがって編集者は両者を対比して訳文の適否を容易に判定し必要であれば修正できる。またこの実施形態ではさらに、後述するように、編集者の要求に応じて翻訳結果の詳細を表示できる。詳細画面では、原文と訳文とに加え、訳文を原言語に逆翻訳した結果と、そのスコア(信頼度)とを表示する。したがって編集者はこれらを全て考慮した上で訳文の適否の判定と修正とを行える。
The translation result editing device 74 is for the third editor to visually check the translation result by the
(2)全体の処理構成
図2に、この同時翻訳システム50の全体の処理構成を示す。図2を参照して、原言語音声信号110が音声認識装置64の音声認識エンジン112に入力され、原言語テキスト114が出力される。原言語テキスト114は音声認識結果編集装置66を用いた第1の編集者による音声認識結果編集116を受けて音声認識の修正後の原言語テキスト118となる。修正後の原言語テキスト118は発話分割装置68の翻訳結果分割エンジン120に入力されチャンク列に分割された原言語テキスト122となり翻訳単位編集装置70に入力される。原言語テキスト122は翻訳単位編集装置70を用いた第2の編集者による翻訳単位分割編集124を受け、翻訳に適した正しいチャンク列に修正された原言語テキスト126となり自動翻訳エンジン128に入力される。
(2) Overall Processing Configuration FIG. 2 shows the overall processing configuration of this
自動翻訳エンジン128は、このように翻訳に適した正しいチャンク列に修正された原言語テキスト126に対して自動翻訳を行い、訳言語テキスト130を出力する。訳言語テキスト130にどの程度の誤りが存在するかは自動翻訳エンジン128の性能に依存する。しかし、入力が翻訳に適した正しいチャンク列に修正されているため、少なくともその精度はそうした修正がされていない場合と比較して高くなる。訳言語テキスト130は図1に示す翻訳結果編集装置74を用いた第3の編集者によるポストエディット132を受ける。この結果、翻訳結果に誤りが含まれていても第3の編集者により訂正されて訳言語テキスト134として出力される。
The
この実施形態では、このようにしてポストエディットされた訳言語テキスト134は音声合成装置76の音声合成エンジン136により訳言語音声信号138に変換され出力される。
In this embodiment, the translated
以上のようにこの実施形態に係る同時翻訳処理100では、原言語音声信号110の音声認識、音声認識結果の修正、修正後のテキストのチャンクへの分割、チャンク列の修正、自動翻訳、自動翻訳の修正、及び音声合成が、音声認識エンジン112による音声認識を単位としてパイプライン式に行われる。その結果、同時翻訳を高い精度で行える。
As described above, in the
(3)各編集画面
ア 音声認識結果のエディタ画面
図3に、音声認識結果の修正で用いられるエディタ画面200を示す。この実施形態では、エディタ画面200は、編集フィールド210と、音声信号表示部212と、再生音声を少しだけ戻す戻しボタン214、ポーズボタン216、及び再生音声を少しだけ先に進める進みボタン218と、「次へ」ボタン220とを含む。
(3) Edit Screens a. Editor screen for speech recognition results FIG. 3 shows an
編集フィールド210には音声認識結果のテキストが表示される。図3に示すように、音声認識結果のテキストは漢字かな混じりではあるものの、句読点が含まれず、全体がつながった一つの文字列である。またこの文字列の中には、文字・文字列230、232、及び234のように発話中に挿入された単なる音を示す文字列、文字・文字列236及び238のように間投詞的に挿入された意味のない文字・文字列が含まれている。
編集フィールド210に対しては第1の編集者による文字列編集が可能である。例えば図4に示す編集箇所250、252及び254のように単なる音を削除し、編集箇所256及び258に示すように意味のない文字・文字列を削除することで音声認識結果の文字列は正しい文字列となる。
音声信号表示部212には、編集フィールド210に対応する音声信号を示す画像が表示されている。この画像の中のある点にポインタを移動してクリックすると、その点に対応する位置から音声の再生が開始される。戻しボタン214をクリックすれば短い時間(例えば1秒)だけ再生位置を戻すことができる。進みボタン218をクリックすれば短い時間(例えば3秒)だけ再生位置を進めることができる。ポーズボタン216をクリックすれば再生を一時停止し、ポーズボタン216ボタンに代わって再生開始ボタン(図示せず)が表示される。したがって必要であれば第1の編集者が音声認識の対象の音声を容易に確認でき、音声認識結果を正しく修正できる。
An image showing the audio signal corresponding to the
なお、エディタ画面200による編集は、単なる文字列の削除、挿入のみである。また音声信号に関して行われる処理は、音声信号の表示、クリック位置の検出、及びクリックされた位置に応じた音声信号の再生、停止、再生位置の変更のみである。したがってこの編集処理は周知のプログラムを用いて実現できる。
Editing by the
「次へ」ボタン220を編集者がクリックすると、編集フィールド210に表示されている編集後のテキストが後続する処理に向けて出力される。
When the editor clicks on the "Next"
イ 翻訳単位のエディタ画面
図5に、翻訳単位(チャンク)のエディタ画面300を示す。図5を参照して、エディタ画面300は、修正された音声認識結果のテキストであって図1に示す発話分割装置68により分割されたテキストが、編集可能に表示される編集フィールド302と、「次へ」ボタン304及び306とを含む。
B. Translation Unit Editor Screen FIG. 5 shows the translation unit (chunk)
発話分割装置68の出力は、チャンクの終端(分割位置)と判定された箇所各々の直後に挿入された改行コードを含む。発話分割装置68による分割は、訓練によりある程度の精度を実現できるが完全に誤りを排除するわけではない。例えば図5において、第1文310と第2文312とは本来は一つの文である。しかし発話分割装置68はこの文を第1文310と第2文312とに分割している。
The output of the
第1文310と第2文312とをまとめるべきと判断した第2の編集者は、第1文310の末尾に付されている改行コードを削除する。その結果、図6に示す編集箇所320のように、第1文310と第2文312とが正しく1文にまとめられる。
The second editor, who has determined that the
「次へ」ボタン304又は「次へ」ボタン306がクリックされると、編集フィールド302に表示されているテキストが保存され、後続する処理に向けて出力される。
When "Next"
ウ 翻訳結果のエディタ画面
図1に示す翻訳結果編集装置74のエディタ画面350を示す。図7を参照して、エディタ画面350は、自動翻訳の原文が表示される原文フィールド352と、その翻訳結果が表示される訳文編集フィールド354と、「次へ」ボタン356とを含む。
C Editor Screen of Translation Result Shown is the
第3の編集者が原文フィールド352の表示内容と訳文編集フィールド354の表示内容とを比較する。もしも訳文に誤りがあれば第3の編集者は訳文編集フィールド354に表示されている訳文のうち、その誤りの箇所を修正する。
The third editor compares the displayed contents of the
図7の場合、例えば原文フィールド352に表示されている原文358に対応して訳文編集フィールド354に表示されている訳文360が、誤った、又は分かりにくい訳であると判断した場合、第3の編集者は訳文360の任意の箇所をクリックする。すると図8に示す、翻訳結果詳細のエディタ画面400が表示され、後述するように訳文360を修正でき、修正後にこのエディタ画面350が表示される。
In the case of FIG. 7, for example, when it is determined that the
「次へ」ボタン356がクリックされると、訳文編集フィールド354に表示されている訳文が正しい訳文として後続する処理に向けて出力される。
When the "Next"
エ 翻訳結果詳細のエディタ画面
図8に、図7の訳文360を第3の編集者がクリックしたときに表示される翻訳結果詳細のエディタ画面400を示す。図8を参照して、エディタ画面400は、原文を表示する原文410と、その訳文を編集可能に表示する訳文414と、訳文414を原言語に逆翻訳した結果である逆翻訳412をその信頼度420とともに表示する逆翻訳412と、「修正を反映して閉じる」ボタン416及びキャンセルボタン418とを含む。
D. Editor screen for translation result details FIG. 8 shows an
逆翻訳412は、この実施形態では図1に示す自動翻訳装置78により訳言語の訳文414を原言語に逆翻訳した結果である。原文410と逆翻訳412とが全く同じ、又は実質的に同じ意味を表しているなら、訳文414の信頼性は高い。逆に両者が異なっている場合には訳文414が誤っている可能性がある。そこでこのように原文410と逆翻訳412とを対照して表示することで第3の編集者が訳文414の妥当性を判定しやすくしている。
The
なお信頼度420として、この実施形態では、原文410と逆翻訳412の両者に出現する単語の一致度を算出している。単語の一致度だけでは万全ではないが第3の編集者は原言語と訳言語との双方を解することが想定されているため、この値を参考にしながら適切に訳文414の適否及びその修正方法を判定できるはずである。
As the
「修正を反映して閉じる」ボタン416をクリックすると、訳文414に表示された訳文が正しいとして図7に示す訳文360が修正された形で図7に示すエディタ画面350が再表示される。キャンセルボタン418をクリックすると、訳文414に修正がされていたとしてもその修正は破棄され、訳文に対して何も変更がない形で図7のエディタ画面350が表示される。
When the "reflect corrections and close"
(4)プログラム構成
以上に説明した構造及び各機能部の機能は、いずれもコンピュータハードウェアと、コンピュータハードウェアにより実行されるコンピュータプログラムとにより実現される。以下、各機能部を実現するプログラムの制御構造、特に編集作業を実現するプログラムの制御構造について以下に説明する。
(4) Program Configuration The structure and functions of each functional unit described above are realized by computer hardware and a computer program executed by the computer hardware. The control structure of a program that implements each functional unit, particularly the control structure of a program that implements editing work, will be described below.
ア 統括サーバ60
図9を参照して、図1に示す統括サーバ60を実現するプログラムは、起動後、必要とするメモリ領域及び通信資源を確保し、必要な初期化を実行するステップ450と、図1に示す同時翻訳システム50の各要素とネットワーク62を介して通信を開始するステップ452と、同時翻訳システム50の各要素との通信に使用するために、先入れ先出しバッファとして使用するために、記憶装置に出力バッファ用の領域を確保し、上記要素のためのバッファの各々について、次にデータを書き込むアドレスを示す書込みポインタPW及び次にデータを読み出すアドレスを示す読出しポインタPRを0に、それぞれ初期化するステップ454と、ステップ454の完了後、動作開始指示を待ち受けて次の処理に進むステップ456とを含む。なお、出力バッファは音声認識装置64、音声認識結果編集装置66、発話分割装置68、翻訳単位編集装置70、自動翻訳装置72及び翻訳結果編集装置74の各々について設けられ、書込みポインタPW及び読出しポインタPRもバッファの数だけ設けられることに注意する必要がある。
A
Referring to FIG. 9, the program that implements
このプログラムはさらに、ステップ456で動作開始指示を受けたことに応答して、音声認識装置64からネットワーク62を介して音声認識結果のテキストを受信するまで待機するステップ458と、ステップ458で音声認識結果のテキストを受信したことに応答して実行され、受信した音声認識結果を音声認識結果用のバッファに書き込むステップ460と、音声認識結果のためのバッファの書込みポインタPWの値を1だけインクリメントするステップ462と、同時翻訳処理の開始を音声認識結果編集装置66、発話分割装置68、翻訳単位編集装置70、自動翻訳装置72、翻訳結果編集装置74、音声合成装置76及び自動翻訳装置78に通知するステップ464とを含む。
The program further waits in
このプログラムはさらに、ネットワーク62上の各装置からデータの送信要求又は書込み要求を待機し、受信した要求の種類に応じて制御の流れを分岐させるステップ466を含む。なおステップ466での分岐は、図9には3つしか示していない。しかし、この3つの分岐のうち書込み及び読出しの分岐は、ネットワーク62上の各装置の種類だけ存在することに注意すべきである。
The program further includes a
このプログラムはさらに、受信した要求がデータの書込み要求であることに応答して、そのデータの種類に応じた出力バッファの書込みポインタPWの値と読出しポインタの値とが一致するか否かを判定し制御の流れを分岐させるステップ468と、ステップ468の判定が肯定であることに応答して、データの書込み位置を示すポインタが読出し位置を示すポインタを追い越すことを示す警告を統括サーバ60の画面に表示し、又は所定のログファイルに書き出すステップ470と、書込みポインタPWが示すアドレスに、ステップ466で受信したデータを書き込むステップ472と、書込みポインタPWの値を1インクリメントして制御をステップ466に進めるステップ474とを含む。
Further, in response to the fact that the received request is a data write request, the program checks whether the value of the write pointer PW of the output buffer and the value of the read pointer match according to the type of data. Step 468 for judging and branching the flow of control; Step 470 for displaying on the screen or writing to a predetermined log file;
ステップ468の判定が必要な理由は以下のとおりである。この実施形態では、バッファとしてリングバッファを想定している。リングバッファの場合、ポインタがバッファの末端まで到達するとポインタは先頭に戻る。普通は、バッファにデータが書き込まれるとその位置からデータが読み出される。したがって書込み位置の方が読出し位置より常に先行する。書き込まれたデータが順調に読み出され処理されれば特に問題はない、しかし、仮に書込みが続いたのに対して何らかの理由で読出しが遅くなると、書込みポインタがバッファを1周して読出しポインタに追いついてしまう可能性がある。もちろんこの可能性は小さいが、ないとはいえない。そうした場合には、バッファに書き込まれたデータが読み出されないうちに上書きされてしまうというケースが発生する。そのようなトラブルが生じたときには、処理を停止させないためにこのように警告を表示又はログを記録して処理を先に進めることにしている。
The reason why the determination of
このプログラムはさらに、ステップ466で受信した要求がデータの読出し要求であることに応答して、そのバッファの読出しポインタPRが書込みポインタPWの値を等しいか否かを判定し、判定結果に従って制御の流れを分岐させるステップ476と、ステップ476の判定が肯定であることに応答して、読み出すべきデータが存在しないことを読出し要求の送信元に通知して制御をステップ466に戻すステップ478と、ステップ476の判定が否定であることに応答して、読出しポインタPRの示すアドレスからデータを読み出し、要求の送信元に送信するステップ480と、読出しポインタPRの値を1インクリメントして制御をステップ466に戻すステップ482とを含む。
In response to the request received at
ステップ476の判定が肯定になるのは、典型的には処理の開始時である。処理の開始時にはデータの書込みがされていない。したがって書込みポインタPWの値は0である。このとき、読出しポインタPRの値も0である。したがって読出し要求を受信しても送信するデータはない。これは書込みと読出しとが同期して(同じ速度で)進んだときも同様である。
An affirmative determination at
なお、統括サーバ60の場合、操作者によりシステム全体の停止が指示されることがある。この実施形態では、ステップ466でそのような停止要求を受信したときにはステップ466の判定で、同時翻訳システム50の各要素に動作の終了を指示する等の必要な処理を行った後、このプログラムの実行を終了する。
In the case of the
イ 音声認識装置64
音声認識装置64については前記したとおり、どのようなものを用いてもよい。現在ではいわゆるニューラルネットワークを用いたものが好ましい。音声認識装置を実現するプログラムについては既に多数存在しており、それらに関する教科書及び特許文献も多数存在する。したがってここでは記載を簡潔にすることを目的に音声認識装置64を実現するプログラムの詳細については繰り返さない。
B
Any
ウ 音声認識結果編集装置66
図10を参照して、音声認識結果編集装置66を実現するプログラムは、起動されると初期化処理を実行するステップ550と、統括サーバ60との通信を開始するステップ552と、所定の初期画面を表示するステップ554と、統括サーバ60から同時翻訳システム50の動作開始を示す指示を待機するステップ556と、動作開始を示す指示を受けたことに応答して、音声認識結果の送信要求を統括サーバ60に対して送信するステップ558と、統括サーバ60からのデータを待機するステップ560とを含む。ステップ560において、統括サーバ60からの返信を受信しない場合、及び音声認識結果がまだ存在していない旨の返信を受信したときには、制御はステップ558に戻る。この部分の処理は、同時翻訳システム50のネットワーク62以外の各部で共通である。
C Speech recognition
Referring to FIG. 10, the program that implements speech recognition
このプログラムはさらに、ステップ560で統括サーバ60から音声認識結果のテキストデータを受信したことに応答して、図3に示すようなエディタ画面200を生成し表示するステップ562と、第1の編集者による指示を待機するステップ564と、ステップ564で指示を受信するとその指示の内容に従って制御の流れを分岐させるステップ566と、指示の内容が図3に示す「次へ」ボタン220のクリックであることに応答して、編集フィールド210に表示されているテキストを統括サーバ60に編集結果として送信して制御の流れをステップ558に戻すステップ568とを含む。
Further, in response to receiving the text data of the speech recognition result from the
このプログラムはさらに、ステップ566の判定が否定であることに応答して、ステップ564で受信した指示が、動作の終了を指示するものか否かにより制御の流れを分岐させるステップ570と、ステップ570の判定が肯定であることに応答して、後処理を行いプログラムの実行を終了するステップ574と、ステップ570の判定が否定であることに応答して、指示に応じた処理を実行し制御をステップ564に戻すステップ572とを含む。ステップ570の判定が否定のときとは、編集フィールド210に表示されたテキストの編集、音声信号表示部212のクリック、戻しボタン214、ポーズボタン216、進みボタン218及び再生開始ボタン(図示せず)のクリック等である。
The program further responds to a negative determination at
エ 発話分割装置68
発話分割装置68については、前記したとおり、訓練済のSVM又はDNNにより実現される。SVM及びDNNを実現するプログラムについては既に多数存在しており、SVM及びDNNの詳細に関する教科書、論文及び特許文献も多数存在している。したがってここでは説明を簡潔にするために発話分割装置68と実現するプログラムの詳細については繰り返さない。
D
オ 翻訳単位編集装置70
図11を参照して、翻訳単位編集装置70を実現するプログラムは、初期化処理を行うステップ600と、統括サーバ60との通信を開始するステップ602と、動作開始時の初期画面を表示するステップ604と、統括サーバ60から動作開始の指示を待機するステップ606と、統括サーバ60から動作開始時の指示を受信したことに応答して、統括サーバ60に対して翻訳単位分割結果(発話分割装置68の処理結果)の送信要求を送信するステップ608と、統括サーバ60からデータを受信するまで待機するステップ610とを含む。
E translation
Referring to FIG. 11, the program that implements translation
このプログラムはさらに、ステップ610で統括サーバ60から処理対象のデータを受信したことに応答して、図5に示すエディタ画面300を生成し表示装置に表示するステップ612と、第2の編集者による指示を待機するステップ614と、ステップ614で第2の編集者から何らかの指示を受信したことに応答して、その指示が「次へ」ボタン306か否かにより制御の流れを分岐させるステップ616と、ステップ616の判定が肯定であることに応答して、統括サーバ60に対して編集フィールド302に表示されているテキストを翻訳単位(チャンク)結果のチャンク列として送信し制御をステップ608に戻すステップ618とを含む。
Further, in response to receiving data to be processed from the
このプログラムはさらに、ステップ616の判定が否定であることに応答して、指示が処理の終了を示すものか否かに従って制御の流れを分岐させるステップ620と、ステップ620の判定が肯定であることに応答して、必要な後処理を実行してプログラムの実行を終了するステップ624と、ステップ620の判定が否定であることに応答して、受信した指示に対応した処理を実行し制御をステップ614に戻すステップ622とを含む。ステップ622での処理とは、図5において編集フィールド302に表示されたテキストを編集する処理である。
The program further responds to a negative determination at
カ 自動翻訳装置72
自動翻訳装置72については、前記したとおり既存のものを利用できる。自動翻訳装置を実現するプログラムについては既に多数存在しており、自動翻訳装置の詳細に関する教科書、論文及び特許文献も多数存在している。したがってここでは説明を簡潔にするために自動翻訳装置72を実現するプログラムの詳細については繰り返さない。ただし、現在のところ自動翻訳装置72としてはいわゆるニューラル機械翻訳がその精度及び処理速度の点で最も望ましい。
F
As for the
キ 翻訳結果編集装置74
図12を参照して、翻訳結果編集装置74を実現するプログラムは、初期化処理を実行するステップ650と、統括サーバ60との通信を開始するステップ652と、処理開始を示す初期画面を表示するステップ654と、統括サーバ60からの動作開始の指示を待機するステップ656と、統括サーバ60から動作開始の指示を受信したことに応答して、自動翻訳装置72による自動翻訳結果の送信要求を翻訳結果編集装置74に対して送信するステップ658と、統括サーバ60からデータを受信するまで待機するステップ660とを含む。
G translation result editing device 74
Referring to FIG. 12, the program that implements translation result editing device 74 performs initialization processing at
このプログラムはさらに、ステップ660で統括サーバ60からデータを受信したことに応答して、図7に示すエディタ画面350を表示し、第3の編集者による何らかの指示を待機するステップ664と、ステップ664で何らかの指示を受信したことに応答して、その指示が「次へ」ボタン356か否かにより制御の流れを分岐させるステップ666と、ステップ666の判定が肯定であることに応答して、訳文編集フィールド354に表示されている訳文のテキストを編集結果として統括サーバ60に送信し、制御をステップ658に戻すステップ668とを含む。
Further, in response to receiving data from the
このプログラムはさらに、ステップ666の判定が否定であることに応答して、訳文編集フィールド354のいずれかの訳文がクリックされたか否かにより制御の流れを分岐させるステップ670と、ステップ670の判定が肯定であることに応答して、クリックされた部分の原文及び訳文を引数として図8に示す翻訳詳細のエディタ画面400を表示するプログラムを起動しエディタ画面400から訳文の編集結果を受信するまで待機するステップ672と、ステップ672でエディタ画面400から編集結果を受信したことに応答して、編集後のデータで元の訳文を更新するステップ674と、ステップ674で更新した訳文に従ってエディタ画面350の表示を更新し制御をステップ664に戻すステップ676とを含む。ステップ672の詳細については図13を参照して後述する。
The program further responds to a negative determination at
このプログラムはさらに、ステップ670の判定が否定であることに応答して、受信した指示が終了指示か否かにより制御の流れを分岐させるステップ678と、ステップ678の判定が肯定であることに応答して、必要な後処理を実行しプログラムの実行を終了するステップ682と、ステップ678の判定が否定であることに応答して、操作に応じた処理を実行し制御をステップ664に戻すステップ680とを含む。ステップ680で行う処理として特に重要なものはないが、例えば操作の取り消し、操作の再実行、ヘルプの表示、ポインタの移動等がある。
The program further responds to a negative determination at
図13を参照して、図12のステップ672を実現するプログラムは、必要な初期化処理を実行するステップ700と、図12に示すプログラムから受信した訳文を記憶装置に一時保存するステップ702と、受信した訳文を図1に示す自動翻訳装置78に与えて訳言語から原言語への翻訳を実行させるステップ704と、図12に示すプログラムから受信した原文(図8の原文410)及びその訳文(図8の訳文414)、ステップ704で得られたその逆翻訳(図8の逆翻訳412)、並びに原文410と逆翻訳412との一致度を示す信頼度を算出し、これらを用いて図8に示すエディタ画面400を生成して表示するステップ706と、第3の編集者による指示を待機するステップ708とを含む。
Referring to FIG. 13, the program that implements
このプログラムはさらに、ステップ708で受けた指示が訳文の編集指示であることに応答して、一時記憶装置に保存した訳文を、編集後の訳文で更新するステップ710と、編集後の訳文を自動翻訳装置78により逆翻訳するステップ712と、編集後の訳文とその新たな逆翻訳とによりエディタ画面400の表示を更新し制御をステップ708に戻すステップ714と、ステップ708で受けた指示が「修正を反映して閉じる」ボタン416であることに応答して、一時記憶装置に保存した訳文のテキストを戻り値に設定してプログラムの実行を終了するステップ716とを含む。なおステップ708で受信した指示がキャンセルボタン418であるときには、一時保存した訳文を破棄してプログラムの実行を終了する。図12のステップ672では、通常は図13に示すプログラムにより渡される訳文を新たな訳文とし、キャンセルされたときには図13に示すプログラムの出力は無視する。
Further, in response to the instruction received in
ク 音声合成装置76
音声合成装置76については、前記したとおり既存のものを利用できる。音声合成装置を実現するプログラムについては既に多数存在しており、音声合成装置の詳細に関する教科書、論文及び特許文献も多数存在している。したがってここでは説明を簡潔にするために音声合成装置76を実現するプログラムの詳細については繰り返さない。
As for the
2 動作
(1)全体動作の開始
図1を参照して、同時翻訳システム50が起動されると、統括サーバ60、音声認識装置64、音声認識結果編集装置66、発話分割装置68、翻訳単位編集装置70、自動翻訳装置72、翻訳結果編集装置74、音声合成装置76、自動翻訳装置78がそれぞれ初期化され、統括サーバ60との通信を開始する。そしてこれら各装置のうち、音声認識装置64以外は、統括サーバ60から処理開始の指示を待ち受ける。
2. Operation (1) Start of Overall Operation Referring to FIG.
音声認識装置64は、入力される音声信号から音声部分を検出し、音声部分の開始から終了までを1つのまとまりとして音声認識を行う。音声認識装置64は音声認識の結果をテキストとして統括サーバ60にデータの書込み要求として送信した後、次の音声部分の検出待ちとなる。
The
統括サーバ60はこの音声認識結果を受信すると(図9、ステップ458でYES)、音声認識装置64の出力バッファとしての記憶領域の、書込みポインタPWが示すアドレスに書き込み(ステップ460)、書込みポインタPWに1を加算する(ステップ462)。統括サーバ60は各部に処理開始の指示を送信する(ステップ464)。これに応答して、音声認識装置64以外の各装置はいずれも処理を開始して統括サーバ60に対してデータの送信要求を送信し(図10のステップ558、図11のステップ608、図12のステップ658)、統括サーバ60からのデータ待ち状態となる(ステップ560,
610、及び660)。
When the
610, and 660).
動作の開始時には音声認識装置64の出力バッファのみにデータが格納されている(図9のステップ476でYES)。統括サーバ60は、音声認識装置64の出力バッファの、読出しポインタが指し示すアドレスから音声認識結果のテキストを読み出し(図9のステップ478)、音声認識結果編集装置66に送信する(ステップ480)。さらに統括サーバ60は、音声認識装置64の出力バッファの読出しポインタPRに1を加算し、制御をステップ658に戻す。
At the start of operation, data is stored only in the output buffer of the speech recognition device 64 (YES at
以下、各部は以下のように動作する。 Below, each part operates as follows.
(2)音声認識装置64の動作
音声認識装置64は、入力される音声信号の音声部分を検出し、その音声部分の音声認識を行ってひとまとまりのテキストとして統括サーバ60に送信することを繰り返す。統括サーバはこのデータを音声認識装置64の出力バッファに書き込み、音声認識結果編集装置66から読出し要求を受信すると先入れ先出し方式でデータを読み出して音声認識結果編集装置66に送信する。いずれの出力バッファについてもこの基本的動作は共通である。
(2) Operation of
(3)音声認識結果編集装置66の動作
音声認識結果編集装置66は統括サーバ60に対して音声認識結果の送信要求を送信し、音声認識結果が送信されるまで待機する(図10のステップ560)。
(3) Operation of voice recognition
音声認識結果編集装置66は、統括サーバ60からテキストを受信すると図3に示すエディタ画面200を生成し表示する(ステップ562)。第1の編集者がテキストに対して何らかの編集をすると、図10のステップ564⇒ステップ566⇒ステップ570⇒ステップ572を経てその操作に対応する編集処理がされ、必要ならテキストが更新される(ステップ572)。制御はステップ564に戻り、第1の編集者による次の指示待ち状態となる。
Upon receiving the text from the
第1の編集者が図3に示す「次へ」ボタン220をクリックすると編集後の(何ら編集されなかった場合には編集前の)テキストが統括サーバ60に送信される。統括サーバ60は音声認識結果編集装置66用の出力バッファにそのデータを格納する。
When the first editor clicks the "next"
(4)発話分割装置68の動作
発話分割装置68は、統括サーバ60に対し音声認識結果編集装置66の編集結果のテキストの送信要求を送り、統括サーバ60からテキストが送信されるまで待機する。統括サーバ60は、音声認識結果編集装置66のための出力バッファからテキストを読み出し、発話分割装置68に送信する。発話分割装置68はこのテキストに対してSVM又はDNNによるチャンク末の検出を行い、チャンク末の文字の直後に改行コードを挿入して統括サーバ60に送信する。統括サーバ60は発話分割装置68のための出力バッファにこのテキストを格納する。
(4) Operation of
(5)翻訳単位編集装置70の動作
翻訳単位編集装置70は、統括サーバ60に対して発話分割装置68による分割結果のテキストの送信要求を送り(図11のステップ608)、統括サーバ60からテキストが送信されるまで待機する(ステップ610)。統括サーバ60は、発話分割装置68のための出力バッファからテキストを読み出し、翻訳単位編集装置70に送信する。統括サーバ60から発話分割装置68による分割結果を受信すると(図11のステップ610でYES)翻訳単位編集装置70は、図5に示すエディタ画面300を生成し表示装置に表示する(ステップ612)。翻訳単位編集装置70は第2の編集者による指示を待機し(ステップ614)、指示があるとその指示が何かを判定する(ステップ616及び620)。
(5) Operation of translation
指示が図5に示す「次へ」ボタン306なら翻訳単位編集装置70は編集結果のテキストを統括サーバ60に送信し(ステップ618)、次のデータ待ちとなる(ステップ608及び610)。統括サーバ60はこのデータを翻訳単位編集装置70のための出力バッファに格納する。指示が動作終了の指示でなければ、何らかの編集の指示である。したがって、その指示に従って翻訳単位分割のテキストの編集を行ってテキストを更新する等の処理を行い(ステップ622)、次のデータ待ちとなる(ステップ608及び610)。指示が動作終了の指示であれば必要な後処理を実行し(ステップ624)、プログラムの実行を終了する。指示が動作終了の指示でなければ、指定された編集処理を実行して翻訳単位分割のテキストの更新等を行い(ステップ622)、次の指示を待機する(ステップ614)。
If the instruction is the "next"
(6)自動翻訳装置72の動作
自動翻訳装置72は、統括サーバ60に翻訳対象のテキストの送信要求を送信する。統括サーバ60から翻訳対象のテキストを受信すると、自動翻訳装置72はそのテキストに対して自動翻訳を行い、訳言語のテキストを出力する。自動翻訳装置72はこのテキストを原文とともに統括サーバ60に送信する。統括サーバ60はこれらのテキストを自動翻訳装置72のための出力バッファに格納する。
(6) Operation of
(7)翻訳結果編集装置74の動作
翻訳結果編集装置74は、統括サーバ60に対して自動翻訳装置72による出力のテキスト(原文と翻訳結果)の送信要求を送信し(図12のステップ658)、統括サーバ60からのデータ送信を待機する(ステップ660)。統括サーバ60からテキストを受信すると、翻訳結果編集装置74は、このテキストのうちの原言語の原文と訳言語の訳文とを対照する形で図7に示すエディタ画面350を生成し(ステップ662)、表示する。その後、翻訳結果編集装置74は第3の編集者による指示待ちとなる(ステップ664)
ア 概略画面での編集
編集者から何らかの指示があると、翻訳結果編集装置74は図12のステップ666でその指示が「次へ」ボタン356か否かを判定する。判定が肯定なら(ステップ666でYES)翻訳結果編集装置74は図7の訳文編集フィールド354に表示されている訳文を編集結果として統括サーバ60に送信し(ステップ668)、統括サーバ60からの次のデータ待ちとなる(ステップ658及び660)。統括サーバ60は、このデータを翻訳結果編集装置74のための出力バッファに格納する。
(7) Operation of Translation Result Editing Device 74 The translation result editing device 74 sends a transmission request for the text output by the automatic translation device 72 (original text and translation result) to the central server 60 (
a. Editing on the Overview Screen When the editor gives some instruction, the translation result editing device 74 determines whether or not the instruction is the "next"
ステップ666の判定が否定であれば、翻訳結果編集装置74はステップ670で図7に示す訳文編集フィールド354に表示されている訳文のいずれかの一部がクリックされたか否かを判定し、その訳文と対応する原文とを引き数として図13に制御構造を示すプログラムを起動する(ステップ672)。この結果、図8に示すエディタ画面400が表示されてその結果がステップ672に戻ってくる。図8での翻訳結果編集装置74の動作については後述する。
If the determination in
翻訳結果編集装置74は、図12のステップ672で受信した編集後のデータで統括サーバ60から受信したテキストのうちの訳文を更新し(ステップ674)、更新後のデータでエディタ画面350の表示を更新し、制御をステップ664に戻す(ステップ676)。
The translation result editing device 74 updates the translation of the text received from the
ステップ670の判定が否定であれば翻訳結果編集装置74は、ステップ678で指示が処理の終了指示か否かを判定する。指示が終了指示であれば(ステップ678でYES)、必要な後処理を行ってプログラムの実行を終了する(ステップ682)。指示が終了指示でなければ(ステップ678でNO)、ステップ680で指示に応じた処理を実行し、制御をステップ664に戻して第3の編集者による次の指示を待機する。
If the determination in
イ 詳細画面での編集
翻訳結果編集装置74は、図12のステップ672で呼び出されると以下のように動作する。図13を参照して、まずステップ700が行われ、ステップ672で引き数として渡された訳文と原文とを記憶装置に一時保存する。ステップ704で訳文を自動翻訳装置78に入力して、原言語の文に逆翻訳する。そして、原文と、逆翻訳と、訳文とを用いて図8に示すエディタ画面400を生成し表示する(ステップ706)。
B. Editing on the detailed screen When the translation result editing device 74 is called at
第3の編集者の指示待ちとなり(ステップ708)、指示があるとその指示が訳文の編集指示か、「修正を反映して閉じる」ボタン416か、キャンセルボタン418かを判定して制御の流れを判定結果により分岐させる。
The process waits for an instruction from the third editor (step 708), and if there is an instruction, it is determined whether the instruction is an instruction to edit the translation, the "reflect corrections and close"
訳文の編集指示であれば、記憶装置に一時保存した訳文を編集後の訳文で更新し(ステップ710)、編集後の訳文を自動翻訳装置78に入力して逆翻訳させる(ステップ712)。こうして得られた編集後の訳文及びその逆翻訳、並びにもとの原文を用いて図8に示すエディタ画面400を更新し再表示して(ステップ714)第3の編集者の指示待ちに戻る(ステップ708)。
If it is an instruction to edit the translated text, the translated text temporarily stored in the storage device is updated with the edited translated text (step 710), and the edited translated text is input to the
「修正を反映して閉じる」ボタン416がクリックされた場合には、ステップ716において、一時保存した訳文を戻り値に設定して制御を図12のステップ672に戻す(ステップ716)。
If the "reflect corrections and close"
キャンセルボタン418がクリックされた場合にはその旨を示す値を戻り値に設定して制御を図12のステップ672に戻す。
If the cancel
(8)音声合成装置76の動作
音声合成装置76は統括サーバ60に対して翻訳結果編集装置74による編集結果の送信を要求する。統括サーバ60から、翻訳結果編集装置74による編集結果である訳言語のテキストが送信されてくると、音声合成装置76は、公知の音声合成方法のいずれかを用いてそのテキストから音声信号を生成し、しかるべき出力装置に向けて出力する。
(8) Operation of
同時翻訳システム50は、統括サーバ60による統括制御のもと、音声認識装置64が音声認識した結果得られる文字列の各々について、上記した処理をパイプライン式に繰り返す。その結果、音声認識装置64に入力された原言語の音声信号が、次々に訳言語に翻訳され、テキスト化され、音声信号に変換される。
Under the overall control of the
3 効果
以上に述べた第1実施形態によれば、音声認識、音声認識結果の修正、音声認識結果のチャンク列への分割、チャンク列の分割の修正、自動翻訳、自動翻訳結果の修正、及び音声合成が、パイプライン式に並列に実行される。統括サーバ60が各装置の間の出力バッファが先入れ先出し方式で動作するように各データの格納先を振り分けて制御するため、音声認識の結果が正しい順序で訳言語に翻訳され音声信号化される。また音声認識結果の修正、認識結果のチャンク列への分割の修正、及び翻訳結果に対する修正が編集者により行われる。その結果、同時翻訳が、高い精度で実現できる。
3 Effect According to the first embodiment described above, speech recognition, correction of speech recognition results, division of speech recognition results into chunk strings, correction of division of chunk strings, automatic translation, correction of automatic translation results, and Speech synthesis is performed in parallel in a pipelined manner. Since the supervising
また、音声認識結果の修正及び認識結果のチャンク列への分割の修正を行う第1の編集者及び第2の編集者は、いずれも原言語に関する知識を持っていればよく、訳言語の知識は必要とされない。また第3の編集者は原言語と訳言語の双方の知識を持つ必要があるが、原言語のテキスト化及び自動翻訳に適したチャンク化については既に行われているため、原言語に関する処理の負担は非常に少なくなる。また上記実施形態のように原文と訳文とを対照して表示するため、訳文の誤りに関する判定及びその修正が容易に行える。さらに図8に示すように訳文を逆翻訳したものを表示することで、訳文の妥当性が容易に判定できる。さらに逆翻訳と訳文との一致度が訳文の信頼度として表示されるため、さらに第3の編集者の負荷は軽減される。 In addition, the first editor and the second editor who correct the speech recognition result and the division of the recognition result into chunk sequences need only have knowledge of the original language, and knowledge of the target language. is not required. Also, the third editor needs to have knowledge of both the source language and the target language, but since the source language has already been converted into text and chunked suitable for automatic translation, processing related to the source language burden will be much less. Moreover, since the original text and the translated text are displayed in comparison with each other as in the above embodiment, it is possible to easily judge and correct errors in the translated text. Furthermore, by displaying a back-translated version of the translated text as shown in FIG. 8, the validity of the translated text can be easily determined. Furthermore, since the degree of matching between the reverse translation and the translated text is displayed as the reliability of the translated text, the load on the third editor is further reduced.
特許文献1にはポストエディットに関する記述はないが、仮にポストエディットを行う場合には、ポストエディットを行う編集者は第1言語及び第2言語の双方に関してネイティブとほぼ同様の理解力及び表現力がないと十分な編集を行うことはできないと考えられる。上記実施形態に係る同時翻訳システム50を用いれば、原言語に関して十分な知識を持っていればよい編集者(第1の編集者及び第2の編集者)と、双方の言語に関しての知識を持つ編集者(第3の編集者)とが必要とされるだけであり、しかも第3の編集者については、原言語についてネイティブなみのスキルは要求されない。したがって、上記実施形態に係る同時翻訳システム50により、同時翻訳に必要な人材の不足を補うことができる。
Although there is no description of post-editing in
なお、この第1実施形態では、統括サーバ60が各装置の間の出力バッファとして機能している。しかしこの発明はそのような実施形態には限定されない。各装置の間に別々の出力バッファを設けてもよい。この場合、それら出力バッファは出力側の装置に設けてもよいし、入力側の装置に設けてもよい。また、出力側の装置及び入力側の装置のいずれからも独立した記憶装置を両者の間に設けてもよい。
Note that in the first embodiment, the
第2 第2実施形態
1 概略
上記実施形態では、第1の編集者、第2の編集者及び第3の編集者はいずれも1人が想定されている。しかし、これら編集者を複数利用できるようにすれば、同時翻訳をより高速にしかも精度高く行うことができる。第2実施形態はそうした実施形態である。
2 ハードウェア構成
ハードウェアとしては、この第2実施形態に係る同時翻訳システムは、図1に示す第1実施形態の同時翻訳システム50と同じものを利用できる。したがってここではその説明は繰り返さない。
2. Hardware Configuration As hardware, the simultaneous translation system according to the second embodiment can use the same hardware as the
3 プログラム構成
(1)第1実施形態との相違点
第1実施形態と異なるのは、図1に示す音声認識結果編集装置66、翻訳単位編集装置70及び翻訳結果編集装置74のいずれかが複数となること、及び第2実施形態で統括サーバ60に相当する統括サーバが実行するプログラムが図9に示す制御構造とは異なる制御構造を持つことだけである。したがって以下では統括サーバ60が実行するプログラムの制御構造のみについて述べる。なお、音声認識結果編集装置66、翻訳単位編集装置70及び翻訳結果編集装置74の中で複数となるのはいずれか1種類に限定されない。これらのうちの任意の組合せの装置が複数となってもよい。
3 Program configuration (1) Differences from the first embodiment The difference from the first embodiment is that any of the speech recognition
(2)統括サーバのプログラム
図14に第2実施形態に係る統括サーバが実行するプログラムの制御構造をフローチャート形式で示す。図14のフローチャートが図9に示すものと異なるのは、図9のステップ464に代えて、複数の音声認識結果編集装置66、翻訳単位編集装置70又は翻訳結果編集装置74を含む、同時翻訳システムの全ての構成要素に対して処理開始を通知するステップ754を含むことと、ステップ466において要求が書込み要求であると判定されたときに、ステップ468の前に、各装置(特に音声認識結果編集装置66、翻訳単位編集装置70及び翻訳結果編集装置74)から受信したデータについて、その順序が各装置にデータを送信した順序と整合するよう、受信したデータを一時保持してデータの整序を行うステップ756と、ステップ756の処理の結果、受信したデータが全て整序されており出力バッファに書き込めるときには制御をステップ468に進め、まだ整序されていないときにはデータを一時保存したまま制御をステップ466に戻すステップ758とを含む点である。図14に示すフローチャートはまた、図9のステップ480に代えて、読出しポインタPRの位置からデータを読み出し、読出しポインタPRの値をデータに付して送信要求の送信元の装置に送信するステップ760を含む点でも図9と異なっている。なお、この実施形態では、各装置は自分が受信したデータに付されていた、読出し順序を示すトークンを、処理結果のデータに付して統括サーバ60に送信するものとする。
(2) Program of Central Server FIG. 14 shows the control structure of the program executed by the central server according to the second embodiment in the form of a flowchart. 14 differs from that shown in FIG. 9 in that the simultaneous translation system includes a plurality of speech recognition result
(3)動作の相違点
同じ処理を行う装置が複数個あるとき、例えば複数の翻訳結果編集装置74がシステム中に存在しているときには、図14のステップ760で翻訳結果をそれら複数の翻訳結果編集装置74に振り分けて送信し、各編集者により編集させる。すなわち、ステップ760を実行するとき、最初にはある編集者の装置にデータを送信し、次の実行時には、別の編集者の装置にデータを送信する。この場合、編集者が違うと処理速度にも違いがあったり、何らかの原因で通信遅延が発生したりした場合、送信したときの順序と異なる順序で複数の翻訳結果編集装置74から編集結果が返されてくることがある。この第2実施形態では、同じ処理を実行する複数の装置は、同じ出力バッファを共有するので、それらの出力を受信した順序に従って出力バッファに保存すると、次の処理に渡すときにデータの順序が前後してしまう。
(3) Differences in Operation When there are a plurality of devices that perform the same processing, for example, when there are a plurality of translation result editing devices 74 in the system, the translation results are translated into the translation results of the plurality of translation results at
そこで、この実施形態のステップ756では、それまでに受信したデータに付されていたトークンと、新たに受信したデータのトークンとを比較し、両者が連続していれば新たに受信したデータを出力バッファに保存し、そうでなければ、その不連続な部分のトークンを持つデータを受信するまで、出力バッファとは別の記憶領域に一時保存する。そして不連続な部分を補充するトークンを持つデータを受信したときに、そのデータを出力バッファに保存し一時保存したデータをその後に保存する。もちろん、一時保存するデータが複数になる場合もあり得る。
Therefore, in
こうすることにより、同じ処理をする複数の編集者にある順序で振り分けて送信したときに、送信時と異なる順序で編集後のデータが戻ってきたときに、送信時と正しい順番に編集後のデータの順序を並べ替えてバッファに保存できる。そのため、後の処理に悪影響を及ぼすことはない。また複数の編集者により編集処理を行うので、個々の編集者の処理するデータ量は少なくなり、全体として処理速度が向上し、また各編集者の負担も軽減されるという効果がある。 By doing this, when the edited data is sent back in a certain order to multiple editors who perform the same processing, and the edited data is returned in a different order than when it was sent, the edited data will be sent in the correct order. You can rearrange the order of the data and store it in the buffer. Therefore, there is no adverse effect on subsequent processing. In addition, since the editing process is performed by a plurality of editors, the amount of data processed by each editor is reduced, the processing speed is improved as a whole, and the burden on each editor is reduced.
なお、この場合、不連続な部分を補充するトークンが所定の時間内に送信されて来ない場合もあり得る。そうした場合には処理の速度を保つために、データが全て揃わなくても一時保存していたデータを出力バッファに保存することも可能である。この場合、後からその不足したデータを受信したときには、そのデータを無視すればよい。 In this case, it is possible that the tokens for replenishing the discontinuous portion may not be sent within the predetermined time. In such a case, in order to keep the processing speed, it is possible to store the temporarily stored data in the output buffer even if all the data is not complete. In this case, when the missing data is received later, the data can be ignored.
なおこの第2実施形態では、統括サーバ60が各装置の出力バッファを、統括サーバ60のメモリ領域を用いたリングバッファの形式で実現している。しかしこの発明はそのような実施形態には限定されない。統括サーバ60が各装置の出力バッファをデータベースの形で実現してもよい。
Note that in the second embodiment, the
第3 変形例
1 第1変形例
図15は、上記第1実施形態に係る翻訳結果編集装置74において図7及び図8に示す翻訳結果のエディタ画面350及び400に変わる翻訳結果編集装置のエディタ画面800を示す。この例では、エディタ画面350と翻訳結果の詳細に関するエディタ画面400のように処理を分割することなく、処理対象となっている全ての翻訳結果を一つの画面で処理する。
ア 編集画面
図15を参照して、エディタ画面800は、編集対象を表示する表示フィールド814と、終了ボタン810と、「次へ」ボタン812とを含む。
A. Edit Screen Referring to FIG. 15,
表示フィールド814には、各々が原文と訳文と訳文の逆翻訳とを含む3文を単位とする文表示部820、822、824及び826等とが表示される。これら文表示部が表示フィールド814に表示しきれないときには、表示フィールド814の右端にスクロールボタン828が表示され、スクロールボタン828を操作することで処理対象となっている全ての訳文を表示し処理できる。
The
文表示部820等において、訳文部分(訳文編集フィールド)は編集可能である。また各訳文編集フィールドの間は例えばタブキー、矢印キー、マウス操作等により相互に移動可能である。したがって、必要であれば全ての訳文を一度に修正してから「次へ」ボタン812をクリックすることで全ての訳文を一度に更新できる。
In the
イ プログラム
図16を参照して、この変形例を実現するためのプログラムの制御構造をフローチャート形式で示す。図16に示すフローチャートは、図12に示すものを変形したものである。図16が図12と異なるのは、ステップ650においてデータ(原文とその訳文との対)を受信したときに、受信したデータに含まれる各訳文の逆翻訳を例えば図1に示す自動翻訳装置78により生成するステップ850と、これら逆翻訳と、その原文及び訳文の対とからなる全ての組を用いて図15に示すエディタ画面800を生成し表示するステップ852と、ステップ852に続いて編集者による指示を待機し、指示があったときに制御をステップ666に進めるステップ854を含むことと、図12のステップ680に代えて、ステップ854で受信した指示に応じた処理(図12と異なり、文表示部824の全体の編集を含む処理)を実行し制御をステップ854に戻すステップ856を含むこととである。
B. Program Referring to FIG. 16, the control structure of the program for realizing this modified example is shown in the form of a flow chart. The flowchart shown in FIG. 16 is a modification of that shown in FIG. FIG. 16 differs from FIG. 12 in that when data (a pair of an original text and its translated text) is received in
この変形例では、各文についての修正とエディタ画面800への反映とを一度に行うので、必要な修正を一度に行えるという利点がある。
In this modified example, each sentence is corrected and reflected on the
2 第2変形例
第2変形例も第1変形例と同様、図17及び図18の変形であり、翻訳結果編集装置において全ての原文、訳文及びその逆翻訳を一つの画面に表示する例である。
2 Second Modification The second modification is a modification of FIGS. 17 and 18, similar to the first modification, and is an example in which all the original sentences, translated sentences, and their reverse translations are displayed on one screen in the translation result editing device. be.
ア 編集画面
図17を参照して、この第2変形例に係る翻訳結果編集装置のエディタ画面900は、図15と同様、編集対象が表示される表示フィールド910と、終了ボタン810及び「次へ」ボタン812とが表示される。
A. Edit Screen Referring to FIG. 17, an
表示フィールド910にはこれも第1変形例と同様、各々が原文と訳文と訳文の逆翻訳とを含む3文を単位とする文表示部920、922、924、及び926等が表示される。これらの各々には、上から原文、訳文、そして訳文の逆翻訳がこの順番で表示される。また、表示フィールド910に全ての文表示部が表示できないときに、表示フィールド910の右端にスクロールボタン828が表示される点も図15と同様である。
In the
ただしこの例では、文表示部の左端にはOKボタンと呼ぶボタンが表示される。例えば文表示部920の左端には、OKボタン930が表示される。このOKボタン930は、文表示部920に表示されている訳文の編集が完了したことを示すためのものである。
However, in this example, a button called an OK button is displayed at the left end of the sentence display area. For example, an
この実施形態では、最初に文表示部920の訳文編集フィールドのみが編集可能であり、他の訳文編集フィールドは編集不可となっている。編集者が訳文を編集しOKボタン930をクリックすることにより、OKボタン930がハイライトされ、訳文編集フィールドが編集不可となる。そして次の文表示部922の訳文編集フィールドが編集可能になる。
In this embodiment, only the translation edit field in the
図17に示す例では、文表示部920及び922の編集が終了し、文表示部924が現在の編集対象となっている。
In the example shown in FIG. 17, editing of the
こうした処理を全ての訳文に対して行い、全ての訳文についてOKボタンをクリックしてハイライトさせた後に「次へ」ボタン812をクリックすると編集が終了する。したがってこの実施形態では、全てのOKボタンがハイライトされないと「次へ」ボタン812がクリック可能とならないようにしてもよい。
This process is performed for all the translated texts, and after all the translated texts are highlighted by clicking the OK button, the editing is completed by clicking the "Next"
イ プログラム
図18を参照して、この変形例に係る翻訳結果編集装置を実現するためのプログラムは図16に示すものと異なるのは、図16のステップ850の後に、図17に示す表示画面を生成し、文表示部920の編集を可能とし他は入力不可にするステップ950と、各訳文に対してOKフラグの配列を作成し全ての値を0(承認前)に初期化するステップ952とを含むこと、ステップ666の判定がNOのときに、指示がOKボタンであるか否かにより制御の流れを分岐させるステップ954と、ステップ954の判定が肯定のときに、編集対象となっている訳文に対応するOKフラグ配列の要素に「1」(承認後)を代入するステップ956と、ステップ956での処理の結果、全ての文表示部に対応するOKフラグ配列の要素の値が「1」となったか否かに従って制御の流れを分岐させるステップ958と、ステップ958の判定が否定のときに、処理中の文表示部の編集を不可にし、次の文表示部の編集を可能にするようエディタ画面900を編集して再表示して制御をステップ854に戻すステップ960とを含むことである。ステップ954の判定が否定のときには制御はステップ678に進み、後は図16と同様である。ステップ958の判定が肯定のときには、全ての訳文に対する編集が完了したということなので制御はステップ668に進み、編集結果を統括サーバ60に送信して制御はステップ658に戻る。
B. Program Referring to FIG. 18, the program for realizing the translation result editing apparatus according to this modification differs from that shown in FIG. 16 in that the display screen shown in FIG. a
ウ 動作
以上の説明から明らかなように、この第2変形例では、第1変形例と同様、一つの画面に全ての原文、訳文及びその逆翻訳を表示する。ただし第1変形例と異なり、編集完了は訳文の一つずつについて行い、先行する全ての訳文の編集が完了しないと次の訳文の編集を完了できない。そして全ての訳文の編集が完了した時点で編集結果を統括サーバ60に送信する。
C. Operation As is clear from the above description, in this second modification, as in the first modification, all original texts, translated texts, and their reverse translations are displayed on one screen. However, unlike the first modified example, editing is completed for each translated text, and editing of the next translated text cannot be completed until all preceding translated texts have been edited. Then, when the editing of all translated sentences is completed, the edited result is transmitted to the
この第2変形例によれば、第1変形例と同様、訳文全体について原文と逆翻訳とを対照しながら編集者が訳文の編集を行える。さらにこの第2変形例では、第1変形例とは異なり一つずつ訳文の編集を行う。したがって、編集者が処理対象の一つの訳文に注意を集中させることができるという効果もある。またこの第2変形例では、一つの訳文に対する編集を完了するとその訳文の編集に後戻りできない。したがって、翻訳の流れが停滞するおそれが小さくなるという効果もある。 According to the second modified example, as in the first modified example, the editor can edit the translated text while comparing the original text and the reverse translation for the entire translated text. Furthermore, in this second modification, translations are edited one by one, unlike the first modification. Therefore, there is also the effect that the editor can concentrate his attention on one translation to be processed. In addition, in this second modification, once editing of one translated sentence is completed, it is not possible to go back to editing that translated sentence. Therefore, there is also the effect of reducing the possibility that the flow of translation will stagnate.
3 第3変形例
ア 編集画面
この第3変形例では、編集画面は第2変形例と同じく図17に示すものを使用する。
3 Third Modification a Edit Screen In this third modification, the edit screen shown in FIG. 17 is used as in the second modification.
イ プログラム
図19にこの第3変形例に係る翻訳結果編集装置を実現するプログラムの制御構造をフローチャート形式で示す。図19を参照して、このプログラムが図18に示す第2変形例と異なるのは、ステップ850の後に、図17に示す表示画面を生成するステップ1000と、ステップ1000に表示されている編集対象の訳文について、1行目から最後の行まで順番にステップ1004を実行するステップ1002を含むこととである。図18と異なり、この実施形態ではステップ1000では1行目を入力可能にして表示する処理は行わない。代わりに、ステップ1004の内部で、処理対象の各行の入力を可能にしてから画面を表示する。
B. Program FIG. 19 is a flow chart showing the control structure of a program that implements the translation result editing apparatus according to the third modification. 19, this program differs from the second modification shown in FIG. 18 in that after
ステップ1004は、処理対象のOKボタンと訳文編集フィールドとをアクティベート(入力可能に)し、他の行についてはデアクティベート(入力不可に)して表示画面を更新するステップ1020と、指示の入力があるまで待機し、指示を受信すると指示に応じて制御を分岐させるステップ1022と、受信した指示がOKボタンであることに応答して、該当行(処理中の行)の編集結果の訳文を統括サーバ60に送信するステップ1024と、処理が完了した行を編集画面から削除するステップ1026と、編集画面を再表示して変更を反映させてステップ1004の処理を終了するステップ1028とを含む。
ステップ1004はさらにステップ1022で受けた指示が編集のときにその操作に応じた処理を実行するステップ1030と、ステップ1030の後に画面表示を更新することで編集結果を画面に反映させて制御をステップ1022に戻すステップ1032と、ステップ1022で受けた指示が処理の終了であるときに、必要な後処理を行ってこのプログラムの実行を終了するステップ1034とを含む。
ウ 動作
第2変形例では、編集を1行ずつ行うが、統括サーバ60への編集結果の送信は、全ての編集結果を最後にまとめて行っている。この第3変形例では、最初の画面表示は第2変形例と同様である。しかし、先頭の訳文から順番に編集可能にし、ある訳文の編集が完了してOKボタンが押されると、それに応答して、その訳文のデータのみを編集後のデータとして直ちに統括サーバ60に送信する点で第2変形例と異なる。またこの後にその訳文に関する表示は画面から消去する。したがって、第2変形例よりもさらに編集者の注意を処理対象の訳文に集中させることができる。編集者が既に編集の終わった訳文について考え直すことができないので、同時翻訳の流れが滞るという危険性を第2変形例よりさらに小さくできるという効果がある。
C. Operation In the second modified example, editing is performed line by line, but all the editing results are collectively sent to the
なお、上記各実施形態で使用した画面例は単なる例にすぎない。上記した画面例と異なる編集画面を採用してもよい。 Note that the screen examples used in the above embodiments are merely examples. An editing screen different from the screen examples described above may be adopted.
また、上記実施形態では、第1から第3まで、編集者を少なくとも3人用いている。しかしこの発明はそのような実施形態に限定されるわけではない。仮に音声認識結果の信頼性が非常に高いときには第1の編集者を省略できる可能性がある。また音声認識結果のチャンクへの分割の精度が非常に高いときには第2の編集者を省略できる可能性がある。もちろん、そのように各処理の精度が高い場合も編集者を配置する方が信頼性の点では好ましい。さらに、上記実施形態では、第1の編集者及び第2の編集者は、少なくとも第1言語に関する知識を持っていること、第3の編集者は、第1言語と第2言語の双方の知識を持っていることとしたが、この発明によれば第3の編集者も同時通訳者としての高い能力を持っている必要はない。そのため、第1言語と第2言語の双方の知識を持っている者であれば、第1編集者から第3編集者までのいずれの役割でも担うことができる。したがって、これらの編集者の間で作業分担を切り替えるようにしてもよい。 Also, in the above embodiment, at least three editors are used from the first to the third. However, the invention is not limited to such embodiments. If the reliability of the speech recognition result is very high, there is a possibility that the first editor can be omitted. Also, when the accuracy of dividing the speech recognition result into chunks is very high, there is a possibility that the second editor can be omitted. Of course, even when the accuracy of each process is high, it is preferable from the standpoint of reliability to assign an editor. Further, in the above embodiment, the first editor and the second editor have knowledge of at least the first language, and the third editor has knowledge of both the first language and the second language. However, according to the present invention, the third editor does not need to have a high ability as a simultaneous interpreter. Therefore, a person who has knowledge of both the first language and the second language can play any role from the first editor to the third editor. Therefore, the work sharing may be switched among these editors.
今回開示された実施形態は単に例示であって、本発明が上記した実施形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味及び範囲内での全ての変更を含む。 The embodiments disclosed this time are merely examples, and the present invention is not limited to the embodiments described above. The scope of the present invention is indicated by each claim in the scope of claims after taking into consideration the description of the detailed description of the invention, and all changes within the meaning and range of equivalents to the wording described therein include.
50 同時翻訳システム
60 統括サーバ
62 ネットワーク
64 音声認識装置
66 音声認識結果編集装置
68 発話分割装置
70 翻訳単位編集装置
72、78 自動翻訳装置
74 翻訳結果編集装置
76 音声合成装置
100 同時翻訳処理
210、302 編集フィールド
212 音声信号表示部
352 原文フィールド
354 訳文編集フィールド
358、410 原文
360、414 訳文
412 逆翻訳
814、910 表示フィールド
820、822、824、826、920、922、924、926 文表示部
50
Claims (6)
前記第1言語の音声信号を音声認識し、チャンクに分割して前記第1言語のチャンクからなるチャンク列を出力するチャンク列出力手段と、
前記チャンク列出力手段の出力する前記第1言語の前記チャンクの各々について、前記第2言語への自動翻訳を行い、前記第2言語のチャンクを出力する自動翻訳手段と、
前記自動翻訳手段の出力する前記第2言語のチャンクと、当該第2言語のチャンクに対応する前記第1言語のチャンクとが対照できるように、かつ前記第2言語の前記チャンクに対する第1の編集者による編集ができるように表示する表示装置を持ち、編集終了の指示を受けたことに応答して、当該編集された前記第2言語のテキストを出力するポストエディット手段とを含む、同時翻訳システム。 A simultaneous translation system for translating speech in a first language into a second language, comprising:
chunk string output means for recognizing the speech signal in the first language, dividing it into chunks, and outputting a chunk string consisting of chunks in the first language;
automatic translation means for automatically translating each of the chunks in the first language output by the chunk sequence output means into the second language and outputting the chunks in the second language;
a first editing of the chunk in the second language so that the chunk in the second language output by the automatic translation means can be compared with the chunk in the first language corresponding to the chunk in the second language; a post-editing means for outputting the edited text in the second language in response to receiving an instruction to end editing; .
前記表示装置はさらに、前記逆翻訳手段による逆翻訳結果を表示する、請求項1に記載の同時翻訳システム。 The simultaneous translation system further includes reverse translation means for translating the chunks of the second language into the first language;
2. The simultaneous translation system according to claim 1, wherein said display device further displays a back-translation result by said back-translation means.
前記表示装置はさらに、前記一致度を前記第2言語のチャンクの翻訳の信頼度として表示する、請求項2に記載の同時翻訳システム。 The post-editing means further includes matching degree calculation means for calculating a degree of matching between the translation result by the reverse translation means and the chunk in the first language, which is the original text of the chunk in the second language,
3. The simultaneous translation system of claim 2, wherein the display device further displays the degree of matching as a degree of confidence in the translation of the second language chunk.
前記同時翻訳システムはさらに、前記自動翻訳手段の出力を前記第1又は第2の前記ポストエディット手段に振り分けて入力し、当該入力に対する前記第1及び第2の前記ポストエディット手段の出力を正しい順番で統合する第1の統合手段を含む、請求項1から請求項3のいずれか1項に記載の同時翻訳システム。 The simultaneous translation system includes first and second post-editing means,
The simultaneous translation system further sorts and inputs the output of the automatic translation means to the first or second post-editing means, and outputs the outputs of the first and second post-editing means for the input in the correct order. 4. The simultaneous translation system according to any one of claims 1 to 3, comprising a first integration means for integrating with.
前記第1言語の音声信号を音声認識し前記第1言語のテキストを出力する音声認識テキスト出力手段と、
前記音声認識テキスト出力装置の出力する前記第1言語のテキストを自動的に前記チャンクに分割して前記第1言語の前記チャンク列を出力するテキスト自動分割手段と、
前記テキスト自動分割手段が出力する前記第1言語の前記チャンク列を、第2の編集者によるチャンク編集ができるように表示する表示装置を持ち、前記第2の編集者による編集終了の指示に応答して、当該表示されている前記第1言語の前記チャンク列を出力するチャンク列編集手段とを含む、請求項1から請求項4のいずれか1項に記載の同時翻訳システム。 The chunk string output means is
speech recognition text output means for recognizing speech signals in the first language and outputting text in the first language;
automatic text division means for automatically dividing the text in the first language output from the speech recognition text output device into the chunks and outputting the chunk string in the first language;
a display device for displaying the chunk string in the first language output by the automatic text division means so that a second editor can edit the chunks, and responds to an instruction to finish editing by the second editor; 5. The simultaneous translation system according to any one of claims 1 to 4, further comprising chunk string editing means for outputting the displayed chunk string in the first language.
コンピュータが、前記第1言語の音声信号を音声認識し、チャンクに分割して前記第1言語のチャンクからなるチャンク列を出力するステップと、
コンピュータが、前記第1言語の前記チャンクの各々について、前記第2言語への自動翻訳を行い、前記第2言語のチャンクを出力するステップと、
コンピュータが、前記第2言語のチャンクと、当該第2言語のチャンクに対応する前記第1言語のチャンクとが対照できるように、かつ前記第2言語の前記チャンクに対する第1の編集者による編集ができるように表示装置に表示するステップと、
コンピュータが前記第1の編集者による前記第2言語の前記チャンクに対する編集を受け付けるステップと、
コンピュータが、編集終了の指示を受けたことに応答して、前記編集を受け付けるステップにおいて編集された前記第2言語のテキストを出力するステップとを含む、同時翻訳方法。
A simultaneous translation method for translating speech in a first language into a second language, comprising:
a computer performing voice recognition on the first language audio signal, dividing it into chunks and outputting a chunk sequence of chunks in the first language;
a computer performing an automatic translation into the second language for each of the chunks in the first language and outputting chunks in the second language;
so that the computer can compare the chunks in the second language with the chunks in the first language corresponding to the chunks in the second language, and the editing by the first editor to the chunks in the second language displaying on a display device such that
a computer accepting edits to the chunk in the second language by the first editor;
and a computer, in response to receiving an instruction to end editing, outputting said second language text edited in said step of accepting edits.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021055726A JP2022152805A (en) | 2021-03-29 | 2021-03-29 | Simultaneous translation system and method |
PCT/JP2022/007486 WO2022209448A1 (en) | 2021-03-29 | 2022-02-24 | Simultaneous translation system and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021055726A JP2022152805A (en) | 2021-03-29 | 2021-03-29 | Simultaneous translation system and method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022152805A true JP2022152805A (en) | 2022-10-12 |
Family
ID=83455978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021055726A Pending JP2022152805A (en) | 2021-03-29 | 2021-03-29 | Simultaneous translation system and method |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2022152805A (en) |
WO (1) | WO2022209448A1 (en) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0869469A (en) * | 1994-08-31 | 1996-03-12 | Kobe Nippon Denki Software Kk | Mechanical translation method |
JPWO2013014877A1 (en) * | 2011-07-28 | 2015-02-23 | 日本電気株式会社 | Reliability calculation device, translation reliability calculation utilization method, and translation engine program |
JP6334354B2 (en) * | 2014-09-30 | 2018-05-30 | 株式会社東芝 | Machine translation apparatus, method and program |
-
2021
- 2021-03-29 JP JP2021055726A patent/JP2022152805A/en active Pending
-
2022
- 2022-02-24 WO PCT/JP2022/007486 patent/WO2022209448A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2022209448A1 (en) | 2022-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7668718B2 (en) | Synchronized pattern recognition source data processed by manual or automatic means for creation of shared speaker-dependent speech user profile | |
US6789231B1 (en) | Method and system for providing alternatives for text derived from stochastic input sources | |
US6611802B2 (en) | Method and system for proofreading and correcting dictated text | |
US8239207B2 (en) | Speech-enabled language translation system and method enabling interactive user supervision of translation and speech recognition accuracy | |
US7562288B2 (en) | System for concurrent display and textual annotation of prepared materials by voice-to-text converted input | |
US8620139B2 (en) | Utilizing subtitles in multiple languages to facilitate second-language learning | |
JP4987623B2 (en) | Apparatus and method for interacting with user by voice | |
US9552354B1 (en) | Method and apparatus for cross-lingual communication | |
US20140172411A1 (en) | Apparatus and method for verifying context | |
US20120016671A1 (en) | Tool and method for enhanced human machine collaboration for rapid and accurate transcriptions | |
JPH07140998A (en) | Voice recognition interface | |
CN110740275B (en) | Nonlinear editing system | |
CN110781649A (en) | Subtitle editing method and device, computer storage medium and electronic equipment | |
Ciobanu et al. | Speech recognition and synthesis technologies in the translation workflow | |
JPWO2011033834A1 (en) | Speech translation system, speech translation method, and recording medium | |
Pražák et al. | Live TV subtitling through respeaking with remote cutting-edge technology | |
KR20240024960A (en) | Robust direct speech-to-speech translation | |
Skidmore | Incremental disfluency detection for spoken learner english | |
WO2022209448A1 (en) | Simultaneous translation system and method | |
JP2006236037A (en) | Voice interaction content creation method, device, program and recording medium | |
Tzoukermann et al. | Evaluating automatic speech recognition in translation | |
KR20230076509A (en) | service method of automatically generating subtitles of video contents | |
JP2003162524A (en) | Language processor | |
JP5383608B2 (en) | Broadcast sentence creation support device and program | |
WO2021161856A1 (en) | Information processing device and information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240220 |