JP4271224B2 - 音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよびシステム - Google Patents
音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよびシステム Download PDFInfo
- Publication number
- JP4271224B2 JP4271224B2 JP2006263116A JP2006263116A JP4271224B2 JP 4271224 B2 JP4271224 B2 JP 4271224B2 JP 2006263116 A JP2006263116 A JP 2006263116A JP 2006263116 A JP2006263116 A JP 2006263116A JP 4271224 B2 JP4271224 B2 JP 4271224B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- output
- voice
- translated
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013519 translation Methods 0.000 title claims abstract description 286
- 238000000034 method Methods 0.000 title claims description 161
- 238000003860 storage Methods 0.000 claims abstract description 147
- 238000012545 processing Methods 0.000 claims description 144
- 230000005540 biological transmission Effects 0.000 claims description 74
- 238000004904 shortening Methods 0.000 claims description 26
- 230000003111 delayed effect Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 description 129
- 238000010586 diagram Methods 0.000 description 56
- 230000006870 function Effects 0.000 description 22
- 230000015572 biosynthetic process Effects 0.000 description 12
- 238000003786 synthesis reaction Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 9
- 238000013507 mapping Methods 0.000 description 8
- 238000003384 imaging method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Description
第1の実施の形態にかかる音声翻訳装置は、翻訳元の音声の任意の音声区間についての翻訳音声がすべて揃うまでは翻訳音声を記憶しておき、すべての言語の翻訳音声が揃った時点で音声を出力するものである。
第1の実施の形態では、生成部140が出力した音声をすべて音声記憶部110の音声と混合して保存していた。この場合、音声を発話した本人の端末装置200に対しても混合音声を出力するため、自分自身の発話した音声が遅れて出力される現象(エコー)が発生しうる。すなわち、発話の途中で自分の声が聞こえることにより、話し手が発話しにくくなるという欠点が存在する。
第3の実施の形態にかかる音声翻訳装置は、翻訳音声を翻訳処理完了後に直ちに端末装置に送信して端末装置側で音声情報を記憶することにより、ネットワークを原因とする遅延を回避するものである。
第1から第3の実施の形態は、クライアントサーバ型のシステム構成であり、翻訳処理をサーバ装置に相当する音声翻訳装置で実行し、クライアント装置に相当する端末装置では、翻訳処理結果の音声を出力するだけであった。
第5の実施の形態にかかる音声翻訳装置は、所定の遅延時間を経過後に翻訳音声を出力することにより、音声の途切れを最小限に抑止するものである。
第5の実施の形態では、遅延部により出力可能であると判定した場合であっても、先に出力すべき音声がまだ出力中であれば、その出力処理が終了するまで待つことになる。このため、一旦、所定の遅延時間(tdelay)を超えて翻訳処理の遅延が発生すると、実質的にはその時間が遅延時間となるという問題がある。すなわち、tdelay以上に翻訳処理が遅延した場合、遅延時間をtdelayにまで戻すことができない。
「出力」行では、音声が出力された時刻と対応づけられた出力音声区間が示されている。「短縮部の出力」行では、短縮部3454から音声が出力された時刻と対応づけられた区間が示されている。
第6の実施の形態では、一定の遅延時間(tdelay)を事前に設定しておき、少なくともその時間は遅延させて音声を出力していた。これに対し、遅延時間を固定とするのではなく、過去の翻訳処理の遅延を参照して動的に変動させた遅延時間を用いて遅延処理を行う変形例が考えられる。
質問に対する返事(「はい」、「いいえ」)などのような短い発声を元にして、上述の変形例1のように遅延時間の算出を行うと、所定の遅延時間tdelayが過小となり、音声の途切れの発声や、出力速度の増加が頻繁に発生する可能性が高い。これを避けるため、短い発声をtdelayの算出に使用しない変形例が考えられる。すなわち、音声翻訳の元の音声の長さが所定の長さ以下の場合はtdelayの算出にその区間を使用しないようにする。
第7の実施の形態にかかる音声翻訳装置は、音声とともに動画を入力する端末装置から音声と動画を受信し、端末装置に対し、翻訳した音声と同期して動画を出力するものである。
52 ROM
53 RAM
54 通信I/F
61 バス
100 音声翻訳装置
110 音声記憶部
11n 言語n記憶部
120 対応記憶部
121 マッピングテーブル
130 受信部
140 生成部
150 出力制御部
151 判定部
152 出力処理部
160 送信部
161 送信先決定部
200 端末装置
201 音声入力部
202 第1送信部
203 受信部
204 音声出力部
300 ネットワーク
1500 音声翻訳装置
1510 音声記憶部
151n 端末N記憶部
1550 出力制御部
1552 出力処理部
1560 送信部
1562 混合部
1800 端末装置
1805 保存部
1806 第2受信部
1807 出力処理部
1810 音声記憶部
2000 音声翻訳装置
2030 受信部
2040 生成部
2050 出力制御部
2052 出力処理部
2060 送信部
2600 音声翻訳装置
2610 音声記憶部
261n 装置n記憶部
2620 言語記憶部
2650 生成部
2651 判定部
2652 出力処理部
2660 出力制御部
2670 第2受信部
3000 音声翻訳装置
3050 出力制御部
3053 遅延部
3400 音声翻訳装置
3450 出力制御部
3454 短縮部
3800 端末装置
3801 撮像部
3802 第2受信部
3803 画像表示部
3900 音声翻訳装置
3930 受信部
3950 出力制御部
3960 送信部
3970 動画記憶部
397n 端末n記憶部
4100 表示画面
4101 プログレスバー
4102 表示領域
4103 プログレスバー
Claims (21)
- ネットワークを介して複数の端末装置に接続可能な音声翻訳装置であって、
前記端末装置を識別する識別子と、前記端末装置で使用する使用言語とを対応づけて記憶する対応記憶手段と、
前記端末装置から音声を受信する受信手段と、
受信した前記音声の言語である原言語と異なる前記使用言語を前記対応記憶手段から取得し、取得した前記使用言語のそれぞれを対象言語として前記音声を翻訳した翻訳音声を生成する生成手段と、
任意の前記対象言語の前記翻訳音声が生成された場合に、すべての前記対象言語で前記翻訳音声が生成されたか否かを判定する判定手段と、
すべての前記対象言語で前記翻訳音声が生成されたと判定された場合に、生成された前記翻訳音声を出力する出力処理手段と、
出力された前記翻訳音声を、前記対応記憶手段における前記対象言語に対応する前記識別子で識別される前記端末装置に送信する送信手段と、
を備えたことを特徴とする音声翻訳装置。 - さらに、前記出力処理手段は、すべての前記対象言語で前記翻訳音声が生成されたと判定された場合に、前記音声を出力し、
前記送信手段は、出力された前記音声を、前記対応記憶手段における前記原言語に対応する前記識別子で識別される前記端末装置に送信すること、
を特徴とする請求項1に記載の音声翻訳装置。 - 前記判定手段は、任意の前記対象言語の前記翻訳音声が生成された場合に、生成された前記翻訳音声の前記対象言語である第1言語で次に出力すべき第1音声区間と、前記第1言語以外の前記対象言語で前記第1音声区間の終端時刻より前に出力すべき第2音声区間とに対して、すべての前記対象言語で前記翻訳音声が生成されたか否かを判定し、
前記出力処理手段は、すべての前記対象言語で前記翻訳音声が生成されたと判定された場合に、前記第1音声区間と前記第2音声区間とに対応する前記翻訳音声と前記音声とを出力すること、
を特徴とする請求項1に記載の音声翻訳装置。 - 前記生成手段は、複数の前記対象言語のそれぞれについて発声時間が略同一である前記翻訳音声を生成すること、
を特徴とする請求項1に記載の音声翻訳装置。 - 前記生成手段は、複数の前記対象言語間で前記翻訳音声の発声時間が略同一でない場合に、前記翻訳音声の発声速度を増減することにより複数の前記対象言語のそれぞれについて発声時間が略同一である前記翻訳音声を生成すること、
を特徴とする請求項4に記載の音声翻訳装置。 - 前記生成手段は、複数の前記対象言語間で前記翻訳音声の発声時間が略同一でない場合に、前記翻訳音声の前または後ろの少なくとも一方に無音の音声を付加することにより複数の前記対象言語のそれぞれについて発声時間が略同一である前記翻訳音声を生成すること、
を特徴とする請求項4に記載の音声翻訳装置。 - 前記対象言語ごとに前記翻訳音声または前記音声を混合した混合音声を記憶可能な音声記憶手段をさらに備え、
前記出力処理手段は、さらに前記音声記憶手段に記憶された前記混合音声と生成された前記翻訳音声または前記音声とを前記対象言語ごとに混合し、混合した前記混合音声を前記音声記憶手段に保存し、すべての前記対象言語で前記翻訳音声が生成されたと判定された場合に前記混合音声を出力すること、
を特徴とする請求項1に記載の音声翻訳装置。 - 前記端末装置のそれぞれについて、前記対象言語ごとに前記翻訳音声または前記音声を記憶可能な音声記憶手段をさらに備え、
前記出力処理手段は、さらに生成された前記翻訳音声と前記音声とを前記音声記憶手段に保存し、すべての前記対象言語で前記翻訳音声が生成されたと判定された場合に、前記対象言語の前記翻訳音声と前記音声とを前記音声記憶手段から取得して出力し、
前記送信手段は、前記音声の送信元である前記端末装置に対しては、前記音声記憶手段に記憶された前記端末装置に対応する前記対象言語の前記翻訳音声のみを前記対象言語ごとに混合して送信し、前記音声の送信元でない前記端末装置に対しては、前記音声記憶手段に記憶された前記端末装置に対応する前記対象言語の前記翻訳音声および前記音声を前記対象言語ごとに混合して送信すること、
を特徴とする請求項1に記載の音声翻訳装置。 - すべての前記対象言語で前記翻訳音声が生成されたと判定された第1時刻から、前記音声が受信された第2時刻を減算した第1差分を算出し、算出した前記第1差分が予め定められた第1閾値より小さい場合に、前記第2時刻から前記第1閾値が経過するまで前記翻訳音声と前記音声との出力を遅延する遅延手段をさらに備え、
前記出力処理手段は、前記遅延手段による遅延後に、生成された前記翻訳音声と前記音声とを出力すること、
を特徴とする請求項1に記載の音声翻訳装置。 - 前記第1差分が前記第1閾値より大きい場合に、前記出力処理手段によって出力された前記翻訳音声と前記音声との発声時間を、前記第1差分から前記第1閾値を減算した第2差分に相当する時間だけ短縮する短縮手段をさらに備えたこと、
を特徴とする請求項9に記載の音声翻訳装置。 - 前記短縮手段は、前記翻訳音声と前記音声との発声速度を増加させることにより前記翻訳音声と前記音声との発声時間を短縮すること、
を特徴とする請求項10に記載の音声翻訳装置。 - 前記短縮手段は、前記翻訳音声と前記音声とのそれぞれに含まれる無音または雑音の少なくとも一方を検出し、検出した無音または雑音を削除することにより、前記翻訳音声と前記音声との発声時間を短縮すること、
を特徴とする請求項10に記載の音声翻訳装置。 - 前記遅延手段は、すべての前記対象言語で前記翻訳音声が生成されたと判定された第1音声区間より前に前記翻訳音声と前記音声とが出力済みである予め定められた個数の第2音声区間のそれぞれについて、前記第1時刻から前記第2時刻を減算した第1差分を算出し、算出した前記第1差分の平均値と予め定められた係数との積を算出し、算出した前記積より前記第1差分が小さい場合に、前記第2時刻から前記第1閾値が経過するまで、前記第1音声区間の前記翻訳音声と前記音声との出力を遅延すること、
を特徴とする請求項9に記載の音声翻訳装置。 - 前記遅延手段は、前記第1音声区間より前に前に前記翻訳音声と前記音声とが出力済みであり、予め定められた第2閾値より大きい前記個数の前記第2音声区間を用いて前記積を算出すること、
を特徴とする請求項13に記載の音声翻訳装置。 - 前記受信手段は、前記端末装置から前記音声と対応づけられた映像をさらに受信し、
前記送信手段は、前記翻訳音声または前記音声に前記映像をさらに対応づけて送信すること、
を特徴とする請求項1に記載の音声翻訳装置。 - 前記生成手段は、受信した前記音声と発声時間が略同一である前記翻訳音声を生成すること、
を特徴とする請求項15に記載の音声翻訳装置。 - 前記生成手段は、受信した前記音声の発声時間より前記翻訳音声の発声時間が短い場合に、前記翻訳音声の前または後ろの少なくとも一方に無音の音声を付加することにより、受信した前記音声と発声時間が略同一である前記翻訳音声を生成すること、
を特徴とする請求項16に記載の音声翻訳装置。 - 複数の端末装置と、ネットワークを介して複数の前記端末装置に接続可能な音声翻訳装置とを備えたシステムであって、
前記音声翻訳装置は、
前記端末装置を識別する識別子と、前記端末装置で使用する使用言語とを対応づけて記憶する対応記憶手段と、
前記端末装置から音声を受信する第1受信手段と、
受信した前記音声の言語である原言語と異なる前記使用言語を前記対応記憶手段から取得し、取得した前記使用言語のそれぞれを対象言語として前記音声を翻訳した翻訳音声を生成する生成手段と、
生成された前記翻訳音声を、前記対応記憶手段における前記対象言語に対応する前記識別子で識別される前記端末装置に送信し、受信された前記音声を、前記対応記憶手段における前記原言語に対応する前記識別子で識別される前記端末装置に送信する第1送信手段と、
任意の前記対象言語の前記翻訳音声が生成された場合に、すべての前記対象言語で前記翻訳音声が生成されたか否かを判定する判定手段と、
すべての前記対象言語で前記翻訳音声が生成されたと判定された場合に、判定された前記音声の区間である音声区間に関する区間情報を出力する第1出力処理手段と、を備え、
前記第1送信手段は、さらに出力された前記区間情報を前記端末装置に送信し、
前記端末装置それぞれは、
前記翻訳音声または前記音声を混合した混合音声を記憶可能な音声記憶手段と、
音声を入力する音声入力手段と、
入力された前記音声を前記音声翻訳装置に送信する第2送信手段と、
送信した前記音声の翻訳結果であって、前記翻訳音声を前記音声翻訳装置から受信する第2受信手段と、
前記音声記憶手段に記憶された前記混合音声に対して、受信した前記翻訳音声を混合し、混合した前記混合音声を前記音声記憶手段に保存する保存手段と、
前記音声翻訳装置から前記音声の区間である音声区間に関する区間情報を受信する第3受信手段と、
受信した前記区間情報で表される前記音声区間の前記混合音声を前記音声記憶手段から取得して出力する第2出力処理手段と、を備えたこと
を特徴とするシステム。 - ネットワークを介して複数の外部音声翻訳装置に接続可能な音声翻訳装置であって、
使用言語を記憶する言語記憶手段と、
前記外部音声翻訳装置から音声を受信する第1受信手段と、
前記言語記憶手段に記憶された前記使用言語を対象言語として前記音声を翻訳した翻訳音声を生成する生成手段と、
前記音声を前記外部音声翻訳装置の前記使用言語を対象言語として翻訳した翻訳音声を前記外部音声翻訳装置から受信する第2受信手段と、
任意の前記外部音声翻訳装置から前記翻訳音声を受信した場合に、すべての前記外部音声翻訳装置から前記翻訳音声を受信したか否かを判定する判定手段と、
すべての前記外部音声翻訳装置から前記翻訳音声を受信したと判定された場合に、生成手段により生成された前記翻訳音声を出力する出力処理手段と、
を備えたことを特徴とする音声翻訳装置。 - ネットワークを介して複数の端末装置に接続可能な音声翻訳装置における音声翻訳方法であって、
受信手段によって、前記端末装置から音声を受信する受信ステップと、
生成手段によって、前記端末装置を識別する識別子と、前記端末装置で使用する使用言語とを対応づけて記憶する対応記憶手段から、受信した前記音声の言語である原言語と異なる前記使用言語を取得し、取得した前記使用言語のそれぞれを対象言語として前記音声を翻訳した翻訳音声を生成する生成ステップと、
判定手段によって、任意の前記対象言語の前記翻訳音声が生成された場合に、すべての前記対象言語で前記翻訳音声が生成されたか否かを判定する判定ステップと、
出力処理手段によって、すべての前記対象言語で前記翻訳音声が生成されたと判定された場合に、生成された前記翻訳音声を出力する出力処理ステップと、
送信手段によって、出力された前記翻訳音声を、前記対応記憶手段における前記対象言語に対応する前記識別子で識別される前記端末装置に送信する送信ステップと、
を備えたことを特徴とする音声翻訳方法。 - ネットワークを介して複数の端末装置に接続可能な音声翻訳装置として機能するコンピュータに実行させるための音声翻訳プログラムであって、
前記端末装置から音声を受信する受信手順と、
前記端末装置を識別する識別子と、前記端末装置で使用する使用言語とを対応づけて記憶する対応記憶手段から、受信した前記音声の言語である原言語と異なる前記使用言語を取得し、取得した前記使用言語のそれぞれを対象言語として前記音声を翻訳した翻訳音声を生成する生成手順と、
任意の前記対象言語の前記翻訳音声が生成された場合に、すべての前記対象言語で前記翻訳音声が生成されたか否かを判定する判定手順と、
すべての前記対象言語で前記翻訳音声が生成されたと判定された場合に、生成された前記翻訳音声を出力する出力処理手順と、
出力された前記翻訳音声を、前記対応記憶手段における前記対象言語に対応する前記識別子で識別される前記端末装置に送信する送信手順と、
を前記コンピュータに実行させるための音声翻訳プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006263116A JP4271224B2 (ja) | 2006-09-27 | 2006-09-27 | 音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよびシステム |
US11/723,409 US8078449B2 (en) | 2006-09-27 | 2007-03-19 | Apparatus, method and computer program product for translating speech, and terminal that outputs translated speech |
CNA2007101472315A CN101155291A (zh) | 2006-09-27 | 2007-08-30 | 语音翻译设备、语音翻译方法以及输出经翻译的语音的终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006263116A JP4271224B2 (ja) | 2006-09-27 | 2006-09-27 | 音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよびシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008083376A JP2008083376A (ja) | 2008-04-10 |
JP4271224B2 true JP4271224B2 (ja) | 2009-06-03 |
Family
ID=39226149
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006263116A Active JP4271224B2 (ja) | 2006-09-27 | 2006-09-27 | 音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよびシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8078449B2 (ja) |
JP (1) | JP4271224B2 (ja) |
CN (1) | CN101155291A (ja) |
Families Citing this family (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101496387B (zh) | 2006-03-06 | 2012-09-05 | 思科技术公司 | 用于移动无线网络中的接入认证的系统和方法 |
CN1937664B (zh) * | 2006-09-30 | 2010-11-10 | 华为技术有限公司 | 一种实现多语言会议的系统及方法 |
US20080243475A1 (en) * | 2007-03-16 | 2008-10-02 | Steven Scott Everhart | Web content translation system, method, and software |
US20080300855A1 (en) * | 2007-05-31 | 2008-12-04 | Alibaig Mohammad Munwar | Method for realtime spoken natural language translation and apparatus therefor |
US8570373B2 (en) * | 2007-06-08 | 2013-10-29 | Cisco Technology, Inc. | Tracking an object utilizing location information associated with a wireless device |
US8355041B2 (en) * | 2008-02-14 | 2013-01-15 | Cisco Technology, Inc. | Telepresence system for 360 degree video conferencing |
US8797377B2 (en) | 2008-02-14 | 2014-08-05 | Cisco Technology, Inc. | Method and system for videoconference configuration |
US8319819B2 (en) * | 2008-03-26 | 2012-11-27 | Cisco Technology, Inc. | Virtual round-table videoconference |
US8390667B2 (en) | 2008-04-15 | 2013-03-05 | Cisco Technology, Inc. | Pop-up PIP for people not in picture |
US8694658B2 (en) | 2008-09-19 | 2014-04-08 | Cisco Technology, Inc. | System and method for enabling communication sessions in a network environment |
US8659637B2 (en) * | 2009-03-09 | 2014-02-25 | Cisco Technology, Inc. | System and method for providing three dimensional video conferencing in a network environment |
US8477175B2 (en) | 2009-03-09 | 2013-07-02 | Cisco Technology, Inc. | System and method for providing three dimensional imaging in a network environment |
US20100283829A1 (en) * | 2009-05-11 | 2010-11-11 | Cisco Technology, Inc. | System and method for translating communications between participants in a conferencing environment |
US8659639B2 (en) * | 2009-05-29 | 2014-02-25 | Cisco Technology, Inc. | System and method for extending communications between participants in a conferencing environment |
US9082297B2 (en) | 2009-08-11 | 2015-07-14 | Cisco Technology, Inc. | System and method for verifying parameters in an audiovisual environment |
US9225916B2 (en) * | 2010-03-18 | 2015-12-29 | Cisco Technology, Inc. | System and method for enhancing video images in a conferencing environment |
USD628968S1 (en) | 2010-03-21 | 2010-12-14 | Cisco Technology, Inc. | Free-standing video unit |
USD628175S1 (en) | 2010-03-21 | 2010-11-30 | Cisco Technology, Inc. | Mounted video unit |
USD626103S1 (en) | 2010-03-21 | 2010-10-26 | Cisco Technology, Inc. | Video unit with integrated features |
USD626102S1 (en) | 2010-03-21 | 2010-10-26 | Cisco Tech Inc | Video unit with integrated features |
US20110246172A1 (en) * | 2010-03-30 | 2011-10-06 | Polycom, Inc. | Method and System for Adding Translation in a Videoconference |
US9313452B2 (en) | 2010-05-17 | 2016-04-12 | Cisco Technology, Inc. | System and method for providing retracting optics in a video conferencing environment |
US20120046933A1 (en) * | 2010-06-04 | 2012-02-23 | John Frei | System and Method for Translation |
US20120330643A1 (en) * | 2010-06-04 | 2012-12-27 | John Frei | System and method for translation |
US8433372B2 (en) * | 2010-07-06 | 2013-04-30 | Research In Motion Limited | System and method for providing feedback to a caller in response to the modulation of an incoming voice communication |
EP2405632B1 (en) * | 2010-07-06 | 2012-10-24 | Research In Motion Limited | System and method for providing feedback to a caller in response to the modulation of an incoming voice communication |
US8775156B2 (en) * | 2010-08-05 | 2014-07-08 | Google Inc. | Translating languages in response to device motion |
US8896655B2 (en) | 2010-08-31 | 2014-11-25 | Cisco Technology, Inc. | System and method for providing depth adaptive video conferencing |
US8599934B2 (en) | 2010-09-08 | 2013-12-03 | Cisco Technology, Inc. | System and method for skip coding during video conferencing in a network environment |
JP5704686B2 (ja) * | 2010-09-28 | 2015-04-22 | 独立行政法人情報通信研究機構 | 音声翻訳システム、音声翻訳装置、音声翻訳方法、およびプログラム |
US8599865B2 (en) | 2010-10-26 | 2013-12-03 | Cisco Technology, Inc. | System and method for provisioning flows in a mobile network environment |
US8699457B2 (en) | 2010-11-03 | 2014-04-15 | Cisco Technology, Inc. | System and method for managing flows in a mobile network environment |
US9143725B2 (en) | 2010-11-15 | 2015-09-22 | Cisco Technology, Inc. | System and method for providing enhanced graphics in a video environment |
US9338394B2 (en) | 2010-11-15 | 2016-05-10 | Cisco Technology, Inc. | System and method for providing enhanced audio in a video environment |
US8902244B2 (en) | 2010-11-15 | 2014-12-02 | Cisco Technology, Inc. | System and method for providing enhanced graphics in a video environment |
US8730297B2 (en) | 2010-11-15 | 2014-05-20 | Cisco Technology, Inc. | System and method for providing camera functions in a video environment |
US8542264B2 (en) | 2010-11-18 | 2013-09-24 | Cisco Technology, Inc. | System and method for managing optics in a video environment |
US8723914B2 (en) | 2010-11-19 | 2014-05-13 | Cisco Technology, Inc. | System and method for providing enhanced video processing in a network environment |
US9111138B2 (en) | 2010-11-30 | 2015-08-18 | Cisco Technology, Inc. | System and method for gesture interface control |
USD682864S1 (en) | 2010-12-16 | 2013-05-21 | Cisco Technology, Inc. | Display screen with graphical user interface |
USD678894S1 (en) | 2010-12-16 | 2013-03-26 | Cisco Technology, Inc. | Display screen with graphical user interface |
USD682854S1 (en) | 2010-12-16 | 2013-05-21 | Cisco Technology, Inc. | Display screen for graphical user interface |
USD678308S1 (en) | 2010-12-16 | 2013-03-19 | Cisco Technology, Inc. | Display screen with graphical user interface |
USD678320S1 (en) | 2010-12-16 | 2013-03-19 | Cisco Technology, Inc. | Display screen with graphical user interface |
USD682293S1 (en) | 2010-12-16 | 2013-05-14 | Cisco Technology, Inc. | Display screen with graphical user interface |
USD682294S1 (en) | 2010-12-16 | 2013-05-14 | Cisco Technology, Inc. | Display screen with graphical user interface |
USD678307S1 (en) | 2010-12-16 | 2013-03-19 | Cisco Technology, Inc. | Display screen with graphical user interface |
JP5727777B2 (ja) * | 2010-12-17 | 2015-06-03 | 株式会社東芝 | 会議支援装置および会議支援方法 |
US9164988B2 (en) * | 2011-01-14 | 2015-10-20 | Lionbridge Technologies, Inc. | Methods and systems for the dynamic creation of a translated website |
US8692862B2 (en) | 2011-02-28 | 2014-04-08 | Cisco Technology, Inc. | System and method for selection of video data in a video conference environment |
US8670019B2 (en) | 2011-04-28 | 2014-03-11 | Cisco Technology, Inc. | System and method for providing enhanced eye gaze in a video conferencing environment |
US8786631B1 (en) | 2011-04-30 | 2014-07-22 | Cisco Technology, Inc. | System and method for transferring transparency information in a video environment |
US8934026B2 (en) | 2011-05-12 | 2015-01-13 | Cisco Technology, Inc. | System and method for video coding in a dynamic environment |
US8947493B2 (en) | 2011-11-16 | 2015-02-03 | Cisco Technology, Inc. | System and method for alerting a participant in a video conference |
US8682087B2 (en) | 2011-12-19 | 2014-03-25 | Cisco Technology, Inc. | System and method for depth-guided image filtering in a video conference environment |
US8874429B1 (en) * | 2012-05-18 | 2014-10-28 | Amazon Technologies, Inc. | Delay in video for language translation |
US20140081618A1 (en) * | 2012-09-17 | 2014-03-20 | Salesforce.Com, Inc. | Designing a website to be displayed in multiple languages |
US9160967B2 (en) * | 2012-11-13 | 2015-10-13 | Cisco Technology, Inc. | Simultaneous language interpretation during ongoing video conferencing |
US9681154B2 (en) | 2012-12-06 | 2017-06-13 | Patent Capital Group | System and method for depth-guided filtering in a video conference environment |
US9843621B2 (en) | 2013-05-17 | 2017-12-12 | Cisco Technology, Inc. | Calendaring activities based on communication processing |
US9595271B2 (en) * | 2013-06-27 | 2017-03-14 | Getgo, Inc. | Computer system employing speech recognition for detection of non-speech audio |
JP2015060332A (ja) * | 2013-09-18 | 2015-03-30 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法およびプログラム |
JP2015060423A (ja) * | 2013-09-19 | 2015-03-30 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法およびプログラム |
JP5958475B2 (ja) * | 2014-01-17 | 2016-08-02 | 株式会社デンソー | 音声認識端末装置、音声認識システム、音声認識方法 |
CN105786801A (zh) * | 2014-12-22 | 2016-07-20 | 中兴通讯股份有限公司 | 一种语音翻译方法、通讯方法及相关装置 |
JP6596903B2 (ja) * | 2015-04-22 | 2019-10-30 | ヤマハ株式会社 | 情報提供システムおよび情報提供方法 |
JP6470097B2 (ja) | 2015-04-22 | 2019-02-13 | 株式会社東芝 | 通訳装置、方法およびプログラム |
US20170060850A1 (en) * | 2015-08-24 | 2017-03-02 | Microsoft Technology Licensing, Llc | Personal translator |
CN106384589A (zh) * | 2016-03-07 | 2017-02-08 | 陈勇 | 个性语音录入器 |
JP2017167805A (ja) | 2016-03-16 | 2017-09-21 | 株式会社東芝 | 表示支援装置、方法およびプログラム |
US9747282B1 (en) * | 2016-09-27 | 2017-08-29 | Doppler Labs, Inc. | Translation with conversational overlap |
CN109478206B (zh) * | 2017-01-17 | 2020-10-20 | 乐夫兰度株式会社 | 多语言沟通系统及多语言沟通提供方法 |
US10089305B1 (en) * | 2017-07-12 | 2018-10-02 | Global Tel*Link Corporation | Bidirectional call translation in controlled environment |
EP3474156A1 (en) * | 2017-10-20 | 2019-04-24 | Tap Sound System | Real-time voice processing |
US11328130B2 (en) * | 2017-11-06 | 2022-05-10 | Orion Labs, Inc. | Translational bot for group communication |
US20190220520A1 (en) * | 2018-01-16 | 2019-07-18 | Chih Hung Kao | Simultaneous interpretation system, server system, simultaneous interpretation device, simultaneous interpretation method, and computer-readable recording medium |
CN111758264A (zh) | 2018-02-26 | 2020-10-09 | 谷歌有限责任公司 | 预先录制的视频的自动语音翻译配音 |
CN109286725B (zh) * | 2018-10-15 | 2021-10-19 | 华为技术有限公司 | 翻译方法及终端 |
CN118711577A (zh) | 2018-12-14 | 2024-09-27 | 谷歌有限责任公司 | 用于联网系统的基于语音的接口 |
KR20210032809A (ko) * | 2019-09-17 | 2021-03-25 | 삼성전자주식회사 | 동시 통역 방법 및 장치 |
JP6710818B1 (ja) * | 2020-01-24 | 2020-06-17 | 日本電気株式会社 | 翻訳装置、翻訳方法、プログラム |
WO2021236025A1 (en) * | 2020-05-18 | 2021-11-25 | Hamadi Fawaz | Instant and autonomic translation system and method |
US20230262283A1 (en) * | 2020-06-16 | 2023-08-17 | Nippon Telegraph And Telephone Corporation | Transmission apparatus, communication method and program |
KR20220029912A (ko) | 2020-09-02 | 2022-03-10 | 삼성전자주식회사 | 통역 상황 정보를 제공하는 방법 및 장치 |
CN112233649B (zh) * | 2020-10-15 | 2024-04-30 | 安徽听见科技有限公司 | 机器同声传译输出音频动态合成方法、装置以及设备 |
WO2022093192A1 (en) * | 2020-10-27 | 2022-05-05 | Google Llc | Method and system for text-to-speech synthesis of streaming text |
KR102264224B1 (ko) * | 2020-12-30 | 2021-06-11 | 주식회사 버넥트 | 실시간 번역 서비스 기반의 원격 커뮤니케이션 방법 및 그 시스템 |
KR20230067321A (ko) * | 2021-11-09 | 2023-05-16 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2773652B2 (ja) * | 1994-08-04 | 1998-07-09 | 日本電気株式会社 | 機械翻訳装置 |
US5875422A (en) * | 1997-01-31 | 1999-02-23 | At&T Corp. | Automatic language translation technique for use in a telecommunications network |
JPH10283356A (ja) | 1997-04-03 | 1998-10-23 | Toshiba Corp | ネットワークを用いた翻訳処理システム、翻訳処理方法および翻訳処理用記憶媒体 |
JP2001224002A (ja) | 2000-02-08 | 2001-08-17 | Atr Interpreting Telecommunications Res Lab | 音声・映像同期方法および音声・映像処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6556972B1 (en) * | 2000-03-16 | 2003-04-29 | International Business Machines Corporation | Method and apparatus for time-synchronized translation and synthesis of natural-language speech |
US6859778B1 (en) * | 2000-03-16 | 2005-02-22 | International Business Machines Corporation | Method and apparatus for translating natural-language speech using multiple output phrases |
JP2002320037A (ja) | 2001-04-19 | 2002-10-31 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 翻訳電話システム |
JP2002328921A (ja) | 2001-05-01 | 2002-11-15 | N B C Kk | 通訳システムおよび通訳方法 |
US20030065503A1 (en) * | 2001-09-28 | 2003-04-03 | Philips Electronics North America Corp. | Multi-lingual transcription system |
JP2006524856A (ja) * | 2003-04-14 | 2006-11-02 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 自動ダビングをオーディオ・ビジュアル・ストリームに対して行うシステム及び方法 |
US7406414B2 (en) * | 2003-12-15 | 2008-07-29 | International Business Machines Corporation | Providing translations encoded within embedded digital information |
JP2005295015A (ja) | 2004-03-31 | 2005-10-20 | Hitachi Kokusai Electric Inc | 映像会議システム |
JP4001133B2 (ja) | 2004-07-16 | 2007-10-31 | 富士ゼロックス株式会社 | 自動翻訳装置および自動翻訳システム |
JP2008546016A (ja) * | 2005-05-31 | 2008-12-18 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マルチメディア信号で自動的なダビングを実行する方法及び装置 |
US20070133437A1 (en) * | 2005-12-13 | 2007-06-14 | Wengrovitz Michael S | System and methods for enabling applications of who-is-speaking (WIS) signals |
US7693717B2 (en) * | 2006-04-12 | 2010-04-06 | Custom Speech Usa, Inc. | Session file modification with annotation using speech recognition or text to speech |
-
2006
- 2006-09-27 JP JP2006263116A patent/JP4271224B2/ja active Active
-
2007
- 2007-03-19 US US11/723,409 patent/US8078449B2/en not_active Expired - Fee Related
- 2007-08-30 CN CNA2007101472315A patent/CN101155291A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20080077390A1 (en) | 2008-03-27 |
US8078449B2 (en) | 2011-12-13 |
JP2008083376A (ja) | 2008-04-10 |
CN101155291A (zh) | 2008-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4271224B2 (ja) | 音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよびシステム | |
US11514886B2 (en) | Emotion classification information-based text-to-speech (TTS) method and apparatus | |
US10217466B2 (en) | Voice data compensation with machine learning | |
US7490042B2 (en) | Methods and apparatus for adapting output speech in accordance with context of communication | |
US7949523B2 (en) | Apparatus, method, and computer program product for processing voice in speech | |
JP5750380B2 (ja) | 音声翻訳装置、音声翻訳方法および音声翻訳プログラム | |
JP2023022150A (ja) | 双方向音声翻訳システム、双方向音声翻訳方法及びプログラム | |
US20020111794A1 (en) | Method for processing information | |
JP4884212B2 (ja) | 音声合成装置 | |
KR20120086287A (ko) | 음성번역 시스템, 제1 단말장치, 음성인식 서버장치, 번역 서버장치, 및 음성합성 서버장치 | |
GB2291571A (en) | Text to speech system; acoustic processor requests linguistic processor output | |
JP5387416B2 (ja) | 発話分割システム、発話分割方法および発話分割プログラム | |
US20240221738A1 (en) | Systems and methods for using silent speech in a user interaction system | |
WO2018079294A1 (ja) | 情報処理装置及び情報処理方法 | |
KR101959439B1 (ko) | 통역방법 | |
JP7287006B2 (ja) | 話者決定装置、話者決定方法、および話者決定装置の制御プログラム | |
US6501751B1 (en) | Voice communication with simulated speech data | |
JP2016186646A (ja) | 音声翻訳装置、音声翻訳方法および音声翻訳プログラム | |
JPH1152987A (ja) | 話者適応機能を持つ音声合成装置 | |
KR20220007490A (ko) | 가족 관계에 기초하여 음성 데이터를 생성하는 장치, 방법 및 컴퓨터 프로그램 | |
JP2015187738A (ja) | 音声翻訳装置、音声翻訳方法および音声翻訳プログラム | |
JP3685648B2 (ja) | 音声合成方法及び音声合成装置、並びに音声合成装置を備えた電話機 | |
WO2021161841A1 (ja) | 情報処理装置及び情報処理方法 | |
JP7495220B2 (ja) | 音声認識装置、音声認識方法、および、音声認識プログラム | |
JP7344612B1 (ja) | プログラム、会話要約装置、および会話要約方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080327 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090217 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090224 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120306 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4271224 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120306 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130306 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130306 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140306 Year of fee payment: 5 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |