JP5128869B2 - 通訳支援システム、通訳支援プログラム、通訳支援方法 - Google Patents
通訳支援システム、通訳支援プログラム、通訳支援方法 Download PDFInfo
- Publication number
- JP5128869B2 JP5128869B2 JP2007204306A JP2007204306A JP5128869B2 JP 5128869 B2 JP5128869 B2 JP 5128869B2 JP 2007204306 A JP2007204306 A JP 2007204306A JP 2007204306 A JP2007204306 A JP 2007204306A JP 5128869 B2 JP5128869 B2 JP 5128869B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- unit
- original
- original utterance
- interpreter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 21
- 239000012634 fragment Substances 0.000 claims description 35
- 238000001514 detection method Methods 0.000 claims description 30
- 238000013519 translation Methods 0.000 claims description 24
- 238000004904 shortening Methods 0.000 claims description 22
- 238000000926 separation method Methods 0.000 claims description 7
- 230000000903 blocking effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 3
- 238000012986 modification Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 5
- 239000012141 concentrate Substances 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Description
そこで、本願発明者はこの特徴点、すなわち通訳者が発声している間は話者の音声が聞こえにくくなってしまうという点を解消することによって通訳者の能力を支援し、通訳の質を高めることに想到した。
話者の原発話を録音原発話として連続的に録音する録音部と、
話者の原発話又は前記録音原発話の音声を所定の区切り条件で以て発話単位に分け、前記原発話又は録音原発話に該発話単位を関連付ける単位設定部と、
前記マイクに入力される通訳者の発話を検知した時点において前記音声出力部から出力されている原発話又は録音原発話の発話単位を特定する再生位置特定部と、
前記マイクに入力される通訳者の発話を検知したことに基づき、前記音声出力部から出力される原発話又は録音原発話の音量を減少させる又は出力を遮断する音量調節部と、
前記マイクに入力される通訳者の発話の完了を検知したことに基づき、前記再生位置特定部によって特定された発話単位の先頭から録音原発話を前記音声出力部より出力させる巻戻再生部と、
話者の原発話又は前記録音原発話に含まれる所定の長さ以上の無音区間を検出し、該無音区間を所定の長さに短縮する無音区間短縮部と、
を備えることを特徴としている。
話者の原発話を録音原発話として連続的に録音する録音部と、
話者の原発話又は前記録音原発話の音声を所定の区切り条件で以て発話単位に分け、前記原発話又は録音原発話に該発話単位を関連付ける単位設定部と、
前記マイクに入力される通訳者の発話を検知した時点において前記音声出力部から出力されている原発話又は録音原発話の発話単位を特定する再生位置特定部と、
前記マイクに入力される通訳者の発話を検知したことに基づき、前記音声出力部から出力される原発話又は録音原発話の音量を減少させる又は出力を遮断する音量調節部と、
前記マイクに入力される通訳者の発話の完了を検知したことに基づき、前記再生位置特定部によって特定された発話単位の先頭から録音原発話を前記音声出力部より出力させる巻戻再生部と、
話者の原発話又は前記録音原発話に含まれる所定の長さ以上の無音区間を検出し、該無音区間を所定の長さに短縮する無音区間短縮部と、
して機能させることを特徴としている。
話者の原発話を録音原発話として連続的に録音し、
話者の原発話又は前記録音原発話の音声を所定の区切り条件で以て発話単位に分けて前記原発話又は録音原発話に該発話単位を関連付け、
前記マイクに入力される通訳者の発話を検知した時点において前記音声出力部から出力されている原発話又は録音原発話の発話単位を特定するとともに前記音声出力部から出力される原発話又は録音原発話の音量を減少させる又は出力を遮断し、
前記マイクに入力される通訳者の発話の完了を検知したことに基づき、前記特定された発話単位の先頭から録音原発話を前記音声出力部より出力させ、
話者の原発話又は前記録音原発話に含まれる所定の長さ以上の無音区間を検出し、該無音区間を所定の長さに短縮することを特徴としている。
通訳者の発話が終了すると、先ほど通訳者が発話を開始した時点において再生されていた原発話が、所定の区切り箇所まで戻って再生される。すなわち、通訳者が未だ訳出を行っていない箇所から原発話の再生が行われる。よって通訳者は途切れることなく連続的に通訳を行うことが可能となる。
本発明に係る通訳支援システムは、第一言語で行われる話者の原発話を通訳者が聴き、通訳者はその原発話を第二言語に通訳し、その通訳された第二言語を聴き手が聴くという通訳形態において用いられるものである。
なお、同時通訳を行う場合、通訳者は通訳作業に集中できるようにするために話者や聴き手がいる部屋とは異なる部屋(ブース)にいることが多い。本発明の通訳支援システムも同様の環境で使用することが好適であるものの、その使用環境は特に限定されるものではない。
なお、話者や通訳者の発話である音波はマイクによって電気信号などに変換され、また、この電気信号はヘッドホンなどの音声出力部において音波に変換される。従って、本発明に係る通訳支援システムは実際には音波に基づく電気信号を扱うが、本出願においてはこの音波に基づく電気信号のことも発話や音声として説明する。
本実施形態では、200ミリ秒以上の無音区間が区切り条件として設定されているものとする。
発話単位<1>:I just called
発話単位<2>:to say
発話単位<3>:I love you
発話単位<4>:and I mean it
発話単位<5>:from the bottom of my heart
なお、区切り条件として検出された無音区間は、どのように扱ってもよく、各発話単位の最後の単語の後に含めておくこともできるし、各発話単位の最初の単語の前に含めておいてもよい。
この短縮の方法は、例えば800ミリ秒以上の長さの無音区間であれば一律に800ミリ秒にしたり、長さが800ミリ秒を越える無音区間については1/5の長さに短縮したりという様に、任意に設定が可能である。
また、単位設定部12の場合と同様に、無音区間短縮部13は原発話保存部10に既に保存されている録音原発話を対象にして処理を行うのではなく、第一入力部17を介して入力された話者の原発話を対象にして処理を行ってもよい。
これによって、実際の話者の原発話の進行に対して通訳者の訳出が大きく遅れてしまうことが防止されるとともに、過度に原発話の無音区間が削除されてしまってそれを聴く通訳者が違和感を覚えてしまうことも防止される。
本発明に係る通訳支援システムにおいて音声出力部3から出力される話者の音声は、(後述するように)通常は原発話保存部10に保存されている録音原発話である。しかし、原発話保存部10に保存されている録音原発話が全て音声出力部3から出力されてしまった場合や話者が最初に発話する場合などには、話者マイク2より第一入力部17を介して入力された原発話を二つに分け、一方は録音部11に送り、他方はそのまま音声出力部3から出力するようにしてもよい。ただしこの場合は、単位設定部12及び無音区間短縮部13による各処理を経た後に原発話が音声出力部3より出力されることが望ましい。
本発明に係る通訳支援システム1は、
再聴指示を入力することが可能な再聴指示入力部と、
該再聴指示が入力されたことに基づき、該再聴指示が入力された時点において前記音声出力部から出力されていた原発話又は録音原発話の箇所を基点として、所定の長さだけ又は所定の箇所まで遡った箇所から録音原発話を前記音声出力部から出力させる再聴部と、
を更に備えた構成とすることもできる。
本発明に係る通訳支援システム1は、通訳者がより一層的確な通訳を行うことができるように援助するために、更に、原発話可視表示部を設けることもできる。図5は、原発話可視表示部20に示される画面表示の例である。原発話可視表示部20は、原発話保存部10に保存されている録音原発話の音声を波形として表示する。そして、通訳者に現在どの波形に対応する録音原発話が音声出力部3より出力されているのかを知らせるために、原発話可視表示部20は、波形を一方向にスクロールさせるとともに、現在音声出力部3より出力されている箇所を示すようにする。図5の例では、録音原発話の波形が左側方向にスクロールして行く。そして、「出力中」として示されているラインに対応する箇所が音声出力部3より出力されている箇所である旨が示される。
また、原発話可視表示部20は、録音原発話の音声を図5に示すような実際の波形ではなく、図6に示すような波形に対応した模式的な図形を表示するようにしても構わない。
このように原発話可視表示部20を設けることによって、通訳者は今から後に聴くことになる原発話(実際には録音原発話)がどのようなものなのか、発話単位の長さや強度、無音区間の長さなどを通訳を行いつつ容易に知ることができる。従って、訳出するタイミング等を図りやすくなると同時に、これから聴く原発話を予測し、計画的かつ直感的に訳出戦略を練ることができる。
プロの同時通訳者が日頃行う訓練における最重要ポイントはアンティシペーション(原発話の内容の予測)技術の上達だと言われている。このことより、本システムが現在プロとして活躍している同時通訳者に対する支援システムとしても有効であることが理解される。
上述した変形例2の更なる変形例して、本発明に係る通訳支援システム1は、更に、
原発話可視表示部によって表示されている音声の波形又は模式的な図形の指定位置を含む再聴箇所指示を入力することが可能な指定再聴指示入力部と、
再聴箇所指示が入力された事に基づき、その再聴箇所指示に含まれている指定位置に対応する箇所から録音原発話を音声出力部より出力させる指定再聴部と、を備えた構成とすることもできる。
通訳者は指定再聴指示入力部(図示しないが、通常はマウスやタッチパネルなどを好適に利用できる)を操作することにより、原発話可視表示部20に表示されている音声の波形又は模式的な図形を指定(この情報を「指定位置」とする)して再聴箇所指示を入力する。この再聴箇所指示は、通訳者が波形又は模式的な図形を指定しただけで入力されるようにしておくことが望ましい。
指定再聴部は、入力された再聴箇所指示に含まれる指定位置の波形又は模式的な図形に対応する箇所から、原発話保存部10に保存されている録音原発話を音声出力部3より出力させる。「入力された再聴箇所指示に含まれる指定位置の波形又は模式的な図形に対応する箇所から出力」とは、指定位置を含む発話単位の先頭からという意味であっても良いし、指定位置そのものからという意味であっても良い。
指定再聴部が上記の処理を行うことにより、音声出力部3より出力される録音原発話の箇所は遡ることになるが、通常はそのまま引き続き録音原発話を音声出力部3から出力させるとよい。
しかし、現在では音声認識技術は未だ開発途上にある技術であり、通訳支援に利用可能な程度の精度が保証されるようになるには、更なる発展を待たねばならない。しかしながら、現在の技術でも数字や固有名詞に関しては比較的高い精度で音声認識が可能である。これらの数字や固有名詞(これらをまとめて特徴語と呼ぶ)は、先に述べたように、通訳者が一般に聞き逃しやすい種類の単語であるため、これらの特徴語だけでもテキスト化することができれば、通訳者の負担が大幅に軽減される。
そこで、原発話可視表示部を備えた形態の本発明に係る通訳支援システム1は、好適には、
原発話又は録音原発話中に含まれる数字及び/又は固有名詞を検出する特徴語検出部と、
原発話可視表示部によって表示される波形又は図形において、特徴語検出部によって検出された数字又は固有名詞に対応する位置に、該数字又は固有名詞をテキスト化して表示する特徴語表示部と、を更に備えた構成とすることができる。
特徴語検出部(図示せず)は、原発話又は録音原発話中に含まれる特徴語を検出し、それをテキスト化する。図8に示す例では、録音原発話中に"2007"という特徴語(数字)が含まれることを検出したものとする。そして特徴語表示部(図示せず)は、原発話可視表示部20に表示されている波形の、この"2007"に対応する位置に「2007」というテキストを表示する。図8における波形は、録音原発話が音声出力部3より出力されることに伴って徐々にスクロールするから、特徴語表示部はテキスト「2007」もそれに合わせて移動させる。
録音原発話中に含まれる数字及び/又は固有名詞を検出する特徴語検出部と、
原発話可視表示部によって表示される波形又は模式的な図形において、該特徴語検出部によって検出された数字又は固有名詞に対応する位置に、該数字又は固有名詞の存在を示す特徴語指示子を表示し、前記入力部によって指定された特徴語指示子に対応する数字又は固有名詞を前記音声出力部から出力する特徴語再生部を設けた構成とすることもできる。
特徴語再生部が特徴語を音声出力部3から出力させる場合には、その特徴語だけを再生するのが好ましいが、その特徴語を含む発話単位全体を再生するようにしてもよい。
また、特徴語再生部が音声出力部3から特徴語を出力させる場合には、その時点で音声出力部3から出力されている録音原発話の出力を停止させ、特徴語の出力が完了すると、先程停止した時点で出力されていた録音原発話の発話単位の先頭から再生を開始するとよい。又は、特徴語を出力したあと、そのまま続けて録音原発話を再生してもよい。
また、発話においては、直接的な訳出の対象とはならないが発話における意味と関連し合う現象(音声や音声の変化)が生じることが知られており、例えば以下に挙げるものがある。
「フィラー(“えーと”等もっぱら自分自身の発話において自分自身の発話の調子を整える目的で発する言語要素)」、「相づち(“はい、はい”等もっぱら相手の発話に対応して発する対話や会話を潤滑にする言語要素)」、「口ぐせ(“ほんま、ほんま”等もっぱら自分自身の発話に対応して発し、無意味に繰り返され、かつ個人的特徴のある言語要素)」、「笑いながらの発話」、「発話後の笑い」、「相手の発話に応ずる笑い」、「ため息」、「抑揚の変化」、「対話や会話における相手の発話中に介入する発話」、「言い掛けて途中でやめた言葉の断片」、「極端に早口で喋られるある種の語句群」、「個人的な話の発声スピードやその変化」
本出願ではこういった、直接的には訳出の対象とはならないが発話内容と深い関係があるとされる音声や音声の変化を「言語断片要素」と称する。
(1)原発話可視表示部20が、断片要素検出部21によって検出された言語断片要素に対応する波形又は模式的な図形を一律に又は言語断片要素の種類に応じて識別可能表示するようにする。
なお、図10では原発話可視表示部20が通訳支援システム1の外部に設けられたモニタ(表示部)を指しているが、原発話可視表示部20は通常、通訳支援システム1内部の機能とモニタとが協働することによって実現する構成である。
この構成により、通訳者はより一層訳出を行いやすくなる。
従来の同時通訳には、第一線で活躍しているプロの同時通訳者であっても避けることができない、以下に挙げるような特徴的な欠点があることが知られている。
1)訳語を一回で完全に訳出できず、訳し直してしまう
2)原語には無いつなぎ言葉のような「…それは…つまり…」などの表現を訳出発話に入れてしまう
3)原語の語順で訳してしまうため、英語と日本語のように、語順が大きく違う言語間の同時通訳では、訳出発話が聴き手に不自然に受け取られてしまう
上記1)及び2)は同時通訳において訳出時間の遅延の原因となり、できる限り原発話と同時に訳出を終えるという目的に反するものであり、上記3)は元来同時通訳に不可避的に付随する欠点とされている。
まず、母語が英語である話者の発話音声を録音した。これを「実験音源I」とする。次に、「実験音源I」を手動で本発明に係る通訳支援システムの単位設定部が実行するような発話単位に区切った。これを「実験音源II」とする。
経験が豊かな同時通訳者を通訳者Aとし、通訳者Aと較べて経験が浅く、通訳のレベルも劣る同時通訳者を通訳者Bとしたとき、通訳者Aに実験音源Iを聴かせて、これに対する同時通訳発話音声を録音した。これを「AT」とする。通訳者Bには実験音源IIを聴かせて、これに対する同時通訳発話音声を録音した。これを「BT」とする。
さらに、上記AT及びBTを50人程度のモニターに、これらが英語の通訳音声であることを告げずに聴かせたところ、大部分のモニターが「BTの音声の方が自然な喋り方であると感じる」と回答した。
以上の結果から、本発明に係る通訳支援システムを利用することにより、上記1)〜3)の全ての問題が改善されることが確認された。
このように、本発明の通訳支援システムは種々の変形や改良が可能である。
10…原発話保存部
11…録音部
12…単位設定部
13…無音区間短縮部
14…再生位置特定部
15…音量調節部
16…巻戻再生部
17…第一入力部
18…出力部
19…第二入力部
20…原発話可視表示部
21…断片要素検出部
22…不要箇所削除部
2…話者マイク
3…音声出力部
4…通訳者マイク
Claims (16)
- 話者の第一言語による原発話を音声出力部を通して聴き、それを第二言語にてマイクに対して発話する通訳者を支援するための通訳支援システムであって、
話者の原発話を録音原発話として連続的に録音する録音部と、
話者の原発話又は前記録音原発話の音声を所定の区切り条件で以て発話単位に分け、前記原発話又は録音原発話に該発話単位を関連付ける単位設定部と、
前記マイクに入力される通訳者の発話を検知した時点において前記音声出力部から出力されている原発話又は録音原発話の発話単位を特定する再生位置特定部と、
前記マイクに入力される通訳者の発話を検知したことに基づき、前記音声出力部から出力される原発話又は録音原発話の音量を減少させる又は出力を遮断する音量調節部と、
前記マイクに入力される通訳者の発話の完了を検知したことに基づき、前記再生位置特定部によって特定された発話単位の先頭から録音原発話を前記音声出力部より出力させる巻戻再生部と、
話者の原発話又は前記録音原発話に含まれる所定の長さ以上の無音区間を検出し、該無音区間を所定の長さに短縮する無音区間短縮部と、
を備えることを特徴とする通訳支援システム。 - 前記単位設定部が録音原発話の音声を発話単位に分ける所定の区切り条件が、200ミリ秒以上の無音区間である
ことを特徴とする請求項1に記載の通訳支援システム。 - 前記音量調節部が、前記マイクに入力される通訳者自身の音声を前記音声出力部から出力させる
ことを特徴とする請求項1又は2に記載の通訳支援システム。 - 再聴指示を入力することが可能な再聴指示入力部と、
該再聴指示が入力されたことに基づき、該再聴指示が入力された時点において前記音声出力部から出力されていた原発話又は録音原発話の箇所を基点として、所定の長さだけ又は所定の箇所まで遡った箇所から録音原発話を前記音声出力部から出力させる再聴部と、
を更に備えることを特徴とする請求項1〜3のいずれかに記載の通訳支援システム。 - 前記録音原発話の音声の波形を、又は前記録音原発話の音声に対応した模式的な図形を、音声出力部から現在出力されている音声の位置を示しつつ表示する原発話可視表示部
を更に備えることを特徴とする請求項1〜4のいずれかに記載の通訳支援システム。 - 前記原発話可視表示部によって表示されている音声の波形又は模式的な図形の指定位置を含む再聴箇所指示を入力することが可能な指定再聴指示入力部と、
該再聴箇所指示が入力された事に基づき、該再聴箇所指示に含まれる該指定位置に対応する箇所から録音原発話を前記音声出力部より出力させる指定再聴部と、
を更に備えることを特徴とする請求項5に記載の通訳支援システム。 - 原発話又は録音原発話中に含まれる数字及び/又は固有名詞を検出する特徴語検出部と、
前記原発話可視表示部によって表示される波形又は模式的な図形において、該特徴語検出部によって検出された数字又は固有名詞に対応する位置に、該数字又は固有名詞をテキスト化して表示する特徴語表示部と、
を更に含むことを特徴とする請求項5又は6に記載の通訳支援システム。 - 通訳者からの指示が入力される入力部と、
前記録音原発話中に含まれる数字及び/又は固有名詞を検出する特徴語検出部と、
前記原発話可視表示部によって表示される波形又は模式的な図形において、該特徴語検出部によって検出された数字又は固有名詞に対応する位置に、該数字又は固有名詞の存在を示す特徴語指示子を表示し、前記入力部によって指定された特徴語指示子に対応する数字又は固有名詞を前記音声出力部から出力する特徴語再生部と、
を更に含むことを特徴とする請求項5又は6に記載の通訳支援システム。 - 原発話又は録音原発話中に含まれる、直接的には訳出の対象とならない言語断片要素を検出する断片要素検出部を更に備え、
前記原発話可視表示部が、該断片要素検出部によって検出された該言語断片要素に対応する波形又は模式的な図形を一律に又は言語断片要素の種類に応じて識別可能表示する
ことを特徴とする請求項5〜8のいずれかに記載の通訳支援システム。 - 原発話又は録音原発話中に含まれる、直接的には訳出の対象とならない言語断片要素を検出する断片要素検出部と、
原発話又は前記録音原発話において、前記断片要素検出部によって検出された言語断片要素のうち、予め定められた種類の言語断片要素に対応する箇所を削除する不要箇所削除部と、
を更に備えることを特徴とする請求項1〜3のいずれかに記載の通訳支援システム。 - 原発話又は録音原発話中に含まれる、直接的には訳出の対象とならない言語断片要素を検出する断片要素検出部を更に備え、
前記単位設定部が、予め定められた種類の言語断片要素を録音原発話の音声を発話単位に分ける所定の区切り条件とする
ことを特徴とする請求項1〜3のいずれかに記載の通訳支援システム。 - 話者の第一言語による原発話を音声出力部を通して聴き、それを第二言語にてマイクに対して発話する通訳者を支援するための通訳支援システムに用いられる通訳支援プログラムであって、コンピュータを、
話者の原発話を録音原発話として連続的に録音する録音部と、
話者の原発話又は前記録音原発話の音声を所定の区切り条件で以て発話単位に分け、前記原発話又は録音原発話に該発話単位を関連付ける単位設定部と、
前記マイクに入力される通訳者の発話を検知した時点において前記音声出力部から出力されている原発話又は録音原発話の発話単位を特定する再生位置特定部と、
前記マイクに入力される通訳者の発話を検知したことに基づき、前記音声出力部から出力される原発話又は録音原発話の音量を減少させる又は出力を遮断する音量調節部と、
前記マイクに入力される通訳者の発話の完了を検知したことに基づき、前記再生位置特定部によって特定された発話単位の先頭から録音原発話を前記音声出力部より出力させる巻戻再生部と、
話者の原発話又は前記録音原発話に含まれる所定の長さ以上の無音区間を検出し、該無音区間を所定の長さに短縮する無音区間短縮部と、
して機能させることを特徴とする通訳支援プログラム。 - 前記単位設定部が録音原発話の音声を発話単位に分ける所定の区切り条件が、200ミリ秒以上の無音区間である
ことを特徴とする請求項12に記載の通訳支援プログラム。 - 前記音量調節部が、前記マイクに入力される通訳者自身の音声を前記音声出力部から出力させる
ことを特徴とする請求項12又は13に記載の通訳支援プログラム。 - 話者の第一言語による原発話を音声出力部を通して聴き、それを第二言語にてマイクに対して発話する通訳者を支援するための通訳支援方法であって、
話者の原発話を録音原発話として連続的に録音し、
話者の原発話又は前記録音原発話の音声を所定の区切り条件で以て発話単位に分けて前記原発話又は録音原発話に該発話単位を関連付け、
前記マイクに入力される通訳者の発話を検知した時点において前記音声出力部から出力されている原発話又は録音原発話の発話単位を特定するとともに前記音声出力部から出力される原発話又は録音原発話の音量を減少させる又は出力を遮断し、
前記マイクに入力される通訳者の発話の完了を検知したことに基づき、前記特定された発話単位の先頭から録音原発話を前記音声出力部より出力させ、
話者の原発話又は前記録音原発話に含まれる所定の長さ以上の無音区間を検出し、該無音区間を所定の長さに短縮する
ことを特徴とする通訳支援方法。 - 録音原発話の音声を発話単位に分ける所定の区切り条件が、200ミリ秒以上の無音区間である
ことを特徴とする請求項15に記載の通訳支援方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007204306A JP5128869B2 (ja) | 2007-08-06 | 2007-08-06 | 通訳支援システム、通訳支援プログラム、通訳支援方法 |
PCT/JP2008/002134 WO2009019872A1 (ja) | 2007-08-06 | 2008-08-06 | 通訳支援システム、通訳支援プログラム、通訳支援方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007204306A JP5128869B2 (ja) | 2007-08-06 | 2007-08-06 | 通訳支援システム、通訳支援プログラム、通訳支援方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2009042291A JP2009042291A (ja) | 2009-02-26 |
JP2009042291A5 JP2009042291A5 (ja) | 2010-12-16 |
JP5128869B2 true JP5128869B2 (ja) | 2013-01-23 |
Family
ID=40341113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007204306A Expired - Fee Related JP5128869B2 (ja) | 2007-08-06 | 2007-08-06 | 通訳支援システム、通訳支援プログラム、通訳支援方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5128869B2 (ja) |
WO (1) | WO2009019872A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5750380B2 (ja) | 2012-02-10 | 2015-07-22 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法および音声翻訳プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3432443B2 (ja) * | 1999-02-22 | 2003-08-04 | 日本電信電話株式会社 | 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体 |
JP2003307997A (ja) * | 2002-04-15 | 2003-10-31 | Sony Corp | 語学教育システム、音声データ処理装置、音声データ処理方法、音声データ処理プログラム、及び記憶媒体 |
EP1588344A2 (en) * | 2003-01-30 | 2005-10-26 | Bigfoot Productions, Inc. | System for learning language through embedded content on a single medium |
JP3920803B2 (ja) * | 2003-03-31 | 2007-05-30 | 株式会社エフ・エフ・シー | 語学学習装置および語学学習用プログラム |
-
2007
- 2007-08-06 JP JP2007204306A patent/JP5128869B2/ja not_active Expired - Fee Related
-
2008
- 2008-08-06 WO PCT/JP2008/002134 patent/WO2009019872A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2009019872A1 (ja) | 2009-02-12 |
JP2009042291A (ja) | 2009-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gravano et al. | Turn-taking cues in task-oriented dialogue | |
KR101818980B1 (ko) | 다중 화자 음성 인식 수정 시스템 | |
JP4481972B2 (ja) | 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム | |
US6560574B2 (en) | Speech recognition enrollment for non-readers and displayless devices | |
US6535848B1 (en) | Method and apparatus for transcribing multiple files into a single document | |
Hjalmarsson | The additive effect of turn-taking cues in human and synthetic voice | |
JPWO2009025155A1 (ja) | 音声再生方法、音声再生装置およびコンピュータ・プログラム | |
Wald | Crowdsourcing correction of speech recognition captioning errors | |
de Boer et al. | Cross-linguistic filled pause realization: The acoustics of uh and um in native Dutch and non-native English | |
Ernestus et al. | Qualitative and quantitative aspects of phonetic variation in Dutch eigenlijk | |
Bicevskis et al. | Visual-tactile integration in speech perception: Evidence for modality neutral speech primitives | |
Zhang et al. | Normalization of lexical tones and nonlinguistic pitch contours: Implications for speech-specific processing mechanism | |
JP2020113150A (ja) | 音声翻訳対話システム | |
Swerts et al. | Prosodic predictors of upcoming positive or negative content in spoken messages | |
US9881611B2 (en) | System and method for providing voice communication from textual and pre-recorded responses | |
JP5128869B2 (ja) | 通訳支援システム、通訳支援プログラム、通訳支援方法 | |
JPH10326176A (ja) | 音声対話制御方法 | |
Berger et al. | Multimodal prominence marking in semi-spontaneous YouTube monologs: The interaction of intonation and eyebrow movements | |
KR20080097619A (ko) | 상호 대화식 학습 시스템 및 방법 | |
JP2001022265A (ja) | ディジタルムービーソフト利用語学学習システム | |
JP5248365B2 (ja) | 記憶支援システム、記憶支援プログラム、及び記憶支援方法 | |
JP2018165805A (ja) | 対話装置、対話装置の制御方法およびプログラム | |
JP7288530B1 (ja) | システムおよびプログラム | |
Senior et al. | The role of unfamiliar accents in competing speech | |
Arai et al. | Seeing closing gesture of articulators affects speech perception of geminate consonants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100806 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100927 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121002 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121101 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151109 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |