JP2010079647A - 音声翻訳装置、方法、およびプログラム - Google Patents

音声翻訳装置、方法、およびプログラム Download PDF

Info

Publication number
JP2010079647A
JP2010079647A JP2008247999A JP2008247999A JP2010079647A JP 2010079647 A JP2010079647 A JP 2010079647A JP 2008247999 A JP2008247999 A JP 2008247999A JP 2008247999 A JP2008247999 A JP 2008247999A JP 2010079647 A JP2010079647 A JP 2010079647A
Authority
JP
Japan
Prior art keywords
character string
unit
translation
speech
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008247999A
Other languages
English (en)
Other versions
JP5336805B2 (ja
Inventor
Akira Kumano
明 熊野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008247999A priority Critical patent/JP5336805B2/ja
Publication of JP2010079647A publication Critical patent/JP2010079647A/ja
Application granted granted Critical
Publication of JP5336805B2 publication Critical patent/JP5336805B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】発話内容の修正にかかる利用者の負担を軽減させることができる音声翻訳装置、方法、およびプログラムを提供する。
【解決手段】音声入力受付部100は、日本語の発話音声の入力を受け付け、音声認識部120は、発話音声の入力が受け付けられる毎に、当該発話音声を認識して文字列を生成し、蓄積部42は文字列を順次蓄積し、判定部130は、新たに蓄積する候補である第2文字列が先に蓄積された第1文字列の言い直しであるか否かを判定し、修正部140は、言い直しでない場合には、第2文字列を蓄積部42に蓄積させ、言い直しである場合には、第1文字列を第2文字列に修正して蓄積部42に蓄積させ、翻訳部150は、蓄積部42に蓄積される毎に、蓄積されている文字列を英語に翻訳し、出力部30は、翻訳結果を出力する。
【選択図】 図1

Description

本発明は、音声翻訳装置、方法、およびプログラムに関する。
近年、文化や経済のグローバル化に伴い、異なる言語を母語とする人同士のコミュニケーションの機会が増加している。このため、自然言語処理技術、音声認識処理技術、機械翻訳技術などを採用し、異なる言語を母語とする人同士のコミュニケーションを支援する音声翻訳装置への期待が高まっている。
一般的に音声翻訳装置は、利用者により入力された第1言語の発話音声を認識して第2言語への機械翻訳を行うため、利用者は発話内容を正確に入力する必要がある。しかしながら、利用者は人間であり、機械翻訳の性能も完全ではないことから、利用者の言い誤りや、目的の翻訳結果が得られなかったことに伴う利用者の言い直しが起きることは避けられない。このため、利用者の発話内容を自動的に修正する技術の開発が進められている。
例えば特許文献1には、言い直し特有の言い回し(例えば、「言い直し」、「間違えた」、「じゃなくて」など)を検出した場合に、利用者の発話内容を修正する技術が開示されている。
特開2007−57844号公報
しかしながら、従来の技術では、利用者の発話内容を修正するためには言い直し特有の言い回しを検出しなければならない。従って、発話内容の修正を望む場合には、このような言い回しとともに修正内容を発話しなければならず、利用者に余計な負担がかかってしまうことになる。
本発明は、上記事情に鑑みてなされたものであり、発話内容の修正にかかる利用者の負担を軽減させることができる音声翻訳装置、方法、およびプログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明の一態様にかかる音声翻訳装置は、第1言語の発話音声の入力を受け付ける音声入力受付部と、前記発話音声の入力が受け付けられる毎に、当該発話音声を認識して文字列を生成する音声認識部と、前記文字列を順次蓄積する蓄積部と、先に蓄積された第1文字列と、新たに蓄積する候補である第2文字列とを比較し、前記第2文字列が前記第1文字列の言い直しであるか否かを判定する判定部と、言い直しでない場合には、前記第2文字列を前記蓄積部に蓄積させ、言い直しである場合には、前記第1文字列を前記第2文字列に修正して前記蓄積部に蓄積させる修正部と、前記蓄積部に蓄積される毎に、蓄積されている文字列を第2言語に翻訳する翻訳部と、翻訳結果を出力する出力部と、を備えることを特徴とする。
また、本発明の別の態様にかかる音声翻訳方法は、音声入力受付部が、第1言語の発話音声の入力を受け付ける音声入力受付ステップと、音声認識部が、前記発話音声の入力が受け付けられる毎に、当該発話音声を認識して文字列を生成する認識ステップと、判定部が、前記文字列を順次蓄積する蓄積部に先に蓄積された第1文字列と、新たに蓄積する候補である第2文字列とを比較し、前記第2文字列が前記第1文字列の言い直しであるか否かを判定する判定ステップと、修正部が、言い直しでない場合には、前記第2文字列を前記蓄積部に蓄積させ、言い直しである場合には、前記第1文字列を前記第2文字列に修正して前記蓄積部に蓄積させる修正ステップと、翻訳部が、前記蓄積部に蓄積される毎に、蓄積されている文字列を第2言語に翻訳する翻訳ステップと、出力部が、翻訳結果を出力する出力ステップと、を含むことを特徴とする。
また、本発明の別の態様にかかる音声翻訳プログラムは、音声入力受付部が、第1言語の発話音声の入力を受け付ける音声入力受付ステップと、音声認識部が、前記発話音声の入力が受け付けられる毎に、当該発話音声を認識して文字列を生成する認識ステップと、判定部が、前記文字列を順次蓄積する蓄積部に先に蓄積された第1文字列と、新たに蓄積する候補である第2文字列とを比較し、前記第2文字列が前記第1文字列の言い直しであるか否かを判定する判定ステップと、修正部が、言い直しでない場合には、前記第2文字列を前記蓄積部に蓄積させ、言い直しである場合には、前記第1文字列を前記第2文字列に修正して前記蓄積部に蓄積させる修正ステップと、翻訳部が、前記蓄積部に蓄積される毎に、蓄積されている文字列を第2言語に翻訳する翻訳ステップと、出力部が、翻訳結果を出力する出力ステップと、をコンピュータに実行させるためのものである。
本発明によれば、蓄積候補の文字列が先に蓄積された文字列の言い直しであるか否かを判定して発話内容の修正を行うため、利用者は修正内容のみを発話すればよく、発話内容の修正にかかる利用者の負担を軽減させることができる。
以下、添付図面を参照しながら、本発明にかかる音声翻訳装置、方法、およびプログラムの最良な実施の形態を詳細に説明する。なお、以下の実施の形態では、翻訳の元となる第1言語に日本語、翻訳後の言語となる第2言語に英語を用いた例、即ち、日本語から英語への音声翻訳を例にとり説明する。但し、翻訳形態はこれに限定されるものではなく、あらゆる言語間での音声翻訳に適用することができる。
図1は、本実施の形態の音声翻訳装置1の構成の一例を示すブロック図である。音声翻訳装置1は、利用者の発話内容を逐次翻訳するとともに、言い直しを検出した場合には、発話内容を言い直した内容に修正して翻訳するものである。そして音声翻訳装置1は、音声入力部10と、操作部20と、出力部30と、記憶部40と、音声入力受付部100と、操作入力受付部110と、音声認識部120と、判定部130と、修正部140と、翻訳部150と、出力制御部160と、を備える。
音声入力部10は、音声翻訳装置1の利用者が発話する第1言語の音声などを入力するものであり、例えば、マイクなどの既存の音声入力装置により実現できる。
操作部20は、音声翻訳装置1に対する各種操作を行うものであり、例えば、キーボード、キースイッチやタッチパネルなどの既存の入力装置により実現できる。
出力部30は、翻訳結果を出力するものであり、例えば、液晶ディスプレイなどの既存の表示装置により実現できる。なお、これに加え、スピーカなどの既存の音声出力装置により実現してもよい。
記憶部40は、音声翻訳装置1で行われる各種処理に使用される情報を記憶するものであり、例えば、HDD(Hard Disk Drive)、光ディスク、メモリカード、RAM(Random Access Memory)などの既存の記憶媒体により実現できる。そして記憶部40は、蓄積部42と、意味用法辞書記憶部44とを含んで構成される。なお、蓄積部42および意味用法辞書記憶部44の詳細については後述する。
音声入力受付部100は、音声入力部10から第1言語の発話音声の入力を受け付ける。具体的には、音声入力受付部100は、音声入力部10から入力された音声のアナログ信号に対してサンプリングを行い、ステレオのデジタル信号に変換する。なお、デジタル信号への変換には、例えば、A/D変換など既存の技術を用いることができる。
操作入力受付部110は、操作部20からの操作入力を受け付けるものであり、第1操作入力受付部112と、第2操作入力受付部114とを含んで構成される。第1操作入力受付部112は、翻訳結果を確定する確定操作の入力を受け付け、第2操作入力受付部114は、修正を取り消す取消操作の入力を受け付ける。
音声認識部120は、音声入力受付部100に発話音声(デジタル音声信号)が受け付けられる毎に、当該発話音声を認識し、認識した発話音声の第1言語の文字列を生成する音声認識処理を行う。なお、音声認識処理には、例えば、LPC分析、隠れマルコフモデル(HMM:Hidden Markov Model)、ダイナミックプログラミング、ニューラルネットワーク、Nグラム言語モデルなど既存の音声認識方法を用いることができる。
蓄積部42は、音声認識部120により生成された文字列を順次蓄積する。
判定部130は、蓄積部42に先に蓄積された第1文字列と、蓄積部42に新たに蓄積する候補である第2文字列とを比較し、第2文字列が第1文字列の言い直しであるか否かを判定する。
具体的には、判定部130は、蓄積部42に蓄積されている文字列に第2文字列を追加した文字列が文法的に正しくなく、第1文字列と第2文字列の用法が同一である場合に、言い直しであると判定する。
ここで、文法的な正しさの判定手法について説明する。判定部130は、辞書データや文法データを用いて、蓄積部42に蓄積されている文字列に第2文字列を追加した文字列が文法的に正しいか否かを判定する。なお、辞書データや文法データは、記憶部40に格納されている。
例えば判定部130は、図2−1に示すように、文字列201〜203が蓄積部42に蓄積され、文字列204が新たに蓄積部42に蓄積される候補である場合、辞書データや文法データを参照して、文字列201〜204から構成される文字列205は文法的に正しいと判定する。
この結果、判定部130は、第2文字列である文字列204は、第1文字列である文字列203の言い直しでないと判定する。なおここでは、文字列201、202、203の順序で蓄積部42に蓄積されているため、文字列203が第1文字列である。
一方判定部130は、図2−2に示すように、文字列201〜203が蓄積部42に蓄積され、文字列206が新たに蓄積部42に蓄積される候補である場合、辞書データや文法データを参照して、文字列201〜203および206から構成される文字列207は文法的に正しくないと判定する。この結果、第2文字列である文字列206が、第1文字列である文字列203の言い直しであるか否かは、用法次第となる。
続いて、用法の判定手法について説明する。判定部130は、意味用法辞書記憶部44に格納されている意味用法辞書データを用いて、第1文字列と第2文字列の用法が同一であるか否かを判定する。
図3は、意味用法辞書記憶部44に格納されている意味用法辞書データの一例を示す図である。図3に示すように、意味用法辞書データでは、見出し語を示す見出し語情報と、見出し語の品詞を示す品詞情報と、見出し語の用法を示す用法情報とがそれぞれ対応付けられている。そして用法情報には、格助詞(例えば、「が」「を」など)および、意味属性(例えば、「人」、「具体物」、「抽象物」など)を用いた用法が記されている。
例えば見出し語208の場合、用法情報には、「が」格に「動物・人」という意味属性を取り、「を」格に「具体物」という意味属性を取る用法209と、「が」格に「人」という意味属性を取り、「を」格に「抽象物」という意味属性を取る用法210とが記されている。なお、図4に示すように、用法209の該当例としては、用法211、212などがあり、用法210の該当例としては、用法213などがある。
図1に戻り、判定部130は、例えば図5に示すように、文字列201〜203が蓄積部42に蓄積され、文字列214が新たに蓄積部42に蓄積される候補である場合、文字列203と214の用法は互いに異なるため(図3参照)、用法は同一でないと判定する。この結果、判定部130は、第2文字列である文字列214は、第1文字列である文字列203の言い直しでないと判定する。
一方判定部130は、図2−2に示すように、文字列201〜203が蓄積部42に蓄積され、文字列206が新たに蓄積部42に蓄積される候補である場合、文字列203、206のいずれも「が」格に「人」という意味属性を取り、「を」格に「抽象物」という意味属性を取る用法を有しているため(図3参照)、用法は同一であると判定する。この結果、判定部130は、第2文字列である文字列206は、第1文字列である文字列203の言い直しであると判定する。
また判定部130は、第1操作入力受付部112により確定操作の入力が受け付けられた場合には、確定操作の入力以降に生成された第1文字列および第2文字列を用いて、言い直しであるか否かを判定する。これにより、確定操作が行われる以前に蓄積部42に蓄積された文字列を確定することができる。
なお、この場合には、確定操作の入力以前に生成された文字列が蓄積される蓄積部42の領域と、確定操作の入力以降に生成された文字列が蓄積される蓄積部42の領域とを異ならせる。これにより、蓄積部42に蓄積されている文字列が確定操作の入力以前に取得したか入力以降に取得したかを判別することができる。
修正部140は、判定部130により言い直しでないと判定された場合には、第2文字列を蓄積部42に蓄積させ、言い直しと判定された場合には、第1文字列を第2文字列に修正して蓄積部42に蓄積させる。
例えば図6−1の場合、判定部130により言い直しでないと判定されるため、修正部140は、文字列204を蓄積部42に蓄積させ、蓄積部42には文字列201〜204が蓄積されることになる。
一方図6−2の場合、判定部130により言い直しであると判定されるため、修正部140は、文字列203を206に修正して蓄積部42に蓄積させ、蓄積部42には文字列201、202、および206が蓄積されることになる。
また修正部140は、第2操作入力受付部114により取消操作の入力が受け付けられた場合には、第2文字列による修正を取り消して、修正された第1文字列とともに第2文字列を蓄積部42に蓄積させる。
例えば、図6−2で説明した修正に対する取消操作の入力が受け付けられた場合には、修正部140は、文字列206による修正を取り消して、修正された文字列203とともに文字列206を蓄積部42に蓄積させる。この結果、蓄積部42には文字列201、202、203、および206が蓄積されることになる。
なお、修正部140は、第1文字列を第2文字列に修正する場合には、取消操作に対処するため、修正される第1文字列を一時的に記憶部40などに避難(記憶)させている。
翻訳部150は、蓄積部42に文字列が蓄積される毎に、蓄積されている文字列を第2言語に翻訳する。なお、翻訳処理には、例えば、用例ベース方式、トランスファ方式、統計ベース方式などの既存の翻訳方法を用いることができ、翻訳に用いる辞書データや文法データなどは、記憶部40に格納されている。
このように翻訳部150は、蓄積部42に蓄積される毎に翻訳を行うため、蓄積部42に蓄積された文字列が文として成立していない場合であっても、当該文字列を第2言語に翻訳する。
また翻訳部150は、第1操作入力受付部112により確定操作の入力が受け付けられた場合には、確定操作の入力以前の文字列の翻訳結果を確定して、蓄積部42に蓄積されている文字列を第2言語に翻訳する。
この場合には、確定操作が行われる以前に蓄積部42に蓄積された文字列が判定部130により確定されるため、翻訳部150は、当該文字列の翻訳結果を確定する。そして、蓄積部42に蓄積されている残りの文字列とともに第2言語に翻訳する。
なお翻訳部150は、第2言語に翻訳した文字列を第1言語に再翻訳するようにしてもよい。
出力制御部160は、出力部30に翻訳結果を出力させる。例えば、出力部30を液晶ディスプレイなどの既存の表示装置により実現する場合には、出力制御部160は、翻訳結果を表示装置に表示させる。
また出力制御部160は、翻訳結果が文として成立しているか否かに応じて、翻訳結果の出力態様を異ならせて出力部30に出力させる。例えば、出力部30を液晶ディスプレイなどの表示装置により実現する場合には、翻訳結果が文として成立しているか否かに応じて、例えば色などの表示態様を異ならせて表示装置に表示させる。翻訳結果が文として成立しているか否かは、記憶部40に記憶されている辞書データや文法データなどから判別できる。
なお出力制御部160は、翻訳部150により第1言語への再翻訳が行われた場合には、第2言語への翻訳結果とともに第1言語への翻訳結果を前記出力部30に出力させる。
また出力部30をスピーカなどの既存の音声出力装置により実現する場合には、出力制御部160は、翻訳結果を音声信号に変換する音声合成処理を行い、音声合成処理により生成した音声信号をDA変換して音声出力装置に音声出力させる。なお、音声合成処理には、例えば、音声素片編集音声合成、フォルマント音声合成、音声コーパスベースの音声合成などの既存の方法を用いることができる。
次に、図7を参照しながら、本実施の形態の音声翻訳装置の動作について説明する。図7は、音声翻訳装置1で行われる処理手順の一例を示すフローチャートである。なお本フローチャートは、音声入力受付部100による発話音声の入力の受け付け、および音声認識部120による音声認識処理以降の処理手順を示している。
まず、判定部130は、音声認識部120により第1言語の文字列が生成された場合には(ステップS10でYes)、辞書データや文法データを用いて、蓄積部42に蓄積されている文字列に、第2文字列を追加した文字列が文法的に正しいか否かを判定する(ステップS12)。
判定部130は、文法的に正しくないと判定した場合には(ステップS12でNo)、続いて、意味用法辞書記憶部44に格納されている意味用法辞書データを用いて、第1文字列と第2文字列の用法が同一であるか否かを判定する(ステップS14)。
そして、判定部130により用法が同一であると判定された場合には(ステップS14でYes)、修正部140は、第1文字列を第2文字列に修正して蓄積部42に蓄積させる(ステップS16)。
一方、ステップS12において判定部130により文法的に正しいと判定された場合(ステップS12でYes)、あるいはステップS14において用法が同一でないと判定された場合(ステップS14でNo)には、修正部140は、第2文字列を蓄積部42に蓄積させる(ステップS18)。
次に、翻訳部150は、蓄積部42に蓄積されている文字列を第2言語に翻訳する(ステップS20)。なお翻訳部150は、第2言語に翻訳した文字列を第1言語に再翻訳するようにしてもよい。
次に、出力制御部160は、翻訳結果が文として成立しているか否かを判定する(ステップS22)。そして出力制御部160は、成立すると判定した場合には、その旨を示す表示態様で翻訳結果を出力部30に出力させる(ステップS22でYes、ステップS24)。一方出力制御部160は、成立しないと判定した場合には、その旨を示す表示態様で翻訳結果を出力部30に出力させる(ステップS22でNo、ステップS26)。
次に、第2操作入力受付部114は、取消操作の入力が受け付けられたか否かを判定する(ステップS28)。そして取消操作の入力が受け付けられた場合には(ステップS28でYes)、修正部140は、第2文字列による修正を取り消して、第1文字列を蓄積部42に再度蓄積させ(ステップS30)、その後に第2文字列を蓄積部42に蓄積させる(ステップS18へ)。
一方、取消操作の入力が受け付けられなかった場合には(ステップS28でNo)、第1操作入力受付部112は、確定操作の入力が受け付けられたか否かを判定する(ステップS32)。そして確定操作の入力が受け付けられなかった場合には(ステップS32でNo)、判定部130は、新たな第1言語の文字列の生成を確認する(ステップS10へ)。
なお、新たな第1言語の文字列が生成されなかった場合(ステップS10でNo)、あるいは確定操作の入力が受け付けられた場合には(ステップS32でYes)、処理を終了する。但し、確定操作の入力が受け付けられた場合には(ステップS32でYes)、今までの翻訳結果を確定し、新たな発話内容の修正処理を開始する。
次に、図8−1〜図8−2を参照しながら、本実施の形態の音声翻訳装置の翻訳結果の出力手法について説明する。図8−1は、発話内容の修正および確定操作が行われた場合の翻訳結果の出力例を説明するための図であり、図8−2は、発話内容の修正および取消操作が行われた場合の翻訳結果の出力例を説明するための図である。
なお、図8−1および図8−2の例では、翻訳結果が文として成立している場合には、第2言語の訳文を青色で表示し、翻訳結果が文として成立していない場合には、第2言語の訳文を赤色で表示するものとする。さらに図8−1の例では、確定操作により翻訳結果が確定している場合には、第2言語の訳文のうち確定箇所を黒色で表示するものとする。
まず、図8−1に示す例について説明する。図8−1に示す例において、文字列201、202が蓄積部42に蓄積されている場合、これらの文字列の翻訳結果は文として成立しないため、第2言語の訳文215は出力制御部160により赤色で表示される。なお、第2言語の訳文215を再翻訳する場合には、第1言語の訳文216も表示される。
この後、利用者により文字列203が発話された場合、判定部130により文字列203は文字列202の言い直しではないと判定されるため、蓄積部42に蓄積される。そして、文字列201〜203から構成される文字列の翻訳結果は文として成立するため、第2言語の訳文217は出力制御部160により青色で表示される。
ここで利用者が、訳文217を不適切と判断し、文字列203を言い直すため文字列206を発話した場合、判定部130により文字列206は文字列203の言い直しであると判定されるため、文字列203に換えて文字列206が蓄積部42に蓄積される。
そして、蓄積されている文字列の翻訳結果は文として成立するため、第2言語の訳文は出力制御部160により青色で表示される。なお、修正内容を利用者に提示するため、出力制御部160は補助表示218を出力部30に表示させるようにしてもよい。
続いて、利用者により文字列219が発話された場合、判定部130により文字列219は文字列206の言い直しではないと判定されるため、蓄積部42に蓄積される。そして、蓄積されている文字列の翻訳結果は文として成立するため、第2言語の訳文220は出力制御部160により青色で表示される。
続いて、利用者により確定操作が行われた場合、翻訳部150により訳文220が確定され、出力制御部160により黒色で表示される。
続いて、利用者により文字列221が発話された場合、判定部130により文字列221は言い直しではないと判定されるため、蓄積部42に蓄積される。そして、蓄積されている文字列の翻訳結果のうち、確定箇所は出力制御部160により黒色で表示され、それ以外の箇所は文として成立しないため、出力制御部160により赤色で表示される。
次に、図8−2に示す例について説明する。図8−2に示す例において、文字列222、223が蓄積部42に蓄積されている場合、これらの文字列の翻訳結果は文として成立するため、第2言語の訳文は出力制御部160により青色で表示される。
この後、利用者により文字列224が発話された場合、判定部130により文字列224は文字列223の言い直しであると判定されるため、文字列223に換えて文字列224が蓄積部42に蓄積される。そして、蓄積されている文字列の翻訳結果は文として成立するため、第2言語の訳文は出力制御部160により青色で表示される。なお、修正内容を利用者に提示するため、出力制御部160は補助表示225を出力部30に表示させるようにしてもよい。
ここで利用者が、修正を不適切と判断し、取消操作を行った場合、修正部140により文字列224による修正が取り消され、文字列223および224が蓄積部42に蓄積される。そして、蓄積されている文字列の翻訳結果は文として成立しないため、第2言語の訳文は出力制御部160により赤色で表示される。
続いて、利用者により文字列226が発話された場合、判定部130により文字列226は文字列224の言い直しではないと判定されるため、蓄積部42に蓄積される。そして、蓄積されている文字列の翻訳結果は文として成立しないため、第2言語の訳文は出力制御部160により赤色で表示される。
続いて、利用者により文字列227が発話された場合、判定部130により文字列227は文字列226の言い直しではないと判定されるため、蓄積部42に蓄積される。そして、蓄積されている文字列の翻訳結果は文として成立するため、第2言語の訳文は出力制御部160により青色で表示される。
このように本実施の形態によれば、蓄積候補の文字列が先に蓄積された文字列の言い直しであるか否かを判定して発話内容の修正を行うため、利用者は修正内容のみを発話すればよく、発話内容の修正にかかる利用者の負担を軽減させることができる。
また本実施の形態によれば、新たな文字列が蓄積される毎に翻訳が行われ、翻訳結果が出力されるため、利用者に発話内容の誤りを直ぐに気づかせることができる。なお、第2言語の翻訳結果だけでなく、第2言語を再翻訳した第1言語の翻訳結果も出力するようにすれば、利用者に発話内容の誤りをより気づかせ易くすることができる。
また本実施の形態によれば、確定操作により翻訳結果を確定させることができるので、発話内容の余計な修正が行われてしまうことを事前に防止することができる。また本実施の形態によれば、取消操作により発話内容の修正を取り消すことができるので、誤った修正が行われた場合であっても対処することができる。
また本実施の形態によれば、翻訳結果が文として成立しているか否かに応じて、翻訳結果の出力態様を異ならせているため、利用者は翻訳結果が文として成立しているか否か直ぐに理解することができる。
また本実施の形態では、判定部130が文節単位で言い直しであるか否かを判定する場合を例に取り説明したが、これに限定されるものではない。判定部130は、例えば、単語単位、句単位で言い直しであるか否かを判定するようにしてもよい。
なお本実施の形態の音声翻訳装置1は、CPU(Central Processing Unit)などの制御装置、ROM(Read Only Memory)やRAM(Random Access Memory)などの記憶装置、マイクなどの音声入力装置、液晶ディスプレイなどの表示装置、キースイッチなどの入力装置、スピーカなどの音声出力装置、ネットワークに接続して通信を行う通信I/F等を備えたハードウェア構成となっている。
また、本実施の形態の音声翻訳装置1で実行される音声翻訳プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
また、本実施の形態の音声翻訳装置1で実行される音声翻訳プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、音声翻訳装置1で実行される音声翻訳プログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
また、本実施の形態の音声翻訳プログラムを、ROM等に予め組み込んで提供するように構成してもよい。
また、本実施の形態の音声翻訳装置1で実行される音声翻訳プログラムは、上述した各部(音声入力受付部、操作入力受付部、第1操作入力受付部、第2操作入力受付部、音声認識部、判定部、修正部、翻訳部、出力制御部等)を含むモジュール構成となっている。そして、実際のハードウェアとしてはCPU(プロセッサ)が上記記憶媒体から音声翻訳プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、音声入力受付部、操作入力受付部、第1操作入力受付部、第2操作入力受付部、音声認識部、判定部、修正部、翻訳部、出力制御部等が主記憶装置上に生成されるようになっている。
本実施の形態の音声翻訳装置の構成の一例を示すブロック図である。 本実施の形態の文法的な正しさの判定手法の一例を説明するための図である。 本実施の形態の文法的な正しさの判定手法の一例、および用法の判定手法の一例を説明するための図である。 本実施の形態の意味用法辞書データの一例を示す図である。 本実施の形態の用法情報の該当例を説明するための図である。 本実施の形態の用法の判定手法の一例を説明するための図である。 本実施の形態の蓄積手法の一例を説明するための図である。 本実施の形態の蓄積手法の一例を説明するための図である。 本実施の形態の音声翻訳装置で行われる処理手順の一例を示すフローチャートである。 本実施の形態の翻訳結果の出力例を説明するための図である。 本実施の形態の翻訳結果の出力例を説明するための図である。
符号の説明
1 音声翻訳装置
10 音声入力部
20 操作部
30 出力部
40 記憶部
42 蓄積部
44 意味用法辞書記憶部
100 音声入力受付部
110 操作入力受付部
112 第1操作入力受付部
114 第2操作入力受付部
120 音声認識部
130 判定部
140 修正部
150 翻訳部
160 出力制御部
201 文字列
202 文字列
203 文字列
204 文字列
205 文字列
206 文字列
207 文字列
208 見出し語
209 用法
210 用法
211 用法
212 用法
213 用法
214 文字列
215 訳文
216 訳文
217 訳文
218 補助表示
219 文字列
220 訳文
221 文字列
222 文字列
223 文字列
224 文字列
225 補助表示
226 文字列
227 文字列

Claims (8)

  1. 第1言語の発話音声の入力を受け付ける音声入力受付部と、
    前記発話音声の入力が受け付けられる毎に、当該発話音声を認識して文字列を生成する音声認識部と、
    前記文字列を順次蓄積する蓄積部と、
    先に蓄積された第1文字列と、新たに蓄積する候補である第2文字列とを比較し、前記第2文字列が前記第1文字列の言い直しであるか否かを判定する判定部と、
    言い直しでない場合には、前記第2文字列を前記蓄積部に蓄積させ、言い直しである場合には、前記第1文字列を前記第2文字列に修正して前記蓄積部に蓄積させる修正部と、
    前記蓄積部に蓄積される毎に、蓄積されている文字列を第2言語に翻訳する翻訳部と、
    翻訳結果を出力する出力部と、を備えることを特徴とする音声翻訳装置。
  2. 前記判定部は、前記蓄積部に蓄積されている文字列に前記第2文字列を追加した文字列が文法的に正しくなく、前記第1文字列と前記第2文字列の用法が同一である場合に、言い直しであると判定することを特徴とする請求項1に記載の音声翻訳装置。
  3. 前記翻訳部は、前記第2言語に翻訳した文字列を前記第1言語に更に翻訳し、
    前記出力部は、前記第2言語への翻訳結果とともに前記第1言語への翻訳結果を出力することを特徴とする請求項1または2に記載の音声翻訳装置。
  4. 翻訳結果を確定する確定操作の入力を受け付ける第1操作入力受付部を更に備え、
    前記判定部は、前記確定操作の入力が受け付けられた場合には、前記確定操作の入力以降に生成された前記第1文字列および前記第2文字列を用いて、言い直しであるか否かを判定し、
    前記翻訳部は、前記確定操作の入力が受け付けられた場合には、前記確定操作の入力以前の文字列の翻訳結果を確定して、前記蓄積部に蓄積されている文字列を前記第2言語に翻訳することを特徴とする請求項1〜3のいずれか1つに記載の音声翻訳装置。
  5. 修正を取り消す取消操作の入力を受け付ける第2操作入力受付部を更に備え、
    前記修正部は、前記取消操作の入力が受け付けられた場合には、前記第2文字列による修正を取り消して、修正された前記第1文字列とともに前記第2文字列を前記蓄積部に蓄積させることを特徴とする請求項1〜4のいずれか1つに記載の音声翻訳装置。
  6. 前記出力部は、前記翻訳結果が文として成立しているか否かに応じて、前記翻訳結果の出力態様を異ならせて出力することを特徴とする請求項1〜5のいずれか1つに記載の音声翻訳装置。
  7. 音声入力受付部が、第1言語の発話音声の入力を受け付ける音声入力受付ステップと、
    音声認識部が、前記発話音声の入力が受け付けられる毎に、当該発話音声を認識して文字列を生成する認識ステップと、
    判定部が、前記文字列を順次蓄積する蓄積部に先に蓄積された第1文字列と、新たに蓄積する候補である第2文字列とを比較し、前記第2文字列が前記第1文字列の言い直しであるか否かを判定する判定ステップと、
    修正部が、言い直しでない場合には、前記第2文字列を前記蓄積部に蓄積させ、言い直しである場合には、前記第1文字列を前記第2文字列に修正して前記蓄積部に蓄積させる修正ステップと、
    翻訳部が、前記蓄積部に蓄積される毎に、蓄積されている文字列を第2言語に翻訳する翻訳ステップと、
    出力部が、翻訳結果を出力する出力ステップと、を含むことを特徴とする音声翻訳方法。
  8. 音声入力受付部が、第1言語の発話音声の入力を受け付ける音声入力受付ステップと、
    音声認識部が、前記発話音声の入力が受け付けられる毎に、当該発話音声を認識して文字列を生成する認識ステップと、
    判定部が、前記文字列を順次蓄積する蓄積部に先に蓄積された第1文字列と、新たに蓄積する候補である第2文字列とを比較し、前記第2文字列が前記第1文字列の言い直しであるか否かを判定する判定ステップと、
    修正部が、言い直しでない場合には、前記第2文字列を前記蓄積部に蓄積させ、言い直しである場合には、前記第1文字列を前記第2文字列に修正して前記蓄積部に蓄積させる修正ステップと、
    翻訳部が、前記蓄積部に蓄積される毎に、蓄積されている文字列を第2言語に翻訳する翻訳ステップと、
    出力部が、翻訳結果を出力する出力ステップと、をコンピュータに実行させるための音声翻訳プログラム。
JP2008247999A 2008-09-26 2008-09-26 音声翻訳装置、方法、およびプログラム Active JP5336805B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008247999A JP5336805B2 (ja) 2008-09-26 2008-09-26 音声翻訳装置、方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008247999A JP5336805B2 (ja) 2008-09-26 2008-09-26 音声翻訳装置、方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2010079647A true JP2010079647A (ja) 2010-04-08
JP5336805B2 JP5336805B2 (ja) 2013-11-06

Family

ID=42210008

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008247999A Active JP5336805B2 (ja) 2008-09-26 2008-09-26 音声翻訳装置、方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5336805B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015026057A (ja) * 2013-07-29 2015-02-05 韓國電子通信研究院Electronics and Telecommunications Research Institute インタラクティブキャラクター基盤の外国語学習装置及び方法
JP2015036826A (ja) * 2013-08-12 2015-02-23 日本電気株式会社 コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム
JP2015121864A (ja) * 2013-12-20 2015-07-02 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびプログラム
JP2016173413A (ja) * 2015-03-16 2016-09-29 ヤマハ株式会社 情報提供システム
WO2017130483A1 (ja) * 2016-01-25 2017-08-03 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
WO2018055983A1 (ja) * 2016-09-23 2018-03-29 パナソニックIpマネジメント株式会社 翻訳装置、翻訳システム、および評価サーバ
KR20190062027A (ko) * 2017-11-28 2019-06-05 네이버 주식회사 번역 결과 제공 방법, 장치 및 컴퓨터 프로그램, 번역 결과 표시 방법, 장치 및 컴퓨터 프로그램
JP2020149053A (ja) * 2019-03-11 2020-09-17 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド トレーニングコーパスの生成方法、装置、機器及び記憶媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263494A (ja) * 1995-03-28 1996-10-11 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 言語解析装置
JPH1078961A (ja) * 1996-09-04 1998-03-24 Nippon Telegr & Teleph Corp <Ntt> 発話解析装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263494A (ja) * 1995-03-28 1996-10-11 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 言語解析装置
JPH1078961A (ja) * 1996-09-04 1998-03-24 Nippon Telegr & Teleph Corp <Ntt> 発話解析装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200500858005; 船越 孝太郎: '音声情報処理技術の最先端' 情報処理 第45巻,第10号, 20041015, page 1032-1037, 社団法人情報処理学会 *
JPN6012061645; 船越 孝太郎: '音声情報処理技術の最先端' 情報処理 第45巻,第10号, 20041015, page 1032-1037, 社団法人情報処理学会 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015026057A (ja) * 2013-07-29 2015-02-05 韓國電子通信研究院Electronics and Telecommunications Research Institute インタラクティブキャラクター基盤の外国語学習装置及び方法
JP2015036826A (ja) * 2013-08-12 2015-02-23 日本電気株式会社 コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム
JP2015121864A (ja) * 2013-12-20 2015-07-02 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびプログラム
JP2016173413A (ja) * 2015-03-16 2016-09-29 ヤマハ株式会社 情報提供システム
WO2017130483A1 (ja) * 2016-01-25 2017-08-03 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
WO2018055983A1 (ja) * 2016-09-23 2018-03-29 パナソニックIpマネジメント株式会社 翻訳装置、翻訳システム、および評価サーバ
JPWO2018055983A1 (ja) * 2016-09-23 2019-01-17 パナソニックIpマネジメント株式会社 翻訳装置、翻訳システム、および評価サーバ
KR20190062027A (ko) * 2017-11-28 2019-06-05 네이버 주식회사 번역 결과 제공 방법, 장치 및 컴퓨터 프로그램, 번역 결과 표시 방법, 장치 및 컴퓨터 프로그램
KR102036350B1 (ko) * 2017-11-28 2019-10-25 네이버 주식회사 번역 결과 제공 방법, 장치 및 컴퓨터 프로그램, 번역 결과 표시 방법, 장치 및 컴퓨터 프로그램
JP2020149053A (ja) * 2019-03-11 2020-09-17 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド トレーニングコーパスの生成方法、装置、機器及び記憶媒体
US11348571B2 (en) 2019-03-11 2022-05-31 Beijing Baidu Netcom Science And Technology Co., Ltd. Methods, computing devices, and storage media for generating training corpus

Also Published As

Publication number Publication date
JP5336805B2 (ja) 2013-11-06

Similar Documents

Publication Publication Date Title
JP5336805B2 (ja) 音声翻訳装置、方法、およびプログラム
JP4481972B2 (ja) 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム
JP4064413B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US7873508B2 (en) Apparatus, method, and computer program product for supporting communication through translation between languages
US7412387B2 (en) Automatic improvement of spoken language
JP4542974B2 (ja) 音声認識装置、音声認識方法および音声認識プログラム
JP4987623B2 (ja) ユーザと音声により対話する装置および方法
US20070198245A1 (en) Apparatus, method, and computer program product for supporting in communication through translation between different languages
EP1089193A2 (en) Translating apparatus and method, and recording medium used therewith
US20080077387A1 (en) Machine translation apparatus, method, and computer program product
JP2006277677A (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP2008209717A (ja) 入力された音声を処理する装置、方法およびプログラム
US20090138266A1 (en) Apparatus, method, and computer program product for recognizing speech
JP2001100781A (ja) 音声処理装置および音声処理方法、並びに記録媒体
KR101836430B1 (ko) 음성 인식과 번역 방법 및 그를 위한 단말 장치와 서버
JP2008243080A (ja) 音声を翻訳する装置、方法およびプログラム
WO2011033834A1 (ja) 音声翻訳システム、音声翻訳方法および記録媒体
JP6397641B2 (ja) 自動通訳装置及び方法
JP4042360B2 (ja) 自動通訳システム及びその方法並びにプログラム
JP5208795B2 (ja) 通訳装置、方法、及びプログラム
JP2010134074A (ja) 音声認識装置、方法、およびプログラム
JP7414078B2 (ja) 変換テーブル生成装置、音声対話システム、変換テーブル生成方法、およびコンピュータプログラム
JP2003162524A (ja) 言語処理装置
JP2008243222A (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP2007264229A (ja) 対話装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110323

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130709

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130802

R151 Written notification of patent or utility model registration

Ref document number: 5336805

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350