JP2001051999A - 翻訳装置、翻訳電話システム、翻訳方法、および、情報記録媒体 - Google Patents

翻訳装置、翻訳電話システム、翻訳方法、および、情報記録媒体

Info

Publication number
JP2001051999A
JP2001051999A JP11226941A JP22694199A JP2001051999A JP 2001051999 A JP2001051999 A JP 2001051999A JP 11226941 A JP11226941 A JP 11226941A JP 22694199 A JP22694199 A JP 22694199A JP 2001051999 A JP2001051999 A JP 2001051999A
Authority
JP
Japan
Prior art keywords
language
morpheme
voice
sequence
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11226941A
Other languages
English (en)
Inventor
Takeshi Fuchi
武志 渕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP11226941A priority Critical patent/JP2001051999A/ja
Publication of JP2001051999A publication Critical patent/JP2001051999A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【課題】 翻訳装置、翻訳電話システム、翻訳方法、お
よび、情報記録媒体を提供する。 【解決手段】 翻訳装置の音声入力受付部は、音声入力
を受け付ける。第1言語辞書記憶部は、終端記号と非終
端記号とを含む記号により定義される第1言語の文法で
あって、形態素を終端記号とし、1つ以上の記号の列を
非終端記号とする文法と、当該形態素と、当該形態素の
発音と、を記憶する。音声認識部は、音声入力受付部に
より受け付けられた音声入力を、第1言語辞書記憶部に
記憶された第1言語の文法と、当該形態素と、当該形態
素の発音とを参照して音声認識して第1言語の形態素列
を出力する。翻訳部は、音声認識部により出力された第
1言語の形態素列を第2言語の形態素列に翻訳する。音
声信号出力部は、翻訳部により翻訳された第2言語の形
態素列を音声信号に変換して出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、翻訳装置、翻訳電
話システム、翻訳方法、および、情報記録媒体に関す
る。
【0002】
【従来の技術】近年、音声入力を辞書を用いて認識し、
形態素の列を出力する音声認識が普及してきている。こ
のような音声認識の分野では、たとえば、形態素のN-gr
amを用いて音声認識を行うIBM社のViaVoiceや、形態素
を終端記号とする文法をBNF(Backus-Naur Form;バ
ッカス−ナウア記法)により定義し、この文法に適合し
た音声入力を認識するNTT社のREX(http://www.hil.nt
t.co.jp/Speech/REX/参照)などが提案されている。
【0003】一方で、特開平11−85753号公報に
開示されるように、あらかじめ定義された単語と文法と
定型文を用いて第1言語による文章を作成し、これを第
2言語に翻訳する手法も提案されている。
【0004】
【発明が解決しようとする課題】しかしながら、従来
は、ユーザが発した第1言語の音声を音声認識し、これ
を正確に第2言語に翻訳して、音声信号として相手に伝
達する翻訳装置や翻訳方法は実現されていなかった。
【0005】特に、ホテルや飛行機の予約などについて
外国人と会話をする場合は、電話を用いることが多い
が、この場合に、上記のような翻訳装置や翻訳方法の実
現が強く望まれている。
【0006】また、音声認識の結果をユーザが確認し、
必要に応じて修正を行った上で翻訳を行う翻訳装置や翻
訳方法に対する要望も大きい。
【0007】本発明は、上記の問題を解決するためにな
されたもので、翻訳装置、翻訳電話システム、翻訳方
法、および、情報記録媒体を提供することを目的とす
る。
【0008】
【課題を解決するための手段】以上の目的を達成するた
め、本発明の原理にしたがって、下記の発明を開示す
る。
【0009】本発明の翻訳装置は、音声入力受付部と、
第1言語辞書記憶部と、音声認識部と、翻訳部と、音声
信号出力部と、を備える。
【0010】音声入力受付部は、音声入力を受け付け
る。
【0011】第1言語辞書記憶部は、終端記号と非終端
記号とを含む記号により定義される第1言語の文法であ
って、形態素を終端記号とし、1つ以上の記号の列を非
終端記号とする文法と、当該形態素と、当該形態素の発
音と、を記憶する。
【0012】音声認識部は、音声入力受付部により受け
付けられた音声入力を、第1言語辞書記憶部に記憶され
た第1言語の文法と、当該形態素と、当該形態素の発音
とを参照して音声認識して第1言語の形態素列を出力す
る。
【0013】翻訳部は、音声認識部により出力された第
1言語の形態素列を第2言語の形態素列に翻訳する。
【0014】音声信号出力部は、翻訳部により翻訳され
た第2言語の形態素列を音声信号に変換して出力する。
【0015】本発明によれば、第1言語辞書により定義
された文法をテンプレートとして音声認識を行うため、
精度の高い音声認識ができる。
【0016】また、本発明の翻訳装置は、さらに、第2
言語辞書記憶部を備えるように構成することができる。
【0017】第2言語辞書記憶部は、第1言語辞書記憶
部に記憶された第1言語の文法と、当該形態素と、当該
形態素の発音と、に対応付けられた第2言語の文法と、
当該形態素と、当該形態素の発音と、を記憶する。
【0018】翻訳部は、第2言語辞書記憶部に記憶され
た第2言語の文法と、当該形態素と、を参照して第1言
語の形態素列を第2言語の形態素列に翻訳する。
【0019】音声信号出力部は、第2言語辞書記憶部に
記憶された形態素と、当該形態素の発音と、を参照して
第2言語の形態素列を音声信号に変換して出力する。
【0020】本発明によれば、第1言語辞書により定義
された文法に適合した第1言語の形態素列を、第1言語
辞書に合わせて構成した第2言語辞書により定義された
文法、形態素、発音を用いて翻訳し、音声信号を出力で
きるため、精度の高い翻訳ができる。
【0021】また、本発明の翻訳装置は、さらに、表示
部と、修正入力受付部とを備えるように構成することが
できる。
【0022】表示部は、音声認識部により音声認識され
た第1言語の形態素列を表示する。
【0023】修正入力受付部は、表示部に表示された第
1言語の形態素列を修正する修正入力を受け付ける。
【0024】音声認識部は、修正入力受付部により修正
された第1言語の形態素列を出力する。
【0025】本発明によれば、音声認識部が音声入力を
誤認識した場合であっても、認識結果の第1言語形態素
列をユーザが修正することができ、正確な翻訳ができ
る。
【0026】また、本発明の翻訳装置において、音声認
識部が音声入力受付部により入力された音声の音声認識
に失敗した場合、表示部は、当該音声のうち、音声認識
できた部分の第1言語の形態素列と、音声認識できなか
った部分とを当該音声入力の順に対応させて表示し、修
正入力受付部は、音声認識できなかった部分に第1言語
の形態素列を割り当てる修正入力をも受け付けるように
構成することができる。
【0027】本発明によれば、たとえばユーザが一つの
文を音声入力した場合に、その一部のみについて音声認
識が成功した場合には、成功した音声認識結果の形態素
と、失敗した部分とを音声入力の順に表示して修正を促
すことにより、容易に第1言語の形態素列を修正するこ
とができる。
【0028】また、本発明の翻訳装置は、送信部と、受
信部と、受信音声出力部と、をさらに備えることができ
る。
【0029】送信部は、音声信号出力部により出力され
た音声信号を電話回線に送信する。
【0030】受信部は、電話回線から送信された音声信
号を受信する。
【0031】受信音声出力部は、受信部により受信され
た音声信号を音声に変換して出力する。
【0032】本発明によれば、従来の電話機と置換可能
な翻訳電話機を実現することができる。
【0033】本発明の翻訳電話システムは、本発明の翻
訳装置と、交換部とを備える。
【0034】交換部は、電話回線を介して、翻訳装置の
送信部と受信部とを、他の電話機に接続する。
【0035】本発明によれば、従来の電話機と置換可能
な翻訳電話システムを実現することができる。
【0036】本システムでは、翻訳装置は、第1言語を
音声入力とし、第2言語を音声信号出力とするものとす
ることができる。一方、他方の電話機は、通常の電話機
のほか、第2言語を音声入力とし、第1言語を音声信号
出力とする、本発明の翻訳装置と同様の構成の翻訳装置
を用いることができる。
【0037】本発明の翻訳方法は、音声入力受付工程
と、音声認識工程と、翻訳工程と、音声信号出力工程
と、を備える。
【0038】音声入力受付工程では、音声入力を受け付
ける。
【0039】音声認識工程では、音声入力受付工程にて
受け付けられた音声入力を、あらかじめ記憶された終端
記号と非終端記号とを含む記号により定義される第1言
語の文法であって、形態素を終端記号とし、1つ以上の
記号の列を非終端記号とする文法と、当該形態素と、当
該形態素の発音と、を参照して音声認識して第1言語の
形態素列を出力する。
【0040】翻訳工程では、音声認識工程にて出力され
た第1言語の形態素列を第2言語の形態素列に翻訳す
る。
【0041】音声信号出力工程では、翻訳工程にて翻訳
された第2言語の形態素列を音声信号に変換して出力す
る。
【0042】本発明によれば、第1言語辞書により定義
された文法をテンプレートとして音声認識を行うため、
精度の高い音声認識ができる。
【0043】また、本発明の翻訳方法は、表示工程と、
修正入力受付工程と、をさらに備えるように構成するこ
とができる。
【0044】表示工程では、音声認識工程により音声認
識された第1言語の形態素列を表示する。
【0045】修正入力受付工程では、表示工程にて表示
された第1言語の形態素列を修正する修正入力を受け付
ける。
【0046】音声認識工程では、修正入力受工程にて修
正された第1言語の形態素列を出力する。
【0047】本発明によれば、音声入力を誤認識した場
合であっても、認識結果の第1言語形態素列をユーザが
修正することができ、正確な翻訳ができる。
【0048】また、本発明の翻訳方法において、音声認
識工程にて、音声入力受付工程にて入力された音声の音
声認識に失敗した場合、表示工程にて、当該音声のう
ち、音声認識できた部分の第1言語の形態素列と、音声
認識できなかった部分とを当該音声入力の順に対応させ
て表示し、修正入力受付工程にて、音声認識できなかっ
た部分に第1言語の形態素列を割り当てる修正入力をも
受け付けるように構成することができる。
【0049】本発明によれば、たとえばユーザが一つの
文を音声入力した場合に、その一部のみについて音声認
識が成功した場合には、成功した音声認識結果の形態素
と、失敗した部分とを音声入力の順に表示して修正を促
すことにより、容易に第1言語の形態素列を修正するこ
とができる。
【0050】本発明の翻訳装置を制御するプログラム
や、本発明の翻訳装置で利用される言語辞書を、コンパ
クトディスク、フロッピーディスク、ハードディスク、
光磁気ディスク、ディジタルビデオディスク、磁気テー
プ、半導体メモリなどの情報記録媒体に記録することが
できる。
【0051】本発明の情報記録媒体に記録されたプログ
ラムを翻訳装置で実行し、あるいは、本発明の情報記録
媒体に記憶された言語辞書を翻訳装置で利用することに
より、上記の翻訳装置、翻訳電話システム、翻訳方法、
を実現することができる。
【0052】また、これらの装置とは独立して、本発明
のプログラムや言語辞書を記録した情報記録媒体を配
布、販売することができる。
【0053】
【発明の実施の形態】以下に本発明の一実施形態を説明
する。なお、以下に説明する実施形態は説明のためのも
のであり、本願発明の範囲を制限するものではない。し
たがって、当業者であればこれらの各要素もしくは全要
素をこれと均等なものに置換した実施形態を採用するこ
とが可能であるが、これらの実施形態も本願発明の範囲
に含まれる。
【0054】(第1の実施形態)図1は、本発明の翻訳
装置の第1の実施形態の外観を示す説明図である。以下
では、図1を参照して、本発明の翻訳装置の第1の実施
形態について説明する。
【0055】本実施形態の翻訳装置101の外観は、図
1(a)に示す通り、公衆電話の電話機に類似してお
り、本翻訳装置101は、自動翻訳電話機として機能す
る。
【0056】翻訳装置101の受話機102にはマイク
103とスピーカ104が備えられる。翻訳装置101
は、ユーザが発した音声をマイク103で受け付ける。
【0057】マイク103が受け付けた音声は、匡体部
105内のコンピュータ(図示せず)によって音声認識
され、音声認識の結果を液晶ディスプレイ106に表示
する。
【0058】ユーザは、液晶ディスプレイ106に表示
された音声認識の結果を見て、ボタン107を押圧操作
し、必要があれば認識結果を修正する。
【0059】修正が完了したら、匡体部105内のコン
ピュータは、修正済みの認識結果を翻訳し、翻訳した結
果を音声信号に変換して、電話線108へ出力する。電
話線108は、交換機(図示せず)を介して通話相手の
電話機などに接続され、通話相手は、電話線108を介
して送信された音声信号を音声として聞くことができ
る。
【0060】このほか、翻訳装置101は、電話線10
8を介して通話相手の音声信号を受信し、受話機102
のスピーカ104から音声として出力することができ
る。
【0061】図1(b)は、携帯電話機のような外観を
した翻訳装置101であり、上述の翻訳装置同様、マイ
ク103、スピーカ104、液晶ディスプレイ106、
ボタン107を備える。また、電話線ではなく、アンテ
ナ120による無線回線を用いて音声信号を送信出力す
ることができる。
【0062】(第2の実施形態)図2は、本発明の翻訳
装置の第2の実施形態の外観を示す説明図である。以下
では、図2を参照して、本発明の翻訳装置の第2の実施
形態について説明する。なお、図2において、図1と同
様の機能を果たす要素には、同じ符号を付してある。
【0063】翻訳装置101は、マイク103、スピー
カ104、キーボード109、マウス110、コンピュ
ータ本体111、CRT(Cathode Ray Tube)112、
モデム113、CD−ROM(Compact Disk Read Only
Memory)ドライブ114、フロッピーディスクドライ
ブ115などを備えるコンピュータシステムとして構成
されている。
【0064】マイク103は、ユーザが発した音声を受
け付ける。マイク103が受け付けた音声は、アナログ
/ディジタル変換されて、コンピュータ本体111のC
PU(図示せず)によって音声認識される。音声認識の
際に、CPUは、CD−ROMドライブ114に装着さ
れたCD−ROM、フロッピーディスクドライブ115
に装着されたフロッピーディスク、コンピュータ本体に
備えられたハードディスク(図示せず)などの外部記憶
装置に記録された音声認識用の第1言語(ユーザの使用
言語)辞書を用いる。
【0065】CPUは、音声認識の結果をCRT 11
2に表示する。ユーザは、CRT112に表示された結
果を見て、キーボード109やマウス110を操作し、
必要があれば、認識結果を修正する。
【0066】修正が完了したら、CPUは、修正済みの
認識結果を翻訳する。翻訳の際にも、外部記憶装置に記
録された第2言語(通話相手の使用言語)辞書を用い
る。
【0067】さらに、CPUは、翻訳した結果を音声信
号に変換し、モデム113を制御して電話線108を介
して通話相手に送信する。通話相手は、電話線108を
介して送信された音声信号を音声として聞くことができ
る。
【0068】このほか、翻訳装置101は、電話線10
8とモデム113を介して通話相手の音声信号を受信
し、スピーカ104から音声として出力することができ
る。スピーカ104は、図に示すようにヘッドホンに備
えられたものでもよいし、コンピュータシステムの外部
スピーカにより実現することもできる。
【0069】(翻訳装置の概要構成)図3は、図2に示
す翻訳装置の概要構成の一例を示すブロック構成図であ
る。以下では、図3を参照して、上記の翻訳装置の概要
構成の一例について説明する。なお、図1に示す翻訳装
置においても、同様の機能を果たす要素があるため、あ
わせて言及する。
【0070】翻訳装置101のCPU 301は、翻訳
装置101全体を制御し、音声認識部、翻訳部として働
く。この際に、RAM(Random Access Memory)313
を一時的な記憶領域として使用することができる。
【0071】翻訳装置101の音声入力受付部は、マイ
ク103などにより実現される。CPU 301とは、
アナログ/ディジタル変換器を介して接続される。
【0072】翻訳装置101の音声信号出力部と送信部
は、モデム113や電話線108などにより実現され
る。
【0073】翻訳装置101の受信部は、モデム113
や電話線108などにより実現される。
【0074】翻訳装置101の受信音声出力部は、受信
部が受信した音声信号を音声に変換して出力するスピー
カ104などにより実現される。
【0075】翻訳装置101の第1言語辞書記憶部や第
2言語辞書記憶部は、翻訳装置101のCD−ROMド
ライブ114に装着されたCD、フロッピーディスクド
ライブ115に装着されたフロッピーディスク、ハード
ディスク320や、ROM312などの静的記憶部によ
り実現される。
【0076】翻訳装置101の表示部は、液晶ディスプ
レイ106、CRT 112などにより実現される。
【0077】翻訳装置101の修正入力受付部は、ボタ
ン107、キーボード109、マウス110などにより
実現される。
【0078】これらの各要素は、適宜変更し、あるい
は、条件や必要に応じて同等の機能を有する要素に置
換、変更が可能である。
【0079】(翻訳装置が実行する処理)図4は、上記
の翻訳装置101が実行する処理の流れを示すフローチ
ャートである。以下、図4を参照して上記の翻訳装置1
01が実行する処理の手順を説明する。
【0080】まず、翻訳装置101の音声入力受付部の
マイク103が、ユーザが発した第1言語の音声の入力
を受け付ける(ステップS401)。
【0081】ついで、マイク103により受け付けられ
た音声をアナログ/ディジタル変換し(ステップS40
2)、変換された音声のディジタル信号をRAM 31
3などの一時的な記憶領域に記憶する(ステップS40
3)。
【0082】さらに、CPU 301は、RAM 31
3に記憶された音声のディジタル信号を音声認識し(ス
テップS404)、音声認識した結果を、構文木などの
公知のデータ構造に構築してRAM 313に記憶す
る。
【0083】音声認識の際に、CPU 301は、CD
−ROMドライブ114に装着されたCD、フロッピー
ディスクドライブ115に装着されたフロッピーディス
ク、ハードディスク320、ROM 312などに記憶
された第1言語の文法を参照する。
【0084】CPU 301は、RAM 313に記憶
された音声認識結果を液晶ディスプレイ106やCRT
112などの表示装置に表示し(ステップS40
5)、修正が必要か否かユーザに問い合わせる(ステッ
プS406)。
【0085】修正が必要であるとユーザが指定した場合
(ステップS406;Yes)、ボタン107、キーボ
ード109、マウス110などによる修正入力を受け付
けて(ステップS407)、当該修正入力にしたがって
記憶された構文木などのデータ構造を修正し(ステップ
S408)、ステップS405に戻る。
【0086】一方、認識結果がユーザの意図通りであ
り、修正が不要である旨ユーザが指定した場合や、修正
を完了したため、もはや修正が必要ない旨をユーザが指
定した場合(ステップS406;No)、修正された構
文木などのデータ構造を第2言語に翻訳する(ステップ
S410)。
【0087】翻訳および音声出力の際に、CPU 30
1は、CD−ROMドライブ114に装着されたCD、
フロッピーディスクドライブ115に装着されたフロッ
ピーディスク、ハードディスク320、ROM 312
などに記憶された第2言語の文法を参照する。
【0088】翻訳が完了したら、当該翻訳結果に対応す
る音声のディジタル信号を出力し(ステップS41
1)、当該ディジタル信号をアナログ信号に変換して
(ステップS412)、送信部を介して相手先の電話機
などに出力する(ステップS413)。
【0089】これらステップS401〜ステップS41
3を繰り返すことにより、第1言語(たとえば日本語)
の文章を声に出して入力し、相手には第2言語(たとえ
ば英語)の音声で伝達することができる。
【0090】なお、この処理とは独立に、翻訳装置10
1は、受信部が受信した通話相手からの音声信号を受信
音声出力部が音声に変換して出力する処理を行うことが
できる。これらにより、翻訳電話機を構成することがで
きる。
【0091】また、十分な精度で音声認識ができる場合
には、ステップS405〜ステップS408を省略して
もよい。
【0092】(音声認識部の概要構成)図5は、上記の
翻訳装置101の静的記憶部内の第1言語辞書記憶部に
記憶される第1言語辞書の概要構成を説明する説明図で
ある。
【0093】第1言語辞書は、BNF記法もしくはこれ
と同等なデータ構造により記述することができる。図5
では、理解を容易にするため、NTT社のREXで用いられて
いるBNF記法に類似した文法記法を用いて記述してあ
る。図5には、日本語の音声を音声認識するための文法
定義の一部を示してある。実機で用いる文法定義は、図
5に示す定義よりも大きい。
【0094】図中「$[太郎] = たろー;」などは、文法
の終端記号として機能する形態素の綴りとその発音を定
義する。この例では、綴りは「太郎」、発音は「たろ
ー」である。また、この形態素に対応する終端記号とし
て、文法定義にあるように、終端記号「$太郎」が自動
的に定義される。
【0095】図中の「$who = ($太郎 | $花子);」は、
非終端記号「$who」が終端記号「$太郎」もしくは終端
記号「$花子」により定義されることを示す。|は、複数
の侯補がある場合にこれを区切る働きをする。
【0096】このように、非終端記号は、非終端記号と
終端記号を含む記号の列(の群)として定義される。
【0097】PAUSEは息継ぎがあることを意味し、[PAUS
E]は息継ぎがあってもなくてもよいことを意味する。
【0098】START = pause $sentence pauseは、BN
F記法による文法定義の開始記号の定義である。
【0099】この文法定義により認識できる日本語の音
声文には、たとえば以下のようなものがある。
【0100】「太郎は本をもらう」
【0101】「花子がバラを買う」
【0102】図6は、本発明の翻訳装置の第1言語辞書
の音声認識の様子を説明する説明図である。図6には、
音声「たろーは ほんお もらう」をマイク103が
音声入力として受け付けた場合の、音声認識の過程と文
法との関係を示す説明図である。
【0103】図6は、構文解釈木と考えることができる
が、第1言語の文法を所定の文法カテゴリーに含まれる
ように定義しておけば、通常のコンピュータ・プログラ
ムのソース・ファイルを解釈する字句解析や構文解析の
手法が利用できる。
【0104】このように、第1言語の文法定義が音声認
識のテンプレートとして機能し、当該文法に適合する文
のみが認識結果として採用されるので、意味が曖昧な文
章や正確な翻訳が難しい文章を排除することができ、後
述する第2言語への翻訳が正確にできるようになる。
【0105】(修正処理)本発明では、音声認識が不正
確であった場合や音声認識が完全には成功しなかった場
合に対応するため、ステップS405〜ステップS40
8において、認識結果の修正処理を行っている。
【0106】以下では、この修正処理において用いられ
る画面表示や修正処理においてユーザが行い本装置が受
け付ける操作入力の実施例について説明する。
【0107】図7は、ステップS404において音声認
識された結果をステップS405において画面に表示し
た例を示す説明図である。
【0108】画面701には、認識された各項目が表示
されている。この例で表示されている項目には、主語フ
ィールド702、目的語フィールド703、述語フィー
ルド704があり、それぞれ認識結果として「太郎」
「本」「買う」が表示されている。また、これらの項目
の間には、認識結果の一部である助詞「は」「を」が表
示されている。
【0109】主語フィールド702、目的語フィールド
703、述語フィールド704は、入力可能なデータを
一覧表示し、そこから所望のデータを選択して修正入力
することができるリストボックス構造になっている。
【0110】ユーザは、ボタン107、キーボード10
9、マウス110などを操作して、入力可能なデータを
一覧表示した例を図8に示す。図8は、目的語フィール
ド703の値を修正する場合の表示例であり、入力可能
な値として「バラ」「本」が一覧表示されている。
【0111】ユーザは、「本」を「バラ」に修正し、全
体の修正が完了したら、発音ボタン705を選択する。
【0112】発音ボタン705を選択することにより、
ステップS406における問い合わせの結果が「修正不
要」となり、ステップS410以降に処理が進む。
【0113】なお、たとえば目的語部分の音声認識に
は、失敗したが、それ以外の主語・述語の音声認識は成
功した場合など、特定の形態素や形態素列の認識に失敗
した場合は、当該部分に相当する修正フィールドを空欄
とするか「???」などの記号を表示することにより、ユ
ーザに修正入力を促すことができる。
【0114】なお、これらの修正入力の操作の際には、
近年普及しつつある情報端末型の携帯電話やPHSなど
で採用されているボタン入力による方法を採用すること
ができる。
【0115】(翻訳処理)以下では、本発明における翻
訳処理の実施例について説明する。
【0116】図9は、第1言語から第2言語への翻訳を
行う場合に参照される翻訳用の第2言語の辞書の概要を
示す説明図である。図9に示す第2言語辞書は、図5に
示す第1言語辞書に翻訳用の情報を付加したものとなっ
ている。したがって、第1言語辞書を第2言語辞書に埋
め込み、情報を共有することで辞書のサイズを小さくす
ることができる。
【0117】第1言語の形態素には、対応する第2言語
の形態素と、その発音とが対応付けられている。たとえ
ば、形態素$[太郎]には、第2言語の翻訳結果の綴りTar
oが対応付けられ、その発音が[...]内に表示されてい
る。なお、図中では、[...]内に発音記号を記載してい
るが、現実には、第2言語辞書中に、その語句を発音し
た音声情報そのものを記録してもよい。
【0118】本例では、第1言語として日本語、第2言
語として英語を採用しているため、日本語の助詞に対応
する$[は]、$[が]には対応する英語の翻訳結果が設定さ
れていないが、それ以外の形態素については、すべて綴
りと発音が対応付けられている。
【0119】なお、本発明においては、第2言語の音声
を出力することが目的であるため、第2言語の綴りを辞
書内に記憶しておく必要はない。ただし、第2言語へ翻
訳した結果をさらに確認し、修正を加えるなどの実施形
態をとる場合には、これらの情報を辞書に記憶する必要
がある。
【0120】文法の定義も、図5に示す第1言語辞書の
場合と類似している。たとえば、非終端記号$whoは、終
端記号$太郎もしくは終端記号$花子であると定義されて
おり、その翻訳結果は、列挙された記号の第1番目の要
素を翻訳したものであることを$1により指定している。
【0121】一方、$sentenceは、日本語では、主語、
目的語、述語の順となる。これらはそれぞれ$1、$2、$3
に対応付けられている。英語では、順番が入れ替わり、
主語($1)、述語($3)、目的語($2)の順となること
が指定されている。
【0122】図10は、図6に示す構文解析の様子と同
様、翻訳の過程を示す説明図である。
【0123】第1言語の構文木に基づいて第2言語の翻
訳結果の木が構築され、最終的な翻訳結果としてTaro b
uys a bookが得られている。このように、本発明におい
ては、入力される第1言語の文章が、図6に示すような
第1言語文法にしたがうことが前提となっているため、
第1言語文法と対応付けて第2言語文法を定義すれば、
きわめて正確に翻訳を行うことができる。
【0124】なお、本発明における翻訳処理では、上記
の翻訳技法のほか、公知の機械翻訳技法を採用すること
ができる。第1言語の文法にしたがった文章のみを翻訳
対象とするため、この場合も、正確な翻訳結果を期待す
ることができ、当該実施形態も本発明の範囲に含まれ
る。
【0125】(翻訳電話システムの概要構成)図11
は、上記の翻訳装置を組み合わせた翻訳電話システムの
概要構成を示す説明図である。以下、図11を参照し
て、本発明の翻訳電話システムについて説明する。な
お、以下では、理解を容易にするため、日本語を用いる
ユーザと、英語を用いるユーザとが本システムにて会話
をする場合を例としてとりあげて説明する。
【0126】翻訳電話システム1101は、日本語ユー
ザ側翻訳装置1201と、英語ユーザ側翻訳装置130
1と、これらを接続する交換機1401を備える。
【0127】日本語ユーザが発声した日本語文の音声入
力は、日本語ユーザ側翻訳装置1201により英語の音
声に翻訳される。すなわち、日本語ユーザ側翻訳装置1
201は、第1言語を日本語、第2言語を英語とする上
述の翻訳装置101である。
【0128】英語ユーザ側翻訳装置1301の受信部1
302は、交換機1401を介して日本語ユーザ側翻訳
装置1201の音声信号出力部1203に接続される。
これにより、英語ユーザは、日本語ユーザから英語で発
音される音声信号を得ることができる。
【0129】一方、英語ユーザが発声した英語文の音声
入力は、英語ユーザ側翻訳装置1301により日本語の
音声に翻訳される。すなわち、英語ユーザ側翻訳装置1
301は、第1言語を英語、第2言語を日本語とする上
述の翻訳装置101である。この場合の第1・第2言語
の文法定義を図12に示す。
【0130】日本語ユーザ側翻訳装置1201の受信部
1202は、交換機1401を介して英語ユーザ側翻訳
装置1301の音声信号出力部1303に接続される。
これにより、日本語ユーザは、英語ユーザから、日本語
で発音される音声信号を得ることができる。
【0131】すなわち、両ユーザは、いずれも母国語を
発音して相手に意図を伝達し、相手からも自分の母国語
による音声によって返事を受けることができる。
【0132】本構成は、既存の電話システムにおける電
話機を、上述の翻訳装置を含む翻訳電話機と置換するこ
とにより実現することができる。このため、本発明の翻
訳電話システムを実現する際に、電話機通信網の大規模
な改修・変更は不要である。
【0133】(第3の実施形態)上記の実施形態では、
たとえば第1言語として日本語を、第2言語として英語
を採用した場合、日本語の音声認識用の文法に現れる終
端記号や非終端記号のそれぞれと、英単語や英文の構成
要素の並び順とを対応付けて、翻訳を行っていた。この
ような実施形態を採用していても、外国語を使用する状
況が限られている場合、たとえば、外国のホテルを予約
する場合や外国の通信販売の商品を注文する場合には、
このような限られた文法や単語での翻訳手法で十分な場
合も多い。
【0134】しかしながら、たとえば日本語の述語(動
詞など)を英語に翻訳する場合、対応する英単語として
さまざまな侯補がありうる。また目的語と述語の組合せ
に応じて適切な単語列を選択しなければならない場合も
ある。また、日本語と英語の間だけではなく、ほかの外
国語動詞の翻訳にも対応したいという要望も強い。本実
施形態は、このような課題を解決するものである。以下
説明する。
【0135】上記の実施形態では、たとえば日本語から
英語への自動翻訳を行いたい場合、日英の翻訳用の辞書
を使用していた。本実施形態では、日本語を一旦中間言
語に翻訳し、この中間言語を英語に翻訳する、という手
法を採用する。
【0136】このように、中間言語を介してあらかじめ
定められたテンプレートにしたがった文を各国語に翻訳
する手法は、たとえば、特開平11−85753号公報
に開示されている。
【0137】本発明では、第1言語辞書によりあらかじ
め定義された単語と定型文とを用いて第1言語の文を音
声入力し、必要があれば、適宜これを修正する。
【0138】したがって、入力された第1言語の文は、
一定のカテゴリーの文(定型文)に限定されるため、文
意を損なわないように、中間言語の形式で取得すること
ができる。
【0139】このような定型文を、文意を損なわないよ
うに、第2言語に翻訳することにより、第1言語と中間
言語との変換辞書を用意すれば、必要に応じて、第2言
語の種類を容易に増やすことができる。中間言語から第
2言語への変換辞書を用意すればよいからである。
【0140】本実施形態では、たとえば、日本語から英
語へ翻訳する翻訳装置が存在する場合、日本語から中間
言語への変換辞書がすでに用意されている。日本語から
中国語への翻訳装置を実現したい場合には、中間言語か
ら中国語への変換辞書を用意するだけですみ、翻訳用辞
書のモジュール化を進めることができる。
【0141】このように新たに用意された中間言語から
各国語への翻訳用辞書は、それぞれ単独に追加可能であ
り、単独で情報記録媒体に記録して用意に配布・販売す
ることができる。
【0142】
【発明の効果】以上説明したように、本発明によれば、
翻訳装置、翻訳電話システム、翻訳方法、および、情報
記録媒体を提供することができる。
【図面の簡単な説明】
【図1】本発明の翻訳装置の第1の実施形態の外観を示
す説明図である。
【図2】本発明の翻訳装置の第2の実施形態の外観を示
す説明図である。
【図3】本発明の翻訳装置の概要構成の一例を示すブロ
ック構成図である。
【図4】本発明の翻訳装置により実行される処理の流れ
を示すフローチャートである。
【図5】本発明の翻訳装置の第1言語辞書の構成例を説
明する説明図である。
【図6】本発明の翻訳装置の音声認識の様子を説明する
説明図である。
【図7】本発明の翻訳装置の修正処理における表示例の
説明図である。
【図8】本発明の翻訳装置の修正処理における表示例の
説明図である。
【図9】本発明の翻訳装置の第2言語辞書の構成例を説
明する説明図である。
【図10】本発明の翻訳装置の翻訳の様子を説明する説
明図である。
【図11】本発明の翻訳電話システムの全体構成を示す
説明図である。
【図12】本発明の翻訳装置の文法辞書の構成例を説明
する説明図である。
【符号の説明】
101 翻訳装置 102 受話機 103 マイク 104 スピーカ 105 匡体部 106 液晶ディスプレイ 107 ボタン 108 電話線 109 キーボード 110 マウス 111 コンピュータ本体 112 CRT 113 モデム 114 CD−ROMドライブ 115 フロッピーディスクドライブ 120 アンテナ 301 CPU 312 ROM 313 RAM 320 ハードディスク 701 画面 702 主語フィールド 703 目的語フィールド 704 述語フィールド 705 発音ボタン 1101 翻訳電話システム 1201 日本語ユーザ側翻訳装置 1202 受信部 1203 音声信号出力部 1301 英語ユーザ側翻訳装置 1302 受信部 1303 音声信号出力部 1401 交換機

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】音声入力を受け付ける音声入力受付部と、 終端記号と非終端記号とを含む記号により定義される第
    1言語の文法であって、形態素を終端記号とし、1つ以
    上の記号の列を非終端記号とする文法と、当該形態素
    と、当該形態素の発音と、を記憶する第1言語辞書記憶
    部と、 前記音声入力受付部により受け付けられた音声入力を、
    前記第1言語辞書記憶部に記憶された第1言語の文法
    と、当該形態素と、当該形態素の発音とを参照して音声
    認識して第1言語の形態素列を出力する音声認識部と、 前記音声認識部により出力された第1言語の形態素列を
    第2言語の形態素列に翻訳する翻訳部と、 前記翻訳部により翻訳された第2言語の形態素列を音声
    信号に変換して出力する音声信号出力部と、 を備えることを特徴とする翻訳装置。
  2. 【請求項2】前記第1言語辞書記憶部に記憶された第1
    言語の文法と、当該形態素と、当該形態素の発音と、に
    対応付けられた第2言語の文法と、当該形態素と、当該
    形態素の発音と、を記憶する第2言語辞書記憶部をさら
    に備え、 前記翻訳部は、前記第2言語辞書記憶部に記憶された第
    2言語の文法と、当該形態素と、を参照して第1言語の
    形態素列を第2言語の形態素列に翻訳し、 前記音声信号出力部は、前記第2言語辞書記憶部に記憶
    された形態素と、当該形態素の発音と、を参照して第2
    言語の形態素列を音声信号に変換して出力することを特
    徴とする請求項1に記載の翻訳装置。
  3. 【請求項3】前記音声認識部により音声認識された第1
    言語の形態素列を表示する表示部と、 前記表示部に表示された第1言語の形態素列を修正する
    修正入力を受け付ける修正入力受付部と、 をさらに備え、 前記音声認識部は、前記修正入力受付部により修正され
    た第1言語の形態素列を出力することを特徴とする請求
    項1または2に記載の翻訳装置。
  4. 【請求項4】前記音声認識部が前記音声入力受付部によ
    り入力された音声の音声認識に失敗した場合、 前記表示部は、当該音声のうち、音声認識できた部分の
    第1言語の形態素列と、音声認識できなかった部分とを
    当該音声入力の順に対応させて表示し、 前記修正入力受付部は、音声認識できなかった部分に第
    1言語の形態素列を割り当てる修正入力をも受け付ける
    ことを特徴とする請求項3に記載の翻訳装置。
  5. 【請求項5】前記音声信号出力部により出力された音声
    信号を電話回線に送信する送信部と、 電話回線から送信された音声信号を受信する受信部と、 前記受信部により受信された音声信号を音声に変換して
    出力する受信音声出力部と、 を備えることを特徴とする請求項1から4のいずれか1
    項に記載の翻訳装置。
  6. 【請求項6】請求項5に記載する翻訳装置と、 電話回線を介して、当該翻訳装置の受信部と送信部とを
    他の電話機に接続する交換部と、 を備える翻訳電話システム。
  7. 【請求項7】音声入力を受け付ける音声入力受付工程
    と、 前記音声入力受付工程にて受け付けられた音声入力を、
    あらかじめ記憶された終端記号と非終端記号とを含む記
    号により定義される第1言語の文法であって、形態素を
    終端記号とし、1つ以上の記号の列を非終端記号とする
    文法と、当該形態素と、当該形態素の発音と、を参照し
    て音声認識して第1言語の形態素列を出力する音声認識
    工程と、 前記音声認識工程にて出力された第1言語の形態素列を
    第2言語の形態素列に翻訳する翻訳工程と、 前記翻訳工程にて翻訳された第2言語の形態素列を音声
    信号に変換して出力する音声信号出力工程と、 を備えることを特徴とする翻訳方法。
  8. 【請求項8】前記音声認識工程により音声認識された第
    1言語の形態素列を表示する表示工程と、 前記表示工程にて表示された第1言語の形態素列を修正
    する修正入力を受け付ける修正入力受付工程と、 をさらに備え、 前記音声認識工程は、前記修正入力受付工程にて修正さ
    れた第1言語の形態素列を出力することを特徴とする請
    求項7に記載の翻訳方法。
  9. 【請求項9】前記音声認識工程にて、前記音声入力受付
    工程にて入力された音声の音声認識に失敗した場合、 前記表示工程にて、当該音声のうち、音声認識できた部
    分の第1言語の形態素列と、音声認識できなかった部分
    とを当該音声入力の順に対応させて表示し、 前記修正入力受付工程にて、音声認識できなかった部分
    に第1言語の形態素列を割り当てる修正入力をも受け付
    けることを特徴とする請求項8に記載の翻訳方法。
  10. 【請求項10】音声入力を受け付ける音声入力受付手順
    と、 前記受け付けられた音声入力を、あらかじめ記憶された
    終端記号と非終端記号とを含む記号により定義される第
    1言語の文法であって、形態素を終端記号とし、1つ以
    上の記号の列を非終端記号とする文法と、当該形態素
    と、当該形態素の発音と、を参照して音声認識して第1
    言語の形態素列を出力する音声認識手順と、 前記出力された第1言語の形態素列を第2言語の形態素
    列に翻訳する翻訳手順と、 前記翻訳された第2言語の形態素列を音声信号に変換し
    て出力する音声信号出力手順と、 を含む制御を実現するプログラムを記録したコンピュー
    タ読取可能な情報記録媒体。
  11. 【請求項11】前記音声認識された第1言語の形態素列
    を表示する表示手順と、 前記表示された第1言語の形態素列を修正する修正入力
    を受け付ける修正入力受付手順と、 を含む制御をさらに実現し、 前記音声認識手順は、前記修正された第1言語の形態素
    列を出力することを特徴とするプログラムを記録した請
    求項10に記載のコンピュータ読取可能な情報記録媒
    体。
  12. 【請求項12】前記音声認識手順にて、前記入力された
    音声の音声認識に失敗した場合、 前記表示手順にて、当該音声のうち、音声認識できた部
    分の第1言語の形態素列と、音声認識できなかった部分
    とを当該音声入力の順に対応させて表示し、 前記修正入力受付手順にて、音声認識できなかった部分
    に第1言語の形態素列を割り当てる修正入力をも受け付
    けることを特徴とするプログラムを記録した請求項11
    に記載のコンピュータ読取可能な情報記録媒体。
  13. 【請求項13】終端記号と非終端記号とを含む記号によ
    り定義される第1言語の文法であって、形態素を終端記
    号とし、1つ以上の記号の列を非終端記号とする文法
    と、当該形態素と、当該形態素の発音と、を含む第1言
    語辞書を記録した、翻訳装置読取可能な情報記録媒体で
    あって、 当該翻訳装置は、音声入力を受け付け、前記受け付けら
    れた音声入力を、前記情報記録媒体に記録された第1言
    語辞書をを参照して音声認識して第1言語の形態素列を
    出力し、前記出力された第1言語の形態素列を第2言語
    の形態素列に翻訳し、前記翻訳された第2言語の形態素
    列を音声信号に変換して出力することを特徴とする翻訳
    装置読取可能な情報記録媒体。
  14. 【請求項14】前記第1言語辞書に含まれる文法と、当
    該形態素と、当該形態素の発音と、に対応付けられた第
    2言語の文法と、当該形態素と、当該形態素の発音と、
    を含む第2言語辞書を記録した請求項13に記載の翻訳
    装置読取可能な情報記録媒体であって、 当該翻訳装置は、前記情報記録媒体に記憶された第2言
    語の文法と、当該形態素と、を参照して第1言語の形態
    素列を第2言語の形態素列に翻訳し、当該第2言語辞書
    に含まれる形態素と、当該形態素の発音と、を参照して
    第2言語の形態素列を音声信号に変換して出力すること
    を特徴とする翻訳装置読取可能な情報記録媒体。
  15. 【請求項15】前記情報記録媒体は、コンパクトディス
    ク、フロッピーディスク、ハードディスク、光磁気ディ
    スク、ディジタルビデオディスク、磁気テープ、また
    は、半導体メモリであることを特徴とする請求項10か
    ら14に記載の情報記録媒体。
JP11226941A 1999-08-10 1999-08-10 翻訳装置、翻訳電話システム、翻訳方法、および、情報記録媒体 Pending JP2001051999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11226941A JP2001051999A (ja) 1999-08-10 1999-08-10 翻訳装置、翻訳電話システム、翻訳方法、および、情報記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11226941A JP2001051999A (ja) 1999-08-10 1999-08-10 翻訳装置、翻訳電話システム、翻訳方法、および、情報記録媒体

Publications (1)

Publication Number Publication Date
JP2001051999A true JP2001051999A (ja) 2001-02-23

Family

ID=16853020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11226941A Pending JP2001051999A (ja) 1999-08-10 1999-08-10 翻訳装置、翻訳電話システム、翻訳方法、および、情報記録媒体

Country Status (1)

Country Link
JP (1) JP2001051999A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9830317B2 (en) 2006-03-13 2017-11-28 Newtalk, Inc. Multilingual translation device designed for childhood education

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9830317B2 (en) 2006-03-13 2017-11-28 Newtalk, Inc. Multilingual translation device designed for childhood education

Similar Documents

Publication Publication Date Title
JP3323519B2 (ja) テキスト−音声変換装置
US8290775B2 (en) Pronunciation correction of text-to-speech systems between different spoken languages
KR100378100B1 (ko) 통역 서비스 방법 및 통역 서비스 장치
KR100804855B1 (ko) 음성으로 제어되는 외국어 번역기용 방법 및 장치
US6952665B1 (en) Translating apparatus and method, and recording medium used therewith
US20080077406A1 (en) Mobile Dictation Correction User Interface
US20070016401A1 (en) Speech-to-speech translation system with user-modifiable paraphrasing grammars
US9442920B2 (en) Speech translation system, dictionary server, and program
CN100592385C (zh) 用于对多语言的姓名进行语音识别的方法和系统
JPH07129594A (ja) 自動通訳システム
JP6397641B2 (ja) 自動通訳装置及び方法
US20090055167A1 (en) Method for translation service using the cellular phone
CN111652005B (zh) 汉语与乌尔都语同步互译系统及方法
JP2001051999A (ja) 翻訳装置、翻訳電話システム、翻訳方法、および、情報記録媒体
JP3411198B2 (ja) 通訳装置及び方法並びに通訳装置制御プログラムを記憶した媒体
WO2021130892A1 (ja) 変換テーブル生成装置、音声対話システム、変換テーブル生成方法、音声対話方法および記録媒体
Watanabe et al. An automatic interpretation system for travel conversation.
JP2002288170A (ja) 多言語間コミュニケーション支援システム
KR20020054192A (ko) 외국인을 위한 전화안내 자동 통역시스템 및 방법
JP3136038B2 (ja) 通訳装置
Yamabana et al. A speech translation system with mobile wireless clients
JP2002288167A (ja) 翻訳システム
JPH02238494A (ja) 音声合成装置
JP2004354472A (ja) 音声合成端末、音声合成管理サーバおよび音声合成方法
CN118551776A (zh) 一种基于大数据的智能英语翻译系统及其使用方法