JP2007272260A

JP2007272260A - 自動翻訳装置

Info

Publication number: JP2007272260A
Application number: JP2004184713A
Authority: JP
Inventors: Hiromichi Ishibashi; 広通石橋
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2004-06-23
Filing date: 2004-06-23
Publication date: 2007-10-18
Also published as: WO2006001204A1

Abstract

【課題】騒音下の野外でも自然に近い形で自動翻訳通話が実現できるようにする。
【解決手段】第一国語で話された音声を分析し、第一の中間言語を生成する第一の音声分析モジュールと、前記第一の中間言語を前記第一国語に再変換し音声信号を生成する音声合成モジュールとを具備し、また、前記第一の中間言語を第二国語に変換する第一の翻訳モジュールと、第二国語をディスプレイに表示させる文字合成モジュールを具備する。当該装置を装着した第一国語話者に対してはオーラルに、対する第二国語話者に対してはビジュアルに会話情報が伝達され、しかもそれぞれの伝達形態において、それそれの話者が話した内容を当該話者自身が確認することができる。
【選択図】図１

Description

本発明はリアルタイムで、しかもユーザーフレンドリーに、２国語間の通訳処理を実行する自動翻訳装置に関するものである。

従来の自動翻訳装置としては、以下列記するものがある。まず特許文献１には第一国語の話者の音声を認識した後第二国語に翻訳・変換してさらに音声変換し第二国語の聞き手に伝える、またその逆を行うものが記載されている。また翻訳され第二国語を携帯電話に設けられた専用スピーカーから音声出力させる形態の発明が特許文献２に記載されている。また、音声ではなく、ディスプレイ表示で二国語間の翻訳を実行する技術が特許文献３に、さらにポータブルタイプに適した構成が特許文献４〜６に記載されている。また、音声と表示の双方を用い、ディスプレイに音声入力の確認表示がされるといった技術が特許文献７に記載されている。特に特許文献７においては、音声入力の自動翻訳を実行するにあたって、今日の技術では未だ完全に音声言語を認識することはできないことに鑑み、ある程度の”聞き取りミス”を許容するため、第一国語と第二国語を同時表示させる旨が記載されている。
特開平９−２９２９７１号公報特開平８−２６５４４５号公報特開平６−１１９３７２号公報特開平６−３２５０７２号公報特開平８−７７１７６号公報特開平９−１６０８８１号公報特開平８−２７８９７２号公報

しかしながら、前記列記した従来の構成では、実使用上問題となるところがある。まず、特許文献１に記載されている音声−音声間の翻訳実行方式の課題について説明する。この方式は一見、同時通訳者を介したかのように二カ国語間の会話が実現できるといった点で優れているが、モバイルにしかも野外で用いる場合に問題がある。すなわち、音声でもって相手に情報を伝達しようとすれば十分な音量で音声を発する必要がある。特に野外で使用する場合は周囲の雑音に十分うち勝つだけの音量が必要である。出力の十分大きいスピーカーを用いればよいという見方もあるが、機器の形状が大きくなり、しかも消費電力が増えるといったモバイル機器にとって致命的な課題が生じる。次に、特許文献２に記載されているような携帯電話の形式をとれば耳とスピーカーを接近させることができ、サイズ・電力の問題は発生しない。しかし、自分のみならず、相手方も同等の機器を持っている必要がある。その機器を会話時に一時的に相手に貸与する方法もあるが、そのまま盗難される危険性もある。

音声対話よりも、むしろディスプレイ表示、つまり文字によって相手と会話をする方式のもの（特許文献３〜７）のがモバイルでの使用下に適していると考えられる。しかし、もともと”筆談”というのは日常会話からすれば自然な形態ではなく、会話中は相手よりもその翻訳機の表示を見る方に注意が行くことから、コミュニケーションがとりにくくなるのと、やはり安全上の問題（例えば筆談に目を取られているすきにピッキングに遭う、等）が発生するおそれがある。

前記従来の課題を解決するために、本発明の請求項１の発明は、第一国語で話された音声を分析し、第一の中間言語を生成する第一の音声分析モジュールと、前記第一の中間言語を前記第一国語に再変換し音声信号を生成する音声合成モジュールとを具備し、また、前記第一の中間言語を第二国語に変換する第一の翻訳モジュールと、第二国語をディスプレイに表示させる文字合成モジュールを具備したことを特徴とし、また、請求項２の発明は、第二国語で話された音声を分析し、第二の中間言語を生成する第二の音声分析モジュールを具備し、前記第二の中間言語は文字合成モジュールを介してディスプレイに表示されることを特徴とし、さらに前記第二の中間言語を第一国語に変換する第二の翻訳モジュールを具備し、前記第二の翻訳モジュールの出力は音声合成モジュールに供給され、これより音声信号が生成されることを特徴とした。

本構成によって、当該装置を装着した第一国語（日本語）話者に対してはオーラルに、対する第二国語（英語）話者に対してはビジュアルに会話情報が伝達され、しかもそれぞれの伝達形態において、それそれの話者が話した内容を当該話者自身が確認することができる。

本発明の自動翻訳装置によれば、モバイルに適した、しかもより自然な形で、二国語間の会話を実現することができる。

以下本発明の実施の形態について、図面を参照しながら説明する。

（実施の形態１）
図１は、本発明の実施の形態１における自動翻訳装置のブロック図、図２はその一部の外観図である。図１において、第一国語（以下、日本語）話者の音声はマイク１によって電気信号に変換され、音声分析モジュール２に供給される、音声分析モジュール２は前記音声を認識し、（第一の）中間言語Ｃ１を生成する。ここで中間言語とは、単語の意味と構文上の属性（すなわち動詞、名詞、形容詞の分類および接続関係）が明らかになったデータ列と意味する。例えば日本語話者が図２に示すようにマイク１に向かって「おおきに」と音声を発した場合、図３に示すように、この電気信号列が（日本語）辞書２０に基づいて音声分析モジュール２によって分析された結果、感謝を意味する符号（図３では”ＣＦ５Ａ８８Ｄｈ”）が生成される。

この中間言語は翻訳モジュール４によって第二国語（英語）に変換されると同時に、音声合成モジュール３に供給され、再度音声に変換される。日本語話者は図２に示すように、この再合成された音声を耳に近接して装着したスピーカーから聞くことになる。音声合成モジュール３は感謝の意味を持つ符号を、辞書２０を用いて日本語に変換する。ここで話言葉と中間言語は必ずしも１：１に対応しているわけではない。たとえば、「ありがとう」も「おおきに」も「だんだん」も（辞書２０に登録されていれば）感謝の意と表す同一の中間言語”ＣＦ５Ａ８８Ｄｈ”に変換されてもよい。逆に、共通の中間言語Ｃ１から日本語に変換する場合、どの日本語を選択するのかが問題となるが、標準語の「ありがとう」を選択すれば、少なくとも日本語話者にはその意味が通じる。

このように、一旦音声認識・中間言語生成された符号を再度日本語に変換したもの「ありがとう」を日本語話者が”聞く”ことによって、自分が発した言葉が正しく認識されたことを知ることができる。

中間言語Ｃ１は翻訳モジュール４によって第二国語（英語）の中間言語Ｃ２に翻訳される。日本語と英語とでは文法体系が異なるので、中間言語の構造体（修飾、接続関係など）を所定の規則に基づいて変換する必要がある。翻訳された中間言語Ｃ２は辞書８０に基づいて文字合成モジュール５によって文書化され、ディスプレイ６に表示される。本実施の携帯の場合、感謝の意を表す「Ｔｈａｎｋｙｏｕ」に翻訳される。ディスプレイ６は図２に示すように、第二国語（英語）話者が自然な目線で判読できるように、第一国語（日本語）話者の胸から方のあたりに装着されるようにするのがよい。図２の配置では日本語話者はディスプレイ６を（自然な格好で）見ることはできないが、既に、自分の話言葉が正確に意味認識されたことをスピーカー１１からの音声で把握できているので、後は、その中間言語が機械的に英語に翻訳されるものと思っていればよい。仮にディスプレイ６の表示が読めたところで、第二国語が自分が全く理解できない言語であった場合は全く用をなさない。なおディスプレイ６の具体的構成として低電力タイプの反射型液晶素子、若しくは電気泳動素子などを用いてもよい。

一方英語話者は本実施形態におけるマイク７に向かって音声を発する（「Ｙｏｕａｒｅｗｅｌｃｏｍｅ」）。電気信号に変換された英語の音声は辞書８０に基づいて音声分析（８）され、中間言語Ｃ２（”ＦＡＣ６５３Ｂ０ｈ”）が生成される（図４）。この中間言語は文字合成モジュール５によって文書化され、ディスプレイ６に表示される。この表示によって英語話者は自分の話した言葉が認識されたことを確認することができる。

さらに中間言語Ｃ２は翻訳モジュール１０によって日本語中間言語に翻訳され、音声合成モジュール３に送られる。その結果スピーカー１１からは「どういたしまして」という音声が発せられる。

以上、本実施の形態によれば、モバイルに適した構成で、より自然な形で二国語間の自動翻訳を実行することができる。つまり、日本語話者は認識された自己の言葉と、日本語に翻訳された英語話者の言葉を、スピーカー１１からリアルタイムで聞くことができる。ここで「スピーカー」とあるのは、いわゆるイヤホンのようなものであってもよい。また、英語話者は、認識された自己の言葉と、英語に翻訳された日本語話者の言葉をディスプレイ６の表示として見ることができる。これは野外の騒音下においても可能である。

なお、図１において９および１２はセレクタであり、自己の音声情報を通すか相手話者の音声を通すか決定付けるものである。具体的には（図示していないが）マイクロプロセッサーによって制御され、例えば、マイク１からの音声入力をマイク２からの音声入力の振幅の大小に応じて、切り替えるものであってもよい。

（実施の形態２）
図５は、本発明の実施の形態２の自動翻訳装置ブロック図である。図５において、図１と同じ構成要素については同じ符号を用い、説明を省略する。図５において、５１は音声合成モジュールであり翻訳モジュール４によって英語に翻訳された中間言語のみ音声信号に変換するものである。この音声信号は図５に示されるようにディスプレイ６の近くに設けられたスピーカー６１によって音声化される。以上の動作により英語話者は日本語話者の話言葉の翻訳をディスプレイを介して目視することもでき（比較的静かな環境下であれば）スピーカー６からの音声として聞くこともでき、合わせて、より確度の高い会話を実現することが可能となる。

ここで、本実施の形態ではスピーカー６１はディスプレイ６近傍に別途設ける構成にしたが、透明圧電スピーカーをディスプレイ表示面に貼り付けたものであってもよい。

本発明にかかる自動翻訳装置は、日本語話者に対してはオーラルに、対する英語話者に対してはビジュアルに会話情報を伝達する機能を有し、モバイル用電子通訳機等として、特に海外旅行中の使用する際に有用である。また国際会議等の用途にも応用できる。

本発明の実施の形態１における自動翻訳装置のブロック図本発明の実施の形態１における自動翻訳装置の一部外観図同実施の形態の動作説明のためのフローチャート同実施の形態の動作説明のためのフローチャート本発明の実施の形態２における自動翻訳装置のブロック図本発明の実施の形態２における自動翻訳装置の一部外観図

符号の説明

１，７マイク
２，８音声分析モジュール
３音声合成モジュール
４，１０翻訳モジュール
５文字合成モジュール
６ディスプレイ
１１スピーカー
２０，８０辞書
９，１２セレクタ

Claims

第一国語で話された音声を分析し、第一の中間言語を生成する第一の音声分析モジュールと、前記第一の中間言語を前記第一国語に再変換し音声信号を生成する音声合成モジュールとを具備し、
また、前記第一の中間言語を第二国語に変換する第一の翻訳モジュールと、第二国語をディスプレイに表示させる文字合成モジュールを具備したことを特徴とする自動翻訳装置。
第二国語で話された音声を分析し、第二の中間言語を生成する第二の音声分析モジュールを具備し、前記第二の中間言語は文字合成モジュールを介してディスプレイに表示されることを特徴とし、さらに前記第二の中間言語を第一国語に変換する第二の翻訳モジュールを具備し、前記第二の翻訳モジュールの出力は音声合成モジュールに供給され、これより音声信号が生成されることを特徴とする自動翻訳装置。
第一国語で話された音声を分析し、第一の中間言語を生成する第一の音声分析モジュールと、前記第一の中間言語を前記第一国語に再変換し音声信号を生成する音声合成モジュールとを具備し、
また、前記第一の中間言語を第二国語に変換する第一の翻訳モジュールと、第二国語をディスプレイに表示させる文字合成モジュールを具備したことを特徴とし、さらに、第二国語で話された音声を分析し、第二の中間言語を生成する第二の音声分析モジュールを具備し、前記第二の中間言語は文字合成モジュールを介してディスプレイに表示されることを特徴とし、さらに前記第二の中間言語を第一国語に変換する第二の翻訳モジュールを具備し、前記第二の翻訳モジュールの出力は音声合成モジュールに供給され、これより音声信号が生成されることを特徴とする自動翻訳装置。
第１の翻訳モジュールの出力から音声信号を生成する第二の音声合成モジュールをさらに備えたことを特徴とする自動翻訳装置。