JP2007272260A - 自動翻訳装置 - Google Patents

自動翻訳装置 Download PDF

Info

Publication number
JP2007272260A
JP2007272260A JP2004184713A JP2004184713A JP2007272260A JP 2007272260 A JP2007272260 A JP 2007272260A JP 2004184713 A JP2004184713 A JP 2004184713A JP 2004184713 A JP2004184713 A JP 2004184713A JP 2007272260 A JP2007272260 A JP 2007272260A
Authority
JP
Japan
Prior art keywords
language
speech
module
intermediate language
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004184713A
Other languages
English (en)
Inventor
Hiromichi Ishibashi
広通 石橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2004184713A priority Critical patent/JP2007272260A/ja
Priority to PCT/JP2005/010946 priority patent/WO2006001204A1/ja
Publication of JP2007272260A publication Critical patent/JP2007272260A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

【課題】騒音下の野外でも自然に近い形で自動翻訳通話が実現できるようにする。
【解決手段】第一国語で話された音声を分析し、第一の中間言語を生成する第一の音声分析モジュールと、前記第一の中間言語を前記第一国語に再変換し音声信号を生成する音声合成モジュールとを具備し、また、前記第一の中間言語を第二国語に変換する第一の翻訳モジュールと、第二国語をディスプレイに表示させる文字合成モジュールを具備する。当該装置を装着した第一国語話者に対してはオーラルに、対する第二国語話者に対してはビジュアルに会話情報が伝達され、しかもそれぞれの伝達形態において、それそれの話者が話した内容を当該話者自身が確認することができる。
【選択図】図1

Description

本発明はリアルタイムで、しかもユーザーフレンドリーに、2国語間の通訳処理を実行する自動翻訳装置に関するものである。
従来の自動翻訳装置としては、以下列記するものがある。まず特許文献1には第一国語の話者の音声を認識した後第二国語に翻訳・変換してさらに音声変換し第二国語の聞き手に伝える、またその逆を行うものが記載されている。また翻訳され第二国語を携帯電話に設けられた専用スピーカーから音声出力させる形態の発明が特許文献2に記載されている。また、音声ではなく、ディスプレイ表示で二国語間の翻訳を実行する技術が特許文献3に、さらにポータブルタイプに適した構成が特許文献4〜6に記載されている。また、音声と表示の双方を用い、ディスプレイに音声入力の確認表示がされるといった技術が特許文献7に記載されている。特に特許文献7においては、音声入力の自動翻訳を実行するにあたって、今日の技術では未だ完全に音声言語を認識することはできないことに鑑み、ある程度の”聞き取りミス”を許容するため、第一国語と第二国語を同時表示させる旨が記載されている。
特開平9−292971号公報 特開平8−265445号公報 特開平6−119372号公報 特開平6−325072号公報 特開平8−77176号公報 特開平9−160881号公報 特開平8−278972号公報
しかしながら、前記列記した従来の構成では、実使用上問題となるところがある。まず、特許文献1に記載されている音声−音声間の翻訳実行方式の課題について説明する。この方式は一見、同時通訳者を介したかのように二カ国語間の会話が実現できるといった点で優れているが、モバイルにしかも野外で用いる場合に問題がある。すなわち、音声でもって相手に情報を伝達しようとすれば十分な音量で音声を発する必要がある。特に野外で使用する場合は周囲の雑音に十分うち勝つだけの音量が必要である。出力の十分大きいスピーカーを用いればよいという見方もあるが、機器の形状が大きくなり、しかも消費電力が増えるといったモバイル機器にとって致命的な課題が生じる。次に、特許文献2に記載されているような携帯電話の形式をとれば耳とスピーカーを接近させることができ、サイズ・電力の問題は発生しない。しかし、自分のみならず、相手方も同等の機器を持っている必要がある。その機器を会話時に一時的に相手に貸与する方法もあるが、そのまま盗難される危険性もある。
音声対話よりも、むしろディスプレイ表示、つまり文字によって相手と会話をする方式のもの(特許文献3〜7)のがモバイルでの使用下に適していると考えられる。しかし、もともと”筆談”というのは日常会話からすれば自然な形態ではなく、会話中は相手よりもその翻訳機の表示を見る方に注意が行くことから、コミュニケーションがとりにくくなるのと、やはり安全上の問題(例えば筆談に目を取られているすきにピッキングに遭う、等)が発生するおそれがある。
前記従来の課題を解決するために、本発明の請求項1の発明は、第一国語で話された音声を分析し、第一の中間言語を生成する第一の音声分析モジュールと、前記第一の中間言語を前記第一国語に再変換し音声信号を生成する音声合成モジュールとを具備し、また、前記第一の中間言語を第二国語に変換する第一の翻訳モジュールと、第二国語をディスプレイに表示させる文字合成モジュールを具備したことを特徴とし、また、請求項2の発明は、第二国語で話された音声を分析し、第二の中間言語を生成する第二の音声分析モジュールを具備し、前記第二の中間言語は文字合成モジュールを介してディスプレイに表示されることを特徴とし、さらに前記第二の中間言語を第一国語に変換する第二の翻訳モジュールを具備し、前記第二の翻訳モジュールの出力は音声合成モジュールに供給され、これより音声信号が生成されることを特徴とした。
本構成によって、当該装置を装着した第一国語(日本語)話者に対してはオーラルに、対する第二国語(英語)話者に対してはビジュアルに会話情報が伝達され、しかもそれぞれの伝達形態において、それそれの話者が話した内容を当該話者自身が確認することができる。
本発明の自動翻訳装置によれば、モバイルに適した、しかもより自然な形で、二国語間の会話を実現することができる。
以下本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
図1は、本発明の実施の形態1における自動翻訳装置のブロック図、図2はその一部の外観図である。図1において、第一国語(以下、日本語)話者の音声はマイク1によって電気信号に変換され、音声分析モジュール2に供給される、音声分析モジュール2は前記音声を認識し、(第一の)中間言語C1を生成する。ここで中間言語とは、単語の意味と構文上の属性(すなわち動詞、名詞、形容詞の分類および接続関係)が明らかになったデータ列と意味する。例えば日本語話者が図2に示すようにマイク1に向かって「おおきに」と音声を発した場合、図3に示すように、この電気信号列が(日本語)辞書20に基づいて音声分析モジュール2によって分析された結果、感謝を意味する符号(図3では”CF5A88Dh”)が生成される。
この中間言語は翻訳モジュール4によって第二国語(英語)に変換されると同時に、音声合成モジュール3に供給され、再度音声に変換される。日本語話者は図2に示すように、この再合成された音声を耳に近接して装着したスピーカーから聞くことになる。音声合成モジュール3は感謝の意味を持つ符号を、辞書20を用いて日本語に変換する。ここで話言葉と中間言語は必ずしも1:1に対応しているわけではない。たとえば、「ありがとう」も「おおきに」も「だんだん」も(辞書20に登録されていれば)感謝の意と表す同一の中間言語”CF5A88Dh”に変換されてもよい。逆に、共通の中間言語C1から日本語に変換する場合、どの日本語を選択するのかが問題となるが、標準語の「ありがとう」を選択すれば、少なくとも日本語話者にはその意味が通じる。
このように、一旦音声認識・中間言語生成された符号を再度日本語に変換したもの「ありがとう」を日本語話者が”聞く”ことによって、自分が発した言葉が正しく認識されたことを知ることができる。
中間言語C1は翻訳モジュール4によって第二国語(英語)の中間言語C2に翻訳される。日本語と英語とでは文法体系が異なるので、中間言語の構造体(修飾、接続関係など)を所定の規則に基づいて変換する必要がある。翻訳された中間言語C2は辞書80に基づいて文字合成モジュール5によって文書化され、ディスプレイ6に表示される。本実施の携帯の場合、感謝の意を表す「Thank you」に翻訳される。ディスプレイ6は図2に示すように、第二国語(英語)話者が自然な目線で判読できるように、第一国語(日本語)話者の胸から方のあたりに装着されるようにするのがよい。図2の配置では日本語話者はディスプレイ6を(自然な格好で)見ることはできないが、既に、自分の話言葉が正確に意味認識されたことをスピーカー11からの音声で把握できているので、後は、その中間言語が機械的に英語に翻訳されるものと思っていればよい。仮にディスプレイ6の表示が読めたところで、第二国語が自分が全く理解できない言語であった場合は全く用をなさない。なおディスプレイ6の具体的構成として低電力タイプの反射型液晶素子、若しくは電気泳動素子などを用いてもよい。
一方英語話者は本実施形態におけるマイク7に向かって音声を発する(「You are welcome」)。電気信号に変換された英語の音声は辞書80に基づいて音声分析(8)され、中間言語C2(”FAC653B0h”)が生成される(図4)。この中間言語は文字合成モジュール5によって文書化され、ディスプレイ6に表示される。この表示によって英語話者は自分の話した言葉が認識されたことを確認することができる。
さらに中間言語C2は翻訳モジュール10によって日本語中間言語に翻訳され、音声合成モジュール3に送られる。その結果スピーカー11からは「どういたしまして」という音声が発せられる。
以上、本実施の形態によれば、モバイルに適した構成で、より自然な形で二国語間の自動翻訳を実行することができる。つまり、日本語話者は認識された自己の言葉と、日本語に翻訳された英語話者の言葉を、スピーカー11からリアルタイムで聞くことができる。ここで「スピーカー」とあるのは、いわゆるイヤホンのようなものであってもよい。また、英語話者は、認識された自己の言葉と、英語に翻訳された日本語話者の言葉をディスプレイ6の表示として見ることができる。これは野外の騒音下においても可能である。
なお、図1において9および12はセレクタであり、自己の音声情報を通すか相手話者の音声を通すか決定付けるものである。具体的には(図示していないが)マイクロプロセッサーによって制御され、例えば、マイク1からの音声入力をマイク2からの音声入力の振幅の大小に応じて、切り替えるものであってもよい。
(実施の形態2)
図5は、本発明の実施の形態2の自動翻訳装置ブロック図である。図5において、図1と同じ構成要素については同じ符号を用い、説明を省略する。図5において、51は音声合成モジュールであり翻訳モジュール4によって英語に翻訳された中間言語のみ音声信号に変換するものである。この音声信号は図5に示されるようにディスプレイ6の近くに設けられたスピーカー61によって音声化される。以上の動作により英語話者は日本語話者の話言葉の翻訳をディスプレイを介して目視することもでき(比較的静かな環境下であれば)スピーカー6からの音声として聞くこともでき、合わせて、より確度の高い会話を実現することが可能となる。
ここで、本実施の形態ではスピーカー61はディスプレイ6近傍に別途設ける構成にしたが、透明圧電スピーカーをディスプレイ表示面に貼り付けたものであってもよい。
本発明にかかる自動翻訳装置は、日本語話者に対してはオーラルに、対する英語話者に対してはビジュアルに会話情報を伝達する機能を有し、モバイル用電子通訳機等として、特に海外旅行中の使用する際に有用である。また国際会議等の用途にも応用できる。
本発明の実施の形態1における自動翻訳装置のブロック図 本発明の実施の形態1における自動翻訳装置の一部外観図 同実施の形態の動作説明のためのフローチャート 同実施の形態の動作説明のためのフローチャート 本発明の実施の形態2における自動翻訳装置のブロック図 本発明の実施の形態2における自動翻訳装置の一部外観図
符号の説明
1,7 マイク
2,8 音声分析モジュール
3 音声合成モジュール
4,10 翻訳モジュール
5 文字合成モジュール
6 ディスプレイ
11 スピーカー
20,80 辞書
9,12 セレクタ

Claims (4)

  1. 第一国語で話された音声を分析し、第一の中間言語を生成する第一の音声分析モジュールと、前記第一の中間言語を前記第一国語に再変換し音声信号を生成する音声合成モジュールとを具備し、
    また、前記第一の中間言語を第二国語に変換する第一の翻訳モジュールと、第二国語をディスプレイに表示させる文字合成モジュールを具備したことを特徴とする自動翻訳装置。
  2. 第二国語で話された音声を分析し、第二の中間言語を生成する第二の音声分析モジュールを具備し、前記第二の中間言語は文字合成モジュールを介してディスプレイに表示されることを特徴とし、さらに前記第二の中間言語を第一国語に変換する第二の翻訳モジュールを具備し、前記第二の翻訳モジュールの出力は音声合成モジュールに供給され、これより音声信号が生成されることを特徴とする自動翻訳装置。
  3. 第一国語で話された音声を分析し、第一の中間言語を生成する第一の音声分析モジュールと、前記第一の中間言語を前記第一国語に再変換し音声信号を生成する音声合成モジュールとを具備し、
    また、前記第一の中間言語を第二国語に変換する第一の翻訳モジュールと、第二国語をディスプレイに表示させる文字合成モジュールを具備したことを特徴とし、さらに、第二国語で話された音声を分析し、第二の中間言語を生成する第二の音声分析モジュールを具備し、前記第二の中間言語は文字合成モジュールを介してディスプレイに表示されることを特徴とし、さらに前記第二の中間言語を第一国語に変換する第二の翻訳モジュールを具備し、前記第二の翻訳モジュールの出力は音声合成モジュールに供給され、これより音声信号が生成されることを特徴とする自動翻訳装置。
  4. 第1の翻訳モジュールの出力から音声信号を生成する第二の音声合成モジュールをさらに備えたことを特徴とする自動翻訳装置。
JP2004184713A 2004-06-23 2004-06-23 自動翻訳装置 Pending JP2007272260A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004184713A JP2007272260A (ja) 2004-06-23 2004-06-23 自動翻訳装置
PCT/JP2005/010946 WO2006001204A1 (ja) 2004-06-23 2005-06-15 自動翻訳装置及び自動翻訳方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004184713A JP2007272260A (ja) 2004-06-23 2004-06-23 自動翻訳装置

Publications (1)

Publication Number Publication Date
JP2007272260A true JP2007272260A (ja) 2007-10-18

Family

ID=35781706

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004184713A Pending JP2007272260A (ja) 2004-06-23 2004-06-23 自動翻訳装置

Country Status (2)

Country Link
JP (1) JP2007272260A (ja)
WO (1) WO2006001204A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10152476B2 (en) 2015-03-19 2018-12-11 Panasonic Intellectual Property Management Co., Ltd. Wearable device and translation system
US10872605B2 (en) 2016-07-08 2020-12-22 Panasonic Intellectual Property Management Co., Ltd. Translation device

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109344411A (zh) * 2018-09-19 2019-02-15 深圳市合言信息科技有限公司 一种自动侦听式同声传译的翻译方法
US20210319189A1 (en) * 2020-04-08 2021-10-14 Rajiv Trehan Multilingual concierge systems and method thereof

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04319769A (ja) * 1991-04-18 1992-11-10 Toshiba Corp 通訳システム
JPH06348751A (ja) * 1992-11-09 1994-12-22 Ricoh Co Ltd 言語変換装置
JPH1021241A (ja) * 1996-07-03 1998-01-23 Sony Corp 意思伝達方法及び意思伝達システム
JP3974412B2 (ja) * 2001-01-24 2007-09-12 松下電器産業株式会社 音声変換装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10152476B2 (en) 2015-03-19 2018-12-11 Panasonic Intellectual Property Management Co., Ltd. Wearable device and translation system
US10872605B2 (en) 2016-07-08 2020-12-22 Panasonic Intellectual Property Management Co., Ltd. Translation device

Also Published As

Publication number Publication date
WO2006001204A1 (ja) 2006-01-05

Similar Documents

Publication Publication Date Title
US9111545B2 (en) Hand-held communication aid for individuals with auditory, speech and visual impairments
US20140171036A1 (en) Method of communication
US8411824B2 (en) Methods and systems for a sign language graphical interpreter
US20040143430A1 (en) Universal processing system and methods for production of outputs accessible by people with disabilities
US20050192811A1 (en) Portable translation device
WO2007124109A3 (en) Interactive conversational speech communicator method and system
US20200125643A1 (en) Mobile translation application and method
US20020198716A1 (en) System and method of improved communication
Dhanjal et al. Tools and techniques of assistive technology for hearing impaired people
TWI695281B (zh) 翻譯系統、翻譯方法、以及翻譯裝置
US20110116608A1 (en) Method of providing two-way communication between a deaf person and a hearing person
JP2007272260A (ja) 自動翻訳装置
KR101151865B1 (ko) 청각장애인용 휴대용 대화 장치
JP2004015478A (ja) 音声通信端末装置
US20040012643A1 (en) Systems and methods for visually communicating the meaning of information to the hearing impaired
Brookes Speech-to-text systems for deaf, deafened and hard-of-hearing people
KR20150060348A (ko) 장애인 사이의 의사소통 장치 및 방법
JP2020119043A (ja) 音声翻訳システムおよび音声翻訳方法
JP2002027039A (ja) 通信通訳システム
KR100807778B1 (ko) 학습 보조 장치
KR20070122329A (ko) 청각장애우를 위한 통화 음성 문자 변환장치
JPH10224520A (ja) マルチメディア公衆電話システム
AU2020103854A4 (en) Method and system for assisting communication for deaf persons
KR101922615B1 (ko) 외국어 발음 표시 방법 및 장치
Staš et al. Hear IT–A Mobile Assistive Technology for Hearing Impaired People in Slovak