JP2000148176A - 情報処理装置および方法、提供媒体、音声認識システム、音声合成システム、翻訳装置および方法、並びに翻訳システム - Google Patents

情報処理装置および方法、提供媒体、音声認識システム、音声合成システム、翻訳装置および方法、並びに翻訳システム

Info

Publication number
JP2000148176A
JP2000148176A JP10328072A JP32807298A JP2000148176A JP 2000148176 A JP2000148176 A JP 2000148176A JP 10328072 A JP10328072 A JP 10328072A JP 32807298 A JP32807298 A JP 32807298A JP 2000148176 A JP2000148176 A JP 2000148176A
Authority
JP
Japan
Prior art keywords
information
user
language used
language
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10328072A
Other languages
English (en)
Other versions
JP2000148176A5 (ja
Inventor
Koji Asano
康治 浅野
Hiroaki Ogawa
浩明 小川
Masato Shimakawa
真人 島川
Osamu Hamada
修 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP10328072A priority Critical patent/JP2000148176A/ja
Publication of JP2000148176A publication Critical patent/JP2000148176A/ja
Publication of JP2000148176A5 publication Critical patent/JP2000148176A5/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 迅速かつ確実に、ユーザが使用する言語を翻
訳することができる。 【解決手段】 UIMコントローラ19は、記憶媒体から使
用言語の情報を読み出す。RAM14は、音声認識に必要
なデータを記憶する。CPU13は、使用言語の情報に基
づき、使用言語の音声認識に必要なデータを選択する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理装置およ
び方法、提供媒体、音声認識システム、音声合成システ
ム、翻訳装置および方法、並びに翻訳システムに関し、
特に、音声認識、音声合成、または翻訳する対象となる
言語を切り換える情報処理装置および方法、提供媒体、
音声認識システム、音声合成システム、翻訳装置および
方法、並びに翻訳システムに関する。
【0002】
【従来の技術】近年、携帯電話などの携帯性が重視され
た通信端末が広く使用され、携帯性の向上の為、通信端
末の軽量化および小型化が盛んに進められている。通信
端末の小型化に伴い、キーボード、LCD(Liquid Crys
tal Display)などの入出力デバイスも小型化が進めら
れ、これらの入出力デバイスを使用しないことによる、
更なる通信端末の小型化も検討されている。
【0003】このキーボードに代わる入力方法として音
声認識が、LCDに代わる出力方法として音声合成が、
それぞれ注目されている。音声認識の処理および音声合
成の処理は、いずれも通信端末が、その処理の全てを実
行することも可能であるが、ネットワークを介して接続
されているサーバに、その処理の一部または全部を実行
させることも可能である。
【0004】一方、通信端末を用いた音声翻訳電話の研
究も進められている。一般に、音声翻訳は、原言語(翻
訳する前の言語、例えば、日本語)の音声を認識する音
声認識処理、原言語から目的言語(翻訳した後の言語、
例えば、英語)に変換する機械翻訳処理、および目的言
語の文の音声を出力する音声合成処理を組み合わせて実
現される。
【0005】
【発明が解決しようとする課題】ある特定の1つの言語
しか利用できない通信端末は、小型軽量化が可能である
が、ユーザが通常使用している言語が利用できるとは限
らない。逆に、複数の言語を利用できる通信端末は、複
数の言語を処理する為、大量のデータおよびプログラム
を記憶しなければならず、小型軽量化することが困難と
なる。また、複数の言語を処理できる通信端末は、出荷
前にどの言語に設定するかの作業が必要となり、ユーザ
が実際に使用する言語に再度設定しなければならず、複
数の言語でのマニュアルへの記載、および通信端末に切
り換えスイッチの取り付けなどが必要となり、操作も面
倒である。
【0006】更に、音声翻訳では、通話相手によって、
翻訳の目的言語を変更しなければならない。通話相手
を、よく知っているならば、翻訳の目的言語は選択でき
るが、よく知らない通話相手では、共通して使用できる
言語があるとは限らず、翻訳の目的言語は、常に適当な
目的言語が選択されるとは限らない。
【0007】ネットワークを介して接続されているサー
バに、翻訳の処理の一部または全部を実行させていると
きは、サーバの処理も切り換えなければならず、操作が
面倒で、時間がかかる。
【0008】本発明はこのような状況に鑑みてなされた
ものであり、迅速かつ確実に、ユーザが使用する言語を
翻訳することができるようにすることを目的とする。
【0009】
【課題を解決するための手段】請求項1に記載の情報処
理装置は、記憶媒体から使用言語の情報を読み出す読み
出し手段と、音声認識に必要なデータを記憶する記憶手
段と、使用言語の情報に基づき、使用言語の音声認識に
必要なデータを選択する選択手段とを備えることを特徴
とする。
【0010】請求項4に記載の情報処理方法は、記憶媒
体から使用言語の情報を読み出す読み出しステップと、
音声認識に必要なデータを記憶する記憶ステップと、使
用言語の情報に基づき、使用言語の音声認識に必要なデ
ータを選択する選択ステップとを含むことを特徴とす
る。
【0011】請求項5に記載の提供媒体は、情報処理装
置に、記憶媒体から使用言語の情報を読み出す読み出し
ステップと、音声認識に必要なデータを記憶する記憶ス
テップと、使用言語の情報に基づき、使用言語の音声認
識に必要なデータを選択する選択ステップとを含む処理
を実行させるコンピュータが読み取り可能なプログラム
を提供することを特徴とする。
【0012】請求項6に記載の音声認識システムは、情
報処理装置が、記憶媒体から使用言語の情報を読み出す
読み出し手段と、使用言語の情報を音声認識装置に送信
する送信手段とを備え、音声認識装置が、情報処理装置
が送信した使用言語の情報を受信する受信手段と、音声
認識に必要なデータを記憶する記憶手段と、使用言語の
情報に基づき、使用言語の音声認識に必要なデータを選
択する選択手段とを備えることを特徴とする。
【0013】請求項10に記載の情報処理装置は、記憶
媒体から使用言語の情報を読み出す読み出し手段と、音
声合成に必要なデータを記憶する記憶手段と、使用言語
の情報に基づき、使用言語の音声合成に必要なデータを
選択する選択手段とを備えることを特徴とする。
【0014】請求項13に記載の情報処理方法は、記憶
媒体から使用言語の情報を読み出す読み出しステップ
と、音声合成に必要なデータを記憶する記憶ステップ
と、使用言語の情報に基づき、使用言語の音声合成に必
要なデータを選択する選択ステップとを含むことを特徴
とする。
【0015】請求項14に記載の提供媒体は、情報処理
装置に、記憶媒体から使用言語の情報を読み出す読み出
しステップと、音声合成に必要なデータを記憶する記憶
ステップと、使用言語の情報に基づき、使用言語の音声
合成に必要なデータを選択する選択ステップとを含む処
理を実行させるコンピュータが読み取り可能なプログラ
ムを提供することを特徴とする。
【0016】請求項15に記載の音声合成システムは、
情報処理装置が、記憶媒体から使用言語の情報を読み出
す読み出し手段と、使用言語の情報を音声合成装置に送
信する送信手段とを備え、音声合成装置が、情報処理装
置が送信した使用言語の情報を受信する受信手段と、音
声合成に必要なデータを記憶する記憶手段と、使用言語
の情報に基づき、使用言語の音声合成に必要なデータを
選択する選択手段とを備えることを特徴とする。
【0017】請求項18に記載の翻訳装置は、記憶媒体
から使用言語の情報を読み出す読み出し手段と、翻訳に
必要なデータを記憶する記憶手段と、使用言語の情報に
基づき、ユーザが入力した文の翻訳に必要なデータを選
択する選択手段とを備えることを特徴とする。
【0018】請求項21に記載の翻訳方法は、記憶媒体
から使用言語の情報を読み出す読み出しステップと、翻
訳に必要なデータを記憶する記憶ステップと、使用言語
の情報に基づき、ユーザが入力した文の翻訳に必要なデ
ータを選択する選択ステップとを含むことを特徴とす
る。
【0019】請求項22に記載の提供媒体は、翻訳装置
に、記憶媒体から使用言語の情報を読み出す読み出しス
テップと、翻訳に必要なデータを記憶する記憶ステップ
と、使用言語の情報に基づき、ユーザが入力した文の翻
訳に必要なデータを選択する選択ステップとを含む処理
を実行させるコンピュータが読み取り可能なプログラム
を提供することを特徴とする。
【0020】請求項23に記載の翻訳システムは、情報
処理装置が、第2の記憶媒体から第2のユーザの使用言
語の情報を読み出す第2の読み出し手段と、第2のユー
ザの使用言語の情報を翻訳装置に送信する第1の送信手
段とを備え、翻訳装置が、第1の記憶媒体から第1のユ
ーザの使用言語の情報を読み出す第1の読み出し手段
と、第2のユーザの使用言語の情報を受信する受信手段
と、翻訳に必要なデータを記憶する記憶手段と、第1の
ユーザの使用言語の情報および第2のユーザの使用言語
の情報に基づき、第1のユーザの使用言語から第2のユ
ーザの使用言語への翻訳に必要なデータを選択する選択
手段とを備えることを特徴とする。
【0021】請求項26に記載の翻訳システムは、第1
の情報処理装置が、第1の記憶媒体から第1のユーザの
使用言語の情報を読み出す第1の読み出し手段と、第1
のユーザの使用言語の情報を翻訳装置に送信する第1の
送信手段とを備え、第2の情報処理装置が、第2の記憶
媒体から第2のユーザの使用言語の情報を読み出す第2
の読み出し手段と、第2のユーザの使用言語の情報を翻
訳装置に送信する第2の送信手段とを備え、翻訳装置
が、第1のユーザの使用言語の情報および第2のユーザ
の使用言語の情報を受信する受信手段と、翻訳に必要な
データを記憶する記憶手段と、第1のユーザの使用言語
の情報および第2のユーザの使用言語の情報に基づき、
第1のユーザの使用言語から第2のユーザの使用言語へ
の翻訳に必要なデータを選択する選択手段とを備えるこ
とを特徴とする。
【0022】請求項1に記載の情報処理装置、請求項4
に記載の情報処理方法、および請求項5に記載の提供媒
体においては、記憶媒体から使用言語の情報を読み出
し、音声認識に必要なデータを記憶し、使用言語の情報
に基づき、使用言語の音声認識に必要なデータを選択す
る。
【0023】請求項6に記載の音声認識システムにおい
ては、情報処理装置が、記憶媒体から使用言語の情報を
読み出すし、使用言語の情報を音声認識装置に送信し、
音声認識装置が、情報処理装置が送信した使用言語の情
報を受信し、音声認識に必要なデータを記憶し、使用言
語の情報に基づき、使用言語の音声認識に必要なデータ
を選択する。
【0024】請求項10に記載の情報処理装置、請求項
13に記載の情報処理方法、および請求項14に記載の
提供媒体においては、記憶媒体から使用言語の情報を読
み出し、音声合成に必要なデータを記憶し、使用言語の
情報に基づき、使用言語の音声合成に必要なデータを選
択する。
【0025】請求項15に記載の音声合成システムにお
いては、情報処理装置が、記憶媒体から使用言語の情報
を読み出し、使用言語の情報を音声合成装置に送信し、
音声合成装置が、情報処理装置が送信した使用言語の情
報を受信し、音声合成に必要なデータを記憶し、使用言
語の情報に基づき、使用言語の音声合成に必要なデータ
を選択する。
【0026】請求項18に記載の翻訳装置、請求項21
に記載の翻訳方法、および請求項22に記載の提供媒体
においては、記憶媒体から使用言語の情報を読み出し、
翻訳に必要なデータを記憶し、使用言語の情報に基づ
き、ユーザが入力した文の翻訳に必要なデータを選択す
る。
【0027】請求項23に記載の翻訳システムにおいて
は、情報処理装置が、第2の記憶媒体から第2のユーザ
の使用言語の情報を読み出し、第2のユーザの使用言語
の情報を翻訳装置に送信し、翻訳装置が、第1の記憶媒
体から第1のユーザの使用言語の情報を読み出し、第2
のユーザの使用言語の情報を受信し、翻訳に必要なデー
タを記憶し、第1のユーザの使用言語の情報および第2
のユーザの使用言語の情報に基づき、第1のユーザの使
用言語から第2のユーザの使用言語への翻訳に必要なデ
ータを選択する。
【0028】請求項26に記載の翻訳システムにおいて
は、第1の情報処理装置が、第1の記憶媒体から第1の
ユーザの使用言語の情報を読み出し、第1のユーザの使
用言語の情報を翻訳装置に送信し、第2の情報処理装置
が、第2の記憶媒体から第2のユーザの使用言語の情報
を読み出し、第2のユーザの使用言語の情報を翻訳装置
に送信し、翻訳装置が、第1のユーザの使用言語の情報
および第2のユーザの使用言語の情報を受信し、翻訳に
必要なデータを記憶し、第1のユーザの使用言語の情報
および第2のユーザの使用言語の情報に基づき、第1の
ユーザの使用言語から第2のユーザの使用言語への翻訳
に必要なデータを選択する。
【0029】
【発明の実施の形態】以下に本発明の実施の形態を説明
するが、特許請求の範囲に記載の発明の各手段と以下の
実施の形態との対応関係を明らかにするために、各手段
の後の括弧内に、対応する実施の形態(但し一例)を付
加して本発明の特徴を記述すると、次のようになる。但
し勿論この記載は、各手段を記載したものに限定するこ
とを意味するものではない。
【0030】すなわち、請求項1に記載の情報処理装置
は、記憶媒体から使用言語の情報を読み出す読み出し手
段(例えば、図1のUIMコントローラ19−1)と、音
声認識に必要なデータを記憶する記憶手段(例えば、図
1のRAM14−1)と、使用言語の情報に基づき、使用
言語の音声認識に必要なデータを選択する選択手段(例
えば、図1のCPU13−1)とを備えることを特徴とす
る。
【0031】請求項6に記載の音声認識システムは、情
報処理装置が、記憶媒体から使用言語の情報を読み出す
読み出し手段(例えば、図1のUIMコントローラ19−
1)と、使用言語の情報を音声認識装置に送信する送信
手段(例えば、図1のModem21−1)とを備え、
音声認識装置が、情報処理装置が送信した使用言語の情
報を受信する受信手段(例えば、図1のModem3
5)と、音声認識に必要なデータを記憶する記憶手段
(例えば、図1のHDD34)と、使用言語の情報に基づ
き、使用言語の音声認識に必要なデータを選択する選択
手段(例えば、図1のCPU31)とを備えることを特徴
とする。
【0032】請求項10に記載の情報処理装置は、記憶
媒体から使用言語の情報を読み出す読み出し手段(例え
ば、図1のUIMコントローラ19−2)と、音声合成に
必要なデータを記憶する記憶手段(例えば、図1のRAM
14−2)と、使用言語の情報に基づき、使用言語の音
声合成に必要なデータを選択する選択手段(例えば、図
1のCPU13−2)とを備えることを特徴とする。
【0033】請求項15に記載の音声合成システムは、
情報処理装置が、記憶媒体から使用言語の情報を読み出
す読み出し手段(例えば、図1のUIMコントローラ19
−2)と、使用言語の情報を音声認識装置に送信する送
信手段(例えば、図1のModem21−2)とを備え、音
声合成装置が、情報処理装置が送信した使用言語の情報
を受信する受信手段(例えば、図1のModem35)と、
音声合成に必要なデータを記憶する記憶手段(例えば、
図1のHDD34)と、使用言語の情報に基づき、使用言
語の音声合成に必要なデータを選択する選択手段(例え
ば、図1のCPU31)とを備えることを特徴とする。
【0034】請求項18に記載の翻訳装置は、記憶媒体
から使用言語の情報を読み出す読み出し手段(例えば、
図1のUIMコントローラ19−1)と、翻訳に必要なデ
ータを記憶する記憶手段(例えば、図1のRAM14−
1)と、使用言語の情報に基づき、ユーザが入力した文
の翻訳に必要なデータを選択する選択手段(例えば、図
1のCPU13−1)とを備えることを特徴とする。
【0035】請求項23に記載の翻訳システムは、情報
処理装置が、第2の記憶媒体から第2のユーザの使用言
語の情報を読み出す第2の読み出し手段(例えば、図1
のUIMコントローラ19−2)と、第2のユーザの使用
言語の情報を翻訳装置に送信する第1の送信手段(例え
ば、図1のModem21−2)とを備え、翻訳装置が、第
1の記憶媒体から第1のユーザの使用言語の情報を読み
出す第1の読み出し手段(例えば、図1のUIMコントロ
ーラ19−1)と、第2のユーザの使用言語の情報を受
信する受信手段(例えば、図1のModem21−1)と、
翻訳に必要なデータを記憶する記憶手段(例えば、図1
のRAM14−1)と、第1のユーザの使用言語の情報お
よび第2のユーザの使用言語の情報に基づき、第1のユ
ーザの使用言語から第2のユーザの使用言語への翻訳に
必要なデータを選択する選択手段(例えば、図1のCPU
13−1)とを備えることを特徴とする。
【0036】請求項26に記載の翻訳システムは、第1
の情報処理装置が、第1の記憶媒体から第1のユーザの
使用言語の情報を読み出す第1の読み出し手段(例え
ば、図1のUIMコントローラ19−1)と、第1のユー
ザの使用言語の情報を翻訳装置に送信する第1の送信手
段(例えば、図1のModem21−1)とを備え、第2の
情報処理装置が、第2の記憶媒体から第2のユーザの使
用言語の情報を読み出す第2の読み出し手段(例えば、
図1のUIMコントローラ19−2)と、第2のユーザの
使用言語の情報を翻訳装置に送信する第2の送信手段
(例えば、図1のModem21−2)とを備え、翻訳装置
が、第1のユーザの使用言語の情報および第2のユーザ
の使用言語の情報を受信する受信手段(例えば、図1の
Modem35)と、翻訳に必要なデータを記憶する記憶手
段(例えば、図1のHDD34)と、第1のユーザの使用
言語の情報および第2のユーザの使用言語の情報に基づ
き、第1のユーザの使用言語から第2のユーザの使用言
語への翻訳に必要なデータを選択する選択手段(例え
ば、図1のCPU31)とを備えることを特徴とする。
【0037】図1は、本発明の翻訳システムの一実施の
形態の構成を示す図である。翻訳システムを介して他の
ユーザと会話するユーザが使用する通信端末1−1は、
ネットワーク4−1を介して、サーバ3に接続されてい
る。通信端末1−1には、ユーザが使用する言語を示す
データが格納されているUIM(User Identification Modu
le)2−1が装着されている。翻訳システムを介してユ
ーザと会話するする他のユーザが使用する通信端末1−
2は、ネットワーク4−2を介して、サーバ3に接続さ
れている。通信端末1−2には、他のユーザが使用する
言語を示すデータが格納されているUIM2−2が装着さ
れている。
【0038】次に、通信端末1−1の内部の構成を説明
する。マイクロフォン11−1は、ユーザの音声を取り
込み、その音声に応じた信号をI/Oコントローラ18−
1に供給する。スピーカ12−1は、I/Oコントローラ
18−1から供給された信号に基づく、音声を出力す
る。キーボード17−1は、CPU(central processingu
nit)13−1に各種の指令を入力するとき、ユーザに
より操作され、その操作に応じた信号をI/Oコントロー
ラ18−1に供給する。ディスプレイ16−1は、I/O
コントローラ18−1を介して、CPU13−1から供給
されたデータに応じたテキストやイメージを表示する。
I/Oコントローラ18−1は、A/D変換およびD/A変換の
機能を有し、CPU13−1から供給されたデータを所定
の形式に変換して、ディスプレイ16−1またはスピー
カ12−1に出力し、マイクロフォン11−1またはキ
ーボード17−1から供給された信号を所定の形式に変
換して、CPU13−1に出力する。
【0039】CPU13−1は、音声認識または音声合成
の処理のアプリケーションプログラムや、通信端末1−
1全体を制御する基本的なOS(Operating System)を実際
に実行する。ROM(Read Only Memory)15−1は、一般
的には、CPU13−1が使用するプログラムや演算用の
パラメータのうちの基本的に固定のデータを格納する。
RAM(Random Access Memory)14−1は、CPU13−1の
実行において使用するプログラムや、その実行において
適宜変化するパラメータを格納する。
【0040】UIMコントローラ19−1は、UIMスロット
20−1に装着されているUIM2−1を制御し、UIM2−
1が記憶しているデータを読み出し、CPU13−1に供
給し、CPU13−1から供給されたデータをUIM2−1に
記憶させる。
【0041】Modem(Modulator and Demodulator)21−
1は、CPU13−1から供給されたデータを、ネットワ
ーク4−1上を通信可能な形式に変換して、ネットワー
ク4−1に出力し、ネットワーク4−1から供給された
データを所定の形式に変換し、CPU13−1に供給す
る。
【0042】通信端末1−2(以下、通信端末1−1お
よび通信端末1−2を、個々に区別する必要がないとき
は、単に通信端末1と称する。他の装置についても同様
とする)は、UIM2−2が装着され、通信端末1−1と
同様の構成を有する。すなわち、通信端末1−2のマイ
クロフォン11−2乃至Modem21−2は、通信端末1
−1のマイクロフォン11−1乃至Modem21−1に対
応する。
【0043】次に、サーバ3の内部構成について説明す
る。CPU31は、機械翻訳の処理のアプリケーションプ
ログラムや、サーバ3全体を制御する基本的なOS(Opera
tingSystem)を実際に実行する。ROM33は、一般的に
は、CPU31が使用するプログラムや演算用のパラメー
タのうちの基本的に固定のデータを格納する。RAM32
は、CPU31の実行において使用する機械翻訳の処理の
プログラムや、その実行において適宜変化するパラメー
タを格納する。HDD(hard disk drive)34は、内蔵す
るハードディスクを駆動し、それらにCPU31によって
実行する機械翻訳の処理プログラムや情報などを記録ま
たは再生させる。Modem35は、CPU31から供給された
データを、ネットワーク4−1またはネットワーク4−
2上を通信可能な形式に変換して、ネットワーク4−1
またはネットワーク4−2に出力し、ネットワーク4−
1またはネットワーク4−2から供給されたデータを所
定の形式に変換し、CPU31に供給する。
【0044】図2は、通信端末1の外観の構成を説明す
る図である。UIM2は、通信端末1に装着される。通信
端末1の前面には、マイクロフォン11およびスピーカ
12が配置されている。
【0045】次に、音声認識の処理で使用される音声認
識用データベース51について、図3を参照して説明す
る。音声認識用データベース51は、通信端末1のRAM
14、若しくはROM15、またはサーバ3のHDD34に格
納され、音響モデル61、辞書62、および文法63か
ら構成される。音響モデル61、辞書62、および文法
63は、認識の対象となる言語により、異なるデータか
ら構成される。
【0046】音響モデル61は、認識の対象となる言語
において用いられる音素および音節などの音響的な特徴
を格納するモデルで、例えば、隠れマルコフモデル(HM
M:Hidden Markov Model)などとされる。辞書62は、
認識の対象となる言語において用いられる単語の個々の
発音に関する情報を記述する。文法63は、認識の対象
となる言語において単語がどのように連鎖しうるかを記
述し、文脈自由文法に基づく記述または統計的な単語連
鎖確率などを用いて記述される。
【0047】続いて、音声合成の処理で使用される音声
合成用データベース71について、図4を参照して説明
する。音声合成用データベース71は、解析用文法8
1、辞書82、および音素片83から構成され、通信端
末1、またはサーバ3のHDD34に格納される。また、
通信端末1およびサーバ3が音声合成の処理を分散する
とき、解析用文法81および辞書82が、サーバ3のHD
D34に格納され、音素片83が通信端末1に格納され
る。
【0048】辞書82は、単語の品詞情報、読み、およ
びアクセントに関する情報を格納する。解析用文法81
は、辞書82に記述されている単語の情報を基に、単語
連鎖に関する制約を記述し、入力されたテキストを解析
するときに、参照される。音素片83は、例えば、CV
(C:子音、V:母音)連鎖、VCV連鎖、またはCVC連鎖などの
形で音声の素片のデータを格納する。
【0049】更に、図5は、機械翻訳で使用される機械
翻訳用データベース91を説明する図である。機械翻訳
用データベース91は、原言語情報101、変換規則1
02、および目的言語情報103から構成され、サーバ
3のHDD34に格納されている。
【0050】原言語情報101には、翻訳前の原言語を
解析するために必要となる辞書および文法などに関する
情報が格納されている。この辞書は、単語の表記、品
詞、意味、属性などが記述されている。文法の情報は、
文脈自由文法またはユニフィケーショングラマー(Unifi
cation Grammar)などで記述され、原言語で記述された
文の解析に利用される。
【0051】変換規則102には、変換テンプレートお
よび対訳語辞書などで構成され、翻訳前の原言語から翻
訳後の目的言語への変換の規則が格納されている。変換
テンプレートは、例えば、日本語から英語に変換する場
合、日本語の”X(物)をください。”という文に対す
る英語の”X please.”という文、および日本語の”
X(物)をY(人)にみせてください。”という文に対
する英語の”Would you show Y X?”という文など、
文の変換の情報が格納されている。対訳語辞書は、例え
ば、日本語から英語に変換する場合、日本語の”リン
ゴ”という単語に対する英語の”apple”という単語お
よびその単語の属性を示す”物”、および日本語の”ロ
ンドン”という単語に対する英語の”London”という単
語およびその単語の属性を示す”場所”など、単語の対
訳語の情報が記憶されている。
【0052】目的言語情報103には、翻訳後の目的言
語の辞書および文法などが格納され、翻訳文を生成する
ために利用される。
【0053】次に、通信端末1−1が複数の言語に対応
する音声認識用データベース51を有し、通信端末1−
2が複数の言語に対応する音声合成用データベース71
を有するときの、翻訳システムの翻訳処理を図6のフロ
ーチャートを参照して説明する。ステップS11におい
て、ユーザは、通信端末1−1のUIMスロット20−1
に、ユーザの使用する言語を示す情報が格納されている
UIM2−1を装着する。ステップS12において、通信
端末1−1のUIMコントローラ19−1は、通信端末1
−1のUIMスロット20−1に装着されているUIM2−1
から、ユーザの使用する言語を示す情報を読み出し、CP
U13−1に供給する。
【0054】ステップS13において、通信端末1−1
のModem21−1は、ネットワーク4−1を介して、サ
ーバ3に接続する。ステップ14において、通信端末1
−1のModem21−1は、ステップS12で読み出し
た、ユーザの使用する言語を示す情報をサーバ3に送信
し、サーバ3のModem35は、ユーザの使用する言語を
示す情報を受信する。ステップS15において、通信端
末1−1のCPU13−1は、RAM14−1に格納されてい
る音声認識用データベース51をユーザの使用する言語
に対応するように切り換える。ステップS16におい
て、サーバ3のCPU31は、機械翻訳用データベース9
1の原言語情報101を、通信端末1−1からユーザが
入力する言語に対応するように切り換える。
【0055】ステップS17において、ユーザは、通信
端末1−1のキーボード17−1を操作し、通信端末1
−2のID(Identification code)を入力する。ステップ
S18において、通信端末1−1のModem21−1は、
ネットワーク4−1、サーバ3、およびネットワーク4
−2を介して通信端末1−2に接続する。
【0056】ステップS19において、通信端末1−2
のUIMコントローラ19−2は、UIMスロット20−2に
装着されているUIM2−2から、他のユーザが使用する
言語を示す情報を読み出し、CPU13−2に供給する。
ステップS20において、通信端末1−2のModem21
−2は、他のユーザが使用する言語を示す情報を、サー
バ3に送信し、サーバ3のModem35は、他のユーザの
使用する言語を示す情報を受信する。
【0057】ステップS21において、通信端末1−2
のCPU13−2は、音声合成用データベース71を他の
ユーザの使用する言語に対応するように切り換える。ス
テップS22において、サーバ3のCPU31は、機械翻
訳用データベース91の変換規則102および目的言語
情報103を、通信端末1−2からユーザに出力する言
語に対応するように切り換える。
【0058】ステップS23において、翻訳システム
は、通信端末1−1から入力されたユーザが使用する言
語に基づく音声を、他のユーザが使用する言語に基づく
音声に変換して、通信端末1−2から出力する音声翻訳
処理を実行し、処理は終了する。ステップS23の処理
の詳細は、図9のフローチャートを参照して後述する。
【0059】このように、翻訳システムは、迅速かつ確
実に、ユーザが使用する言語および他のユーザが使用す
る言語に対応する。
【0060】続いて、通信端末1−1が音声認識用デー
タベース51をサーバ3からダウンロードし、通信端末
1−2が音声合成用データベース71をサーバ3からダ
ウンロードするときの、翻訳システムの処理を図7のフ
ローチャートを参照して説明する。ステップS41乃至
ステップS44の処理は、図6のステップS11乃至ス
テップS14の処理とそれぞれ同様なので、その説明は
省略する。
【0061】ステップS45において、サーバ3のMode
m35は、ユーザの使用する言語に対応する音声認識用
データベース51を送信し、通信端末1−1のModem2
1−1は、サーバ3からユーザの使用する言語に対応す
る音声認識用データベース51を受信し、RAM14−1
に格納する。
【0062】ステップS46乃至ステップS50の処理
は、図6のステップS16乃至ステップS20とそれぞ
れ同様なので、その説明は省略する。
【0063】ステップS51において、サーバ3のMode
m35は、他のユーザの使用する言語に対応する音声合
成用データベース71を送信し、通信端末1−2のMode
m21−2は、サーバ3から他のユーザの使用する言語
に対応する音声合成用データベース71をダウンロード
する。
【0064】ステップS52およびステップS53は、
図6のステップS22およびステップS23とそれぞれ
同様なので、その説明は省略する。
【0065】以上のように、通信端末1−1のRAM14
−1および通信端末1−2のRAM14−2が小容量で
も、翻訳システムは、迅速かつ確実に、ユーザが使用す
る言語および他のユーザが使用する言語に対応する。
【0066】更に、音声認識の処理および音声合成の処
理をサーバ3が実行するときの、翻訳システムの処理を
図8のフローチャートを参照して説明する。ステップS
71乃至ステップS74の処理は、図6のステップS1
1乃至ステップS14の処理とそれぞれ同様なので、そ
の説明は省略する。
【0067】ステップS75において、サーバ3のCPU
31は、音声認識用データベース51、および機械翻訳
用データベース91の原言語情報101を、通信端末1
−1からユーザが入力する言語に対応するように切り換
える。
【0068】ステップS76乃至ステップS79は、図
6のステップS17乃至ステップS20とそれぞれ同様
なので、その説明は省略する。
【0069】ステップS80において、サーバ3のCPU
31は、音声合成用データベース71、並びに機械翻訳
用データベース91の変換規則102および目的言語情
報103を、通信端末1−2からユーザに出力する言語
に対応するように切り換える。
【0070】ステップS81は、図6のステップS23
と同様なので、その説明は省略する。
【0071】以上のように、音声認識の処理および音声
合成の処理をサーバ3が実行しても、翻訳システムは、
迅速かつ確実に、ユーザが使用する言語および他のユー
ザが使用する言語に対応する。
【0072】図6のステップS23および図7のステッ
プS53の音声翻訳処理の詳細を図9のフローチャート
を参照して説明する。ステップS101において、通信
端末1−1は、マイクロフォン11−1から入力された
音声に対し、音声認識処理を実行し、音声に対応するテ
キストのデータを出力し、ネットワーク4−1を介し
て、サーバ3に送信する。なお、ステップS101の処
理の詳細は、図10のフローチャートを参照して後述す
る。ステップS102において、サーバ3は、通信端末
1−1から受信したテキストのデータに、機械翻訳用デ
ータベース91を利用して、機械翻訳を実行し、他のユ
ーザが使用する言語のテキストに変換し、通信端末1−
2に送信する。ステップS103において、通信端末1
−2は、サーバ3から受信したテキストを基に、音声合
成の処理を実行し、音声をスピーカ12−2から出力す
る。なお、ステップS103の処理の詳細は、図11の
フローチャートを参照して後述する。
【0073】このように、通信端末1−1に入力された
音声は、所定の言語に翻訳され、通信端末1−2から音
声で出力される。なお、図8のステップS81における
処理のとき、ステップS101およびステップS103
の処理は、サーバ3で実行される。
【0074】通信端末1−1で実行される、図9のステ
ップS101に対応する音声認識処理の詳細を、図10
のフローチャートを参照して説明する。ステップS10
1において、通信端末1−1のマイクロフォン11−1
は、ユーザの音声を入力し、音声に対応した信号をI/O
コントローラ18−1に送信する。ステップS112に
おいて、I/Oコントローラ18−1は、A/D変換を実行
し、マイクロフォン11−1から供給された音声に対応
した信号をデジタルデータに変換する。ステップS11
3において、通信端末1−1のCPU13−1は、音声に
対応したデジタルデータを、所定のフレーム毎にスペク
トルデータなどの音声の音響的な特徴を示すパラメータ
に変換する。ステップS114において、通信端末1−
1のCPU13−1は、ステップS113で算出されたパ
ラメータと、音響モデル61、辞書62、および文法6
3が格納するデータとマッチングをとり、テキストのデ
ータを求める。ステップS115において、通信端末1
−1のModem21−1は、ステップS114で求められ
た音声に対応したテキストのデータをサーバ3に送信
し、処理は終了する。
【0075】このように、通信端末1−1に入力された
音声は、音声に対応するテキストのデータに変換され、
サーバ3に送信される。通信端末1−1は、入力した音
声の信号をサーバ3に送信し、サーバ3がステップS1
12、ステップS113、およびステップS114の処
理を実行してもよい。通信端末1−1は、入力した音声
に対応するデジタルデータをサーバ3に送信し、サーバ
3は、ステップS113およびステップS114の処理
を実行してもよい。また、通信端末1−1は、入力した
音声に対応するパラメータをサーバ3に送信し、サーバ
3は、ステップS114の処理を実行してもよい。
【0076】最後に、図9のステップS103に対応す
る音声出力の処理の詳細を、図11のフローチャートを
参照して説明する。ステップS121において、通信端
末1−2のModem21−2は、サーバ3から所定の言語
に翻訳したテキストデータを受信する。ステップS12
2において、通信端末1−2のCPU13−2は、テキス
トの形態素および構文を解析し、ポーズの位置に関する
情報、アクセントおよびイントネーションを制御する情
報、並びに各単語の発音に関する情報を生成する。ステ
ップS123において、通信端末1−2のCPU13−2
は、ステップS122において生成したポーズの位置に
関する情報、アクセントおよびイントネーションを制御
する情報、並びに各単語の発音に関する情報を基に、音
素片83のデータを適切に接続して音声のデータを合成
する。
【0077】ステップS124において、通信端末1−
2のI/Oコントローラ18−2は、ステップS123に
おいて、合成した音声のデータをD/A変換し、音声の信
号を生成する。ステップS125において、通信端末1
−2は、スピーカ12−1から音声の信号に対応した音
声を出力し、処理は終了する。
【0078】このように、通信端末1−2は、翻訳され
たテキストを音声として出力する。サーバ3は、ステッ
プS121乃至ステップS124の処理を実行し、音声
信号を通信端末1−2に送信するようにしてもよい。ま
た、サーバ3は、ステップS121およびステップS1
22の処理を実行し、ポーズの位置に関する情報、アク
セントおよびイントネーションを制御する情報、並びに
各単語の発音に関する情報を通信端末1−2に送信し、
通信端末1−2は、ステップS123乃至ステップS1
25の処理を実行するようにしてもよい。
【0079】以上のように、ユーザが通信端末1−1に
所定のUIM2−1を装着し、他のユーザが通信端末1−
2に所定のUIM2−2を装着するだけで、翻訳システム
は、通信端末1−1から入力された音声を所定の言語に
変換し、通信端末1−2から音声として出力する。
【0080】なお、通信端末1−1および1−2は、音
声を入力し、翻訳した音声を出力するとして説明した
が、キーボード17−1または17−2を操作して文を
入力し、または図1のキーボード17−1および17−
2に代えて、グラフィックスタブレットを備え、ペン入
力により文を入力し、ディスプレイ16−1および16
−2に翻訳した文を表示するようにしてもよい。
【0081】また、サーバ3が機械翻訳するとして説明
したが、通信端末1−1は、通信端末1−1のユーザの
使用する言語に基づく文を、通信端末1−2のユーザの
使用する言語に基づく文に、機械翻訳し、通信端末1−
2は、通信端末1−2のユーザの使用する言語に基づく
文を、通信端末1−1のユーザの使用する言語に基づく
文に、機械翻訳するようにしてもよい。この場合、通信
端末1−1は、通信端末1−1のユーザの使用する言語
を示す情報をUIM2−1から読み出して、通信端末1−
1が有する機械翻訳用データベース91の原言語情報1
01を通信端末1−1のユーザの使用する言語に合わせ
て切り換え、通信端末1−1のユーザの使用する言語を
示す情報を通信端末1−2に送信する。通信端末1−2
は、通信端末1−2のユーザの使用する言語を示す情報
をUIM2−2から読み出して、通信端末1−2が有する
機械翻訳用データベース91の原言語情報101を通信
端末1−2のユーザの使用する言語に合わせて切り換
え、通信端末1−2のユーザの使用する言語を示す情報
を通信端末1−1に送信する。
【0082】通信端末1−1は、通信端末1−2のユー
ザの使用する言語を示す情報を受信し、通信端末1−1
が有する機械翻訳用データベース91の変換規則102
および目的言語情報103を通信端末1−1のユーザの
使用する言語および通信端末1−2のユーザの使用する
言語に合わせて切り換える。通信端末1−2は、通信端
末1−1のユーザの使用する言語を示す情報を受信し、
通信端末1−2が有する機械翻訳用データベース91の
変換規則102および目的言語情報103を通信端末1
−1のユーザの使用する言語および通信端末1−2のユ
ーザの使用する言語に合わせて切り換える。
【0083】なお、本明細書において、システムとは、
複数の装置により構成される装置全体を表すものとす
る。
【0084】また、上記したような処理を行うコンピュ
ータプログラムをユーザに提供する提供媒体としては、
磁気ディスク、CD-ROM、固体メモリなどの記録媒体の
他、ネットワーク、衛星などの通信媒体を利用すること
ができる。
【0085】
【発明の効果】請求項1に記載の情報処理装置、請求項
4に記載の情報処理方法、および請求項5に記載の提供
媒体によれば、記憶媒体から使用言語の情報を読み出
し、音声認識に必要なデータを記憶し、使用言語の情報
に基づき、使用言語の音声認識に必要なデータを選択す
るようにしたので、迅速かつ確実に、ユーザが使用する
言語を認識することができる。
【0086】請求項6に記載の音声認識システムによれ
ば、情報処理装置が、記憶媒体から使用言語の情報を読
み出すし、使用言語の情報を音声認識装置に送信し、音
声認識装置が、情報処理装置が送信した使用言語の情報
を受信し、音声認識に必要なデータを記憶し、使用言語
の情報に基づき、使用言語の音声認識に必要なデータを
選択するようにしたので、迅速かつ確実に、ユーザが使
用する言語を認識することができる。
【0087】請求項10に記載の情報処理装置、請求項
13に記載の情報処理方法、および請求項14に記載の
提供媒体によれば、記憶媒体から使用言語の情報を読み
出し、音声合成に必要なデータを記憶し、使用言語の情
報に基づき、使用言語の音声合成に必要なデータを選択
するようにしたので、迅速かつ確実に、ユーザが使用す
る言語を合成することができる。
【0088】請求項15に記載の音声合成システムによ
れば、情報処理装置が、記憶媒体から使用言語の情報を
読み出し、使用言語の情報を音声合成装置に送信し、音
声合成装置が、情報処理装置が送信した使用言語の情報
を受信し、音声合成に必要なデータを記憶し、使用言語
の情報に基づき、使用言語の音声合成に必要なデータを
選択するようにしたので、迅速かつ確実に、ユーザが使
用する言語を合成することができる
【0089】請求項18に記載の翻訳装置、請求項21
に記載の翻訳方法、および請求項22に記載の提供媒体
によれば、記憶媒体から使用言語の情報を読み出し、翻
訳に必要なデータを記憶し、使用言語の情報に基づき、
ユーザが入力した文の翻訳に必要なデータを選択するよ
うにしたので、迅速かつ確実に、ユーザが使用する言語
を翻訳することができる。
【0090】請求項23に記載の翻訳システムによれ
ば、情報処理装置が、第2の記憶媒体から第2のユーザ
の使用言語の情報を読み出し、第2のユーザの使用言語
の情報を翻訳装置に送信し、翻訳装置が、第1の記憶媒
体から第1のユーザの使用言語の情報を読み出し、第2
のユーザの使用言語の情報を受信し、翻訳に必要なデー
タを記憶し、第1のユーザの使用言語の情報および第2
のユーザの使用言語の情報に基づき、第1のユーザの使
用言語から第2のユーザの使用言語への翻訳に必要なデ
ータを選択するようにしたので、迅速かつ確実に、ユー
ザが使用する言語を翻訳することができる。
【0091】請求項26に記載の翻訳システムによれ
ば、第1の情報処理装置が、第1の記憶媒体から第1の
ユーザの使用言語の情報を読み出し、第1のユーザの使
用言語の情報を翻訳装置に送信し、第2の情報処理装置
が、第2の記憶媒体から第2のユーザの使用言語の情報
を読み出し、第2のユーザの使用言語の情報を翻訳装置
に送信し、翻訳装置が、第1のユーザの使用言語の情報
および第2のユーザの使用言語の情報を受信し、翻訳に
必要なデータを記憶し、第1のユーザの使用言語の情報
および第2のユーザの使用言語の情報に基づき、第1の
ユーザの使用言語から第2のユーザの使用言語への翻訳
に必要なデータを選択するようにしたので、迅速かつ確
実に、ユーザが使用する言語を翻訳することができる。
【図面の簡単な説明】
【図1】本発明の翻訳システムの一実施の形態の構成を
示す図である。
【図2】通信端末1の外観を説明する図である。
【図3】音声認識用データベースを説明する図である。
【図4】音声合成用データベース71を説明する図であ
る。
【図5】機械翻訳用データベース91を説明する図であ
る。
【図6】翻訳システムの翻訳処理を説明するフローチャ
ートである。
【図7】翻訳システムの他の翻訳処理を説明するフロー
チャートである。
【図8】翻訳システムの更に他の翻訳処理を説明するフ
ローチャートである。
【図9】音声翻訳処理を説明するフローチャートであ
る。
【図10】音声認識処理を説明するフローチャートであ
る。
【図11】音声出力処理を説明するフローチャートであ
る。
【符号の説明】
1−1,1−2 通信端末, 2−1,2−1 UIM,
3 データベース,11−1,11−2 マイクロフ
ォン, 12−1,12−2 スピーカ,13−1,1
3−2 CPU, 14−1,14−2 RAM, 18−
1,18−2I/Oコントローラ, 19−1,19−2
UIMコントローラ, 21−1,21−2 Modem,
31 CPU, 32 RAM, 34 HDD, 35 Mo
dem
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 3/16 340 G06F 3/16 340Q 17/28 G10L 5/04 F G10L 13/06 G06F 15/38 V (72)発明者 島川 真人 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 浜田 修 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5B091 AA01 BA05 CB12 CB32 CC01 5D015 KK03 KK04 LL01 5D045 AA07 AB03 AB30

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】 ユーザの使用言語の情報を格納した記憶
    媒体を装着し、ユーザの音声を入力し、認識する情報処
    理装置において、 前記記憶媒体から前記使用言語の情報を読み出す読み出
    し手段と、 音声認識に必要なデータを記憶する記憶手段と、 前記使用言語の情報に基づき、使用言語の音声認識に必
    要なデータを選択する選択手段とを備えることを特徴と
    する情報処理装置。
  2. 【請求項2】 前記読み出し手段は、前記記憶媒体から
    音声認識に必要なデータを読み出すことを特徴とする請
    求項1に記載の情報処理装置。
  3. 【請求項3】 サーバと通信し、前記データをダウンロ
    ードする通信手段を更に備え、 前記選択手段は、前記サーバから前記音声認識に必要な
    データを選択することを特徴とする請求項1に記載の情
    報処理装置。
  4. 【請求項4】 ユーザの使用言語の情報を格納した記憶
    媒体を装着し、ユーザの音声を入力し、認識する情報処
    理装置の情報処理方法において、 前記記憶媒体から前記使用言語の情報を読み出す読み出
    しステップと、 音声認識に必要なデータを記憶する記憶ステップと、 前記使用言語の情報に基づき、使用言語の音声認識に必
    要なデータを選択する選択ステップとを含むことを特徴
    とする情報処理方法。
  5. 【請求項5】 ユーザの使用言語の情報を格納した記憶
    媒体を装着し、ユーザの音声を入力し、認識する情報処
    理装置に、 前記記憶媒体から前記使用言語の情報を読み出す読み出
    しステップと、 音声認識に必要なデータを記憶する記憶ステップと、 前記使用言語の情報に基づき、使用言語の音声認識に必
    要なデータを選択する選択ステップとを含む処理を実行
    させるコンピュータが読み取り可能なプログラムを提供
    することを特徴とする提供媒体。
  6. 【請求項6】 ユーザの使用言語の情報を格納した記憶
    媒体を装着し、ユーザの音声を入力する情報処理装置、
    および前記音声を認識する音声認識装置からなる音声認
    識システムにおいて、 前記情報処理装置は、 前記記憶媒体から前記使用言語の情報を読み出す読み出
    し手段と、 前記使用言語の情報を前記音声認識装置に送信する送信
    手段とを備え、 前記音声認識装置は、 前記情報処理装置が送信した前記使用言語の情報を受信
    する受信手段と、 音声認識に必要なデータを記憶する記憶手段と、 前記使用言語の情報に基づき、使用言語の音声認識に必
    要なデータを選択する選択手段とを備えることを特徴と
    する音声認識システム。
  7. 【請求項7】 前記ユーザの音声のデータは、ユーザの
    音声のアナログデータであることを特徴とする請求項6
    に記載の音声認識システム。
  8. 【請求項8】 前記ユーザの音声のデータは、ユーザの
    音声をA/D変換したデータであることを特徴とする請
    求項6に記載の音声認識システム。
  9. 【請求項9】 前記ユーザの音声のデータは、ユーザの
    音声を特徴抽出したデータであることを特徴とする請求
    項6に記載の音声認識システム。
  10. 【請求項10】 ユーザの使用言語の情報を格納した記
    憶媒体を装着し、音声を合成し、出力する情報処理装置
    において、 前記記憶媒体から前記使用言語の情報を読み出す読み出
    し手段と、 音声合成に必要なデータを記憶する記憶手段と、 前記使用言語の情報に基づき、使用言語の音声合成に必
    要なデータを選択する選択手段とを備えることを特徴と
    する情報処理装置。
  11. 【請求項11】 前記読み出し手段は、前記記憶媒体か
    ら音声合成に必要なデータを読み出すことを特徴とする
    請求項10に記載の情報処理装置。
  12. 【請求項12】 サーバと通信し、前記データをダウン
    ロードする通信手段を更に備え、 前記選択手段は、前記サーバから前記音声合成に必要な
    データを選択することを特徴とする請求項10に記載の
    情報処理装置。
  13. 【請求項13】 ユーザの使用言語の情報を格納した記
    憶媒体を装着し、音声を合成し、出力する情報処理装置
    の情報処理方法において、 前記記憶媒体から前記使用言語の情報を読み出す読み出
    しステップと、 音声合成に必要なデータを記憶する記憶ステップと、 前記使用言語の情報に基づき、使用言語の音声合成に必
    要なデータを選択する選択ステップとを含むことを特徴
    とする情報処理方法。
  14. 【請求項14】 ユーザの使用言語の情報を格納した記
    憶媒体を装着し、音声を合成し、出力する情報処理装置
    に、 前記記憶媒体から前記使用言語の情報を読み出す読み出
    しステップと、 音声合成に必要なデータを記憶する記憶ステップと、 前記使用言語の情報に基づき、使用言語の音声合成に必
    要なデータを選択する選択ステップとを含む処理を実行
    させるコンピュータが読み取り可能なプログラムを提供
    することを特徴とする提供媒体。
  15. 【請求項15】 ユーザの使用言語の情報を格納した記
    憶媒体を装着し、音声を出力する情報処理装置、および
    前記音声を合成する音声合成装置からなる音声合成シス
    テムにおいて、 前記情報処理装置は、 前記記憶媒体から前記使用言語の情報を読み出す読み出
    し手段と、 前記使用言語の情報を前記音声合成装置に送信する送信
    手段とを備え、 前記音声合成装置は、 前記情報処理装置が送信した前記使用言語の情報を受信
    する受信手段と、 音声合成に必要なデータを記憶する記憶手段と、 前記使用言語の情報に基づき、使用言語の音声合成に必
    要なデータを選択する選択手段とを備えることを特徴と
    する音声合成システム。
  16. 【請求項16】 前記音声合成装置の出力は、アナログ
    データであることを特徴とする請求項15に記載の音声
    合成システム。
  17. 【請求項17】 前記音声合成装置の出力は、音素記号
    列および韻律規則を示すデータであることを特徴とする
    請求項15に記載の音声合成システム。
  18. 【請求項18】 ユーザの使用言語の情報を格納した記
    憶媒体を装着し、ユーザが入力した文を翻訳する翻訳装
    置において、 前記記憶媒体から前記使用言語の情報を読み出す読み出
    し手段と、 翻訳に必要なデータを記憶する記憶手段と、 前記使用言語の情報に基づき、前記ユーザが入力した文
    の翻訳に必要なデータを選択する選択手段とを備えるこ
    とを特徴とする翻訳装置。
  19. 【請求項19】 前記読み出し手段は、前記記憶媒体か
    ら翻訳に必要なデータを読み出すことを特徴とする請求
    項18に記載の翻訳装置。
  20. 【請求項20】 サーバと通信し、前記データをダウン
    ロードする通信手段を更に備え、 前記選択手段は、前記サーバから前記翻訳に必要なデー
    タを選択することを特徴とする請求項18に記載の翻訳
    装置。
  21. 【請求項21】 ユーザの使用言語の情報を格納した記
    憶媒体を装着し、ユーザが入力した文を翻訳する翻訳装
    置の翻訳方法において、 前記記憶媒体から前記使用言語の情報を読み出す読み出
    しステップと、 翻訳に必要なデータを記憶する記憶ステップと、 前記使用言語の情報に基づき、前記ユーザが入力した文
    の翻訳に必要なデータを選択する選択ステップとを含む
    ことを特徴とする翻訳方法。
  22. 【請求項22】 ユーザの使用言語の情報を格納した記
    憶媒体を装着し、ユーザが入力した文を翻訳する翻訳装
    置に、 前記記憶媒体から前記使用言語の情報を読み出す読み出
    しステップと、 翻訳に必要なデータを記憶する記憶ステップと、 前記使用言語の情報に基づき、前記ユーザが入力した文
    の翻訳に必要なデータを選択する選択ステップとを含む
    処理を実行させるコンピュータが読み取り可能なプログ
    ラムを提供することを特徴とする提供媒体。
  23. 【請求項23】 第1のユーザの使用言語の情報を格納
    した第1の記憶媒体を装着し、前記第1のユーザが入力
    した文を翻訳する翻訳装置、および第2のユーザの使用
    言語の情報を格納した第2の記憶媒体を装着し、翻訳さ
    れた前記第1のユーザの文を出力する情報処理装置から
    なる翻訳システムにおいて、 前記情報処理装置は、 前記第2の記憶媒体から前記第2のユーザの使用言語の
    情報を読み出す第2の読み出し手段と、 前記第2のユーザの使用言語の情報を前記翻訳装置に送
    信する第1の送信手段とを備え、 前記翻訳装置は、 前記第1の記憶媒体から前記第1のユーザの使用言語の
    情報を読み出す第1の読み出し手段と、 前記第2のユーザの使用言語の情報を受信する受信手段
    と、 翻訳に必要なデータを記憶する記憶手段と、 前記第1のユーザの使用言語の情報および前記第2のユ
    ーザの使用言語の情報に基づき、前記第1のユーザの使
    用言語から前記第2のユーザの使用言語への翻訳に必要
    なデータを選択する選択手段と、 を備えることを特徴とする翻訳システム。
  24. 【請求項24】 前記翻訳装置の前記第1の読み出し手
    段は、前記第1の記憶媒体から翻訳に必要なデータを読
    み出すことを特徴とする請求項23に記載の翻訳システ
    ム。
  25. 【請求項25】 前記翻訳装置は、サーバと通信し、前
    記データをダウンロードする通信手段を更に備え、 前記翻訳装置の前記選択手段は、前記サーバから前記翻
    訳に必要なデータを選択することを特徴とする請求項2
    3に記載の翻訳システム。
  26. 【請求項26】 第1のユーザの使用言語の情報を格納
    した第1の記憶媒体を装着し、前記第1のユーザが文を
    入力する第1の情報処理装置、第2のユーザの使用言語
    の情報を格納した第2の記憶媒体を装着し、前記第1の
    ユーザが入力した文を翻訳した文を出力する情報処理装
    置、および前記第1のユーザが入力した文を、前記第2
    のユーザの使用言語に基づく文に翻訳する翻訳装置から
    なる翻訳システムにおいて、 前記第1の情報処理装置は、 前記第1の記憶媒体から前記第1のユーザの使用言語の
    情報を読み出す第1の読み出し手段と、 前記第1のユーザの使用言語の情報を前記翻訳装置に送
    信する第1の送信手段とを備え、 前記第2の情報処理装置は、 前記第2の記憶媒体から前記第2のユーザの使用言語の
    情報を読み出す第2の読み出し手段と、 前記第2のユーザの使用言語の情報を前記翻訳装置に送
    信する第2の送信手段とを備え、 前記翻訳装置は、 前記第1のユーザの使用言語の情報および前記第2のユ
    ーザの使用言語の情報を受信する受信手段と、 翻訳に必要なデータを記憶する記憶手段と、 前記第1のユーザの使用言語の情報および前記第2のユ
    ーザの使用言語の情報に基づき、前記第1のユーザの使
    用言語から前記第2のユーザの使用言語への翻訳に必要
    なデータを選択する選択手段とを備えることを特徴とす
    る翻訳システム。
JP10328072A 1998-11-18 1998-11-18 情報処理装置および方法、提供媒体、音声認識システム、音声合成システム、翻訳装置および方法、並びに翻訳システム Pending JP2000148176A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10328072A JP2000148176A (ja) 1998-11-18 1998-11-18 情報処理装置および方法、提供媒体、音声認識システム、音声合成システム、翻訳装置および方法、並びに翻訳システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10328072A JP2000148176A (ja) 1998-11-18 1998-11-18 情報処理装置および方法、提供媒体、音声認識システム、音声合成システム、翻訳装置および方法、並びに翻訳システム

Publications (2)

Publication Number Publication Date
JP2000148176A true JP2000148176A (ja) 2000-05-26
JP2000148176A5 JP2000148176A5 (ja) 2006-03-23

Family

ID=18206206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10328072A Pending JP2000148176A (ja) 1998-11-18 1998-11-18 情報処理装置および方法、提供媒体、音声認識システム、音声合成システム、翻訳装置および方法、並びに翻訳システム

Country Status (1)

Country Link
JP (1) JP2000148176A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100387918B1 (ko) * 2000-07-11 2003-06-18 이수성 통역기
WO2005091274A1 (ja) * 2004-03-18 2005-09-29 Nec Corporation 音声処理方法と通信システム並びに通信端末およびサーバとプログラム
WO2011007595A1 (ja) * 2009-07-16 2011-01-20 独立行政法人情報通信研究機構 音声翻訳システム、辞書サーバ装置、およびプログラム
KR20110032394A (ko) * 2009-09-23 2011-03-30 삼성전자주식회사 사용자의 상황에 기반한 휴대용 통역 장치 및 방법
WO2011040056A1 (ja) * 2009-10-02 2011-04-07 独立行政法人情報通信研究機構 音声翻訳システム、第一端末装置、音声認識サーバ装置、翻訳サーバ装置、および音声合成サーバ装置
WO2011048826A1 (ja) * 2009-10-21 2011-04-28 独立行政法人情報通信研究機構 音声翻訳システム、制御装置、および制御方法

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100387918B1 (ko) * 2000-07-11 2003-06-18 이수성 통역기
WO2005091274A1 (ja) * 2004-03-18 2005-09-29 Nec Corporation 音声処理方法と通信システム並びに通信端末およびサーバとプログラム
CN102473413A (zh) * 2009-07-16 2012-05-23 独立行政法人情报通信研究机构 语音翻译系统、词典服务器装置及其程序
WO2011007595A1 (ja) * 2009-07-16 2011-01-20 独立行政法人情報通信研究機構 音声翻訳システム、辞書サーバ装置、およびプログラム
US9442920B2 (en) 2009-07-16 2016-09-13 National Institute Of Information And Communications Technology Speech translation system, dictionary server, and program
KR20110032394A (ko) * 2009-09-23 2011-03-30 삼성전자주식회사 사용자의 상황에 기반한 휴대용 통역 장치 및 방법
KR101640024B1 (ko) * 2009-09-23 2016-07-15 삼성전자주식회사 사용자의 상황에 기반한 휴대용 통역 장치 및 방법
CN103345467B (zh) * 2009-10-02 2017-06-09 独立行政法人情报通信研究机构 语音翻译系统
CN102549653A (zh) * 2009-10-02 2012-07-04 独立行政法人情报通信研究机构 语音翻译系统、第一终端装置、语音识别服务器装置、翻译服务器装置以及语音合成服务器装置
KR101683943B1 (ko) * 2009-10-02 2016-12-07 코쿠리츠켄큐카이하츠호진 죠호츠신켄큐키코 음성번역 시스템, 제1 단말장치, 음성인식 서버장치, 번역 서버장치, 및 음성합성 서버장치
KR20120086287A (ko) * 2009-10-02 2012-08-02 독립행정법인정보통신연구기구 음성번역 시스템, 제1 단말장치, 음성인식 서버장치, 번역 서버장치, 및 음성합성 서버장치
WO2011040056A1 (ja) * 2009-10-02 2011-04-07 独立行政法人情報通信研究機構 音声翻訳システム、第一端末装置、音声認識サーバ装置、翻訳サーバ装置、および音声合成サーバ装置
CN103345467A (zh) * 2009-10-02 2013-10-09 独立行政法人情报通信研究机构 语音翻译系统
JP5598998B2 (ja) * 2009-10-02 2014-10-01 独立行政法人情報通信研究機構 音声翻訳システム、第一端末装置、音声認識サーバ装置、翻訳サーバ装置、および音声合成サーバ装置
US8862478B2 (en) 2009-10-02 2014-10-14 National Institute Of Information And Communications Technology Speech translation system, first terminal apparatus, speech recognition server, translation server, and speech synthesis server
WO2011048826A1 (ja) * 2009-10-21 2011-04-28 独立行政法人情報通信研究機構 音声翻訳システム、制御装置、および制御方法
US8954335B2 (en) 2009-10-21 2015-02-10 National Institute Of Information And Communications Technology Speech translation system, control device, and control method
EP2492910A4 (en) * 2009-10-21 2016-08-03 Nat Inst Inf & Comm Tech SPEECH TRANSLATION SYSTEM, CONTROL APPARATUS AND CONTROL METHOD
KR20120107933A (ko) * 2009-10-21 2012-10-04 독립행정법인정보통신연구기구 음성번역 시스템, 제어장치, 및 제어방법
CN102549654A (zh) * 2009-10-21 2012-07-04 独立行政法人情报通信研究机构 语音翻译系统、控制装置以及控制方法
KR101683944B1 (ko) * 2009-10-21 2016-12-20 코쿠리츠켄큐카이하츠호진 죠호츠신켄큐키코 음성번역 시스템, 제어장치, 및 제어방법
JP2011090100A (ja) * 2009-10-21 2011-05-06 National Institute Of Information & Communication Technology 音声翻訳システム、制御装置、音声認識装置、翻訳装置、および音声合成装置

Similar Documents

Publication Publication Date Title
US7596499B2 (en) Multilingual text-to-speech system with limited resources
US11450313B2 (en) Determining phonetic relationships
Rudnicky et al. Survey of current speech technology
JP2021196598A (ja) モデルトレーニング方法、音声合成方法、装置、電子機器、記憶媒体およびコンピュータプログラム
CN102687197B (zh) 声音识别用词典制作装置、声音识别装置及声音合成装置
JP2008185805A (ja) 高品質の合成音声を生成する技術
US20030154080A1 (en) Method and apparatus for modification of audio input to a data processing system
JP2001101187A (ja) 翻訳装置および翻訳方法、並びに記録媒体
JP2002116796A (ja) 音声処理装置、音声処理方法及び記憶媒体
JP6806662B2 (ja) 音声合成システム、統計モデル生成装置、音声合成装置、音声合成方法
CN113380222A (zh) 语音合成方法、装置、电子设备及存储介质
WO2008147649A1 (en) Method for synthesizing speech
JP2005534070A (ja) 連結式テキスト音声変換
JP2000148176A (ja) 情報処理装置および方法、提供媒体、音声認識システム、音声合成システム、翻訳装置および方法、並びに翻訳システム
JP2020060642A (ja) 音声合成システム、及び音声合成装置
US20060247921A1 (en) Speech dialog method and system
Mukherjee et al. A Bengali speech synthesizer on Android OS
CN113409761B (zh) 语音合成方法、装置、电子设备以及计算机可读存储介质
JP2022133447A (ja) 音声処理方法、装置、電子機器及び記憶媒体
JP6179884B2 (ja) Wfst作成装置、音声認識装置、音声翻訳装置、wfst作成方法、およびプログラム
JP2001117752A (ja) 情報処理装置および情報処理方法、並びに記録媒体
JP2001117921A (ja) 翻訳装置および翻訳方法、並びに記録媒体
JP2003029774A (ja) 音声波形辞書配信システム、音声波形辞書作成装置、及び音声合成端末装置
US20030216921A1 (en) Method and system for limited domain text to speech (TTS) processing
US11250837B2 (en) Speech synthesis system, method and non-transitory computer readable medium with language option selection and acoustic models

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051117

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080418

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090316

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090917