JPH04167070A - 音声翻訳装置 - Google Patents

音声翻訳装置

Info

Publication number
JPH04167070A
JPH04167070A JP2291979A JP29197990A JPH04167070A JP H04167070 A JPH04167070 A JP H04167070A JP 2291979 A JP2291979 A JP 2291979A JP 29197990 A JP29197990 A JP 29197990A JP H04167070 A JPH04167070 A JP H04167070A
Authority
JP
Japan
Prior art keywords
speech
voice
data
analysis
analyzed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2291979A
Other languages
English (en)
Inventor
Kenichi Hirayama
健一 平山
Takanori Murata
村田 隆憲
Waichiro Tsujita
辻田 和一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2291979A priority Critical patent/JPH04167070A/ja
Publication of JPH04167070A publication Critical patent/JPH04167070A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、音声認識、音声録音・再生技術な応用して、
ある言語のある言葉を音声認識した後、その認識した言
葉と同意の言葉をある言語と異なる別の言語に翻訳して
音声合成出力する音声翻訳装置に関する。
(従来の技術) 従来、音声認識技術を応用して、音声翻訳を行なう翻訳
装置が存在する。ここでいう翻訳とは、同国語における
方言あるいは異なった言回し等に変換することも含む。
第2図は、従来の音声翻訳装置の一例のブロック図であ
る。
図示の装置は、マイク21と、制御部22と、音声区間
切出し部23と、音声認識部24と、標準パターン用R
AM25と、音声合成部26と、音声合成データ用RO
M27と、スピーカアンプ28と、スピーカ29と、ス
イッチ回路3oと、スイッチ31とから成る。
マイク21は、操作者が音声情報の吹き込みを行なうた
めのものである。
制御部22は、装置の各部の動作タイミングを制御する
音声区間切出し部23は、マイク21から入力された音
声を所定の音声区間に切出す。
音声認識部24は、音声区間切出し部23から出力され
る音声の認識を行なう。
標準パターン用RAM25は、音声認識の比較の対象と
なる音声の標準パターンを格納したメモリである。
音声合成部26は、音声合成データ用ROM27に格納
された音声データから音声を合成する。
音声合成データ用ROM27は、音声合成を行なうため
のデータを格納したROMである。
スピーカアンプ28は、スピーカ29に送られる音声信
号を増幅する。
スピーカ29は、音声信号を音声に変換する。
スイッチ回路30は、制御部22を起動又は停止する回
路である。
スイッチ31は、スイッチ回路3oを操作するスイッチ
である。
次に、上述した装置の動作を説明する。
利用者が翻訳させる音声を入力する時、スイッチ31を
押す。すると、制御部22に割込みが入り、制御部22
は音声区間切出し部23、音声認識部24に動作開始信
号を送る。このとき、音声区間切出し部23は、音声区
間を切出す、また、音声認識部24はその音声区間にお
いて特徴量を標準パターン用RAMに格納しである標準
パターンと比較する。この比較のときは、各言葉(単語
)の特徴量との間で、パターンマツチングが行なわれる
音声認識部24での音声認識動作が終了すると、制御部
22は音声認識部24から認識結果番号を読み出し、前
記認識結果に対応した音声合成を実施する旨、音声合成
部26に指令する。
音声合成部26は、制御部22から与えられたコード番
号に相当する音声合成データを音声合成データ用ROM
27から読み出し、合成処理を行ない、アナログ音声信
号に変換する。変換されたアナログ音声信号は、スピー
カアンプ28にょって増幅された後、スピーカ29から
出力される。
(発明が解決しようとする課題) しかしながら、上述した従来の技術には、次のような問
題点があった。
即ち、文章中の目的語が違うだけでもそれらの文章の数
だけ音声合成データを用意しなければならなかった。従
って、メモリの使用量が美大なものとなり、装置の価格
が高くなるという問題があった。
例えば、”私はニューヨークに行きたい、”と“私はシ
カゴに行きたい、”の翻訳文は、”I want to
 go to New York、 ”と”I wan
t t。
go to Chicago、”となり、”I wan
t to go to″については共に共通なデータを
格納することになった。つまり、このようなデータの格
納方法は、メモリの効率的な使用方法とはいえなかった
本発明は以上の点に着目してなされたもので、音声合成
データ用メモリの冗長度が大きいという問題点を除去す
るために、目的語となる比較的知名度の高い地名(例え
ば、ニューヨークなど)や、外来語(コーヒー、ビール
、トイレ)等は、利用者の音声を録音し、目的語の無い
翻訳文章に付加することでメモリの効率的な使用、しい
ては装置の価格低減を図る優れた装置を提供することを
目的とするものである。
(課題を解決するための手段) 本発明の音声翻訳装置は、入力された音声が音声認識の
対象となる被認識音声か音声分析の対象となる被分析音
声かを判定する判定手段と、当該判定手段により被認識
音声であると判定された入力音声を認識する音声認識手
段と、前記判定手段により被分析音声であると判定され
た入力音声を分析して音声データを作成する音声分析手
段と、前記音声認識手段により認識された音声パターン
に対応した音声合成データと音声分析手段により作成さ
れた音声データとを合成して音声出力を行なう音声合成
手段とを備えたことを特徴とするものである。
(作用) 本発明の音声翻訳装置においては、操作者にょり入力さ
れた音声は、判定回路により被認識音声か被分析音声か
が判定される。被認識音声は、音声認識手段により認識
されて対応する音声合成データに変換される。被分析音
声は、音声分析手段により分析され、これに基づいて音
声データが作成される。これらの双方の音声データは、
音声合成手段により合成されである意味の文章の音声と
して出力される。
(実施例) 第1図は、本発明の実施例におけるブロック図である。
図示の装置は、マイクlと、制御部11と、音声区間切
出し部2と、音声認識手段4と、標準パターン用RAM
3と、音声分析手段6と、音声分析用RAM5と、音声
合成手段8と、音声合成データ用ROM7と、スピーカ
アンプ9と、スピーカ10と、判定手段12と、スイッ
チ13とから成る。
マイク1は、操作者が音声情報の吹き込みを行なうため
のものである。
制御部11は、装置の各部の動作タイミングを制御する
音声区間切出し部2は、マイク1から入力された音声を
所定の音声区間に切出す。
音声認識手段4は、音声区間切出し部2から出力される
音声の認識を行なう。
標準パターン用RAM3は、音声認識の比較の対象とな
る音声の標準パターンを格納したメモリである。
音声分析手段6は、音声区間切出し部2から出力される
音声を分析して音声データを出力する。
音声分析用RAM5は、音声分析手段6から出力された
音声を一時的に格納する。
音声合成手段8は、音声合成データ用ROM7に格納さ
れた音声データから音声を合成する。
音声合成データ用ROM7は、音声合成を行なうための
データを格納したROMである。
スピーカアンプ9は、スピーカ10に送られる音声信号
を増幅する。
スピーカ10は、音声信号を音声に変換する。
判定手段12は、操作者が発声した音声が被認識音声か
被分析音声かを判定する。この判定は、操作者によるス
イッチ13の操作状態を検出することにより行なう。
スイッチ13は、判定手段13を操作するスイッチであ
る。
第3図は、本発明の一実施例における外観図である。
図示の音声翻訳装置は、携帯用のものである。
本体の所定箇所には、図示のように、マイクl、スピー
カ10、スイッチ13がそれぞれ設けられている。また
、その他の部分は、本体の内部に格納されている。
次に、各部の動作を順を追って説明する。
まず、音声の入力方法が2つある。1つは通常の翻訳動
作(ノーマルタイプ)である、もう1つは英語、ドイツ
語、フランス語等の文章中で目的語より前の言葉(単語
)は音声合成で出力し、目的語は利用者の音声を録音、
再生する動作(以下、分析音声付加タイプ)である。ノ
ーマルタイプは従来通りであるので、説明を省略し、分
析音声付加タイプについて説明する。
第4図は、分析音声付加タイプ時のタイムチャートであ
る。
操作者が翻訳させる音声を入力する時、スイッチ13を
押す、操作者は、音声を入力している間は、スイッチ1
3を押し続け、音声の入力の終了とともに、スイッチ1
3を放す、スイッチ13を放すと、制御部11に割込み
が入り、制御部11は、音声区間切出し部2、音声認識
手段4に動作開始信号を送る。そのとき、始めて音声区
間切出し部2は音声区間を切出す。そして、音声認識手
段4はその音声区間においての特徴量と前もって標準パ
ターン用RAM3に格納しである各言葉の特徴量との間
でパターンマツチングを行なう、その後、ある時間t0
以内にスイッチ13が再び押された場合、本装置は分析
音声付加タイプと判断する。スイッチ13が押されてい
る間、音声分析手段6はマイク1からの入力音声を分析
し、ADPCMデータ等の音声合成用データに変換する
そして、音声分析用RAM5に音声合成手段8で出力可
能な形の音声合成用データを格納する。
その後、音声合成手段8は、制御部11から与えられた
コード番号に相当する音声合成データを音声合成データ
用ROM7から読み出す。また、音声合成手段8は、音
声分析用RAM5の分析データを読み、連続して合成処
理を行ない、アナログ音声信号に変換する。変換された
アナログ信号は、スピーカアンプ9によって増幅された
後、スピーカ10から出力される。
例えば、“いく、”ぜんとらるばあく。”と入力すると
、”いく。”という音声が音声認識手段4で認識され、
“ぜんとらるばあく。”という音声が音声分析手段6で
ADPCMデータ等に分析され、音声分析用RAM5に
格納される。そして、音声合成時にスピーカ10から“
I want to g。
toせんとらるばあく、”と出力される。
上述の実施例に対し、以下のような機能を追加してもよ
い。
制御部11は、音声認識手段4から認識コード番号を読
み出し、前記コード番号が分析音声付加タイプの認識単
語であるかチエツクを行なう。もし、ノーマルタイプで
あれば、次の候補を音声認識手段4から読み出す。そし
て、再度同様のチエツクを行ない、操作者が翻訳を行な
いたい分析音声付加タイプの認識単語が出るまでこれを
繰り返す。これにより、入力操作が容易となる。
また、以下のように動作するようにしてもよい。
上述した実施例においては、音声認識手段4は音声区間
においての特徴量と前もって標準パターン用RAM3に
格納しである各言葉の特徴量との間でパターンマツチン
グを実施し、その後、ある時間t0以内にスイッチ13
が押された場合、分析音声付加タイプと判断するように
したが、この手順を逆にすることもできる。即ち、スイ
ッチ13の操作状態により、まず、分析音声付加タイプ
か否かを判断する。この判断により、分析音声付加タイ
プであれば、その標準パターンのみを標準パターン用R
AM3から選択し、そうでなければ、ノーマルタイプの
標準パターンのみを選択してパターンマツチングを行な
う、このようにして、標準パターンを分析音声付加タイ
プと、ノーマルタイプとにグルービングしてから、パタ
ーンマツチングを行なうことにより、音声認識手段4の
認識率の向上を図ることができる。
(発明の効果) 以上説明したように、本発明の音声翻訳装置によれば、
翻訳文章の目的語が比較的知名度の高い地名や外来語の
場合、その目的語は利用者の発声をそのまま使用するよ
うにしたので、1つの音声合成データを使って多種類の
翻訳文章を出力することができる。即ち、一定量の合成
データで極めて多数の翻訳ができるようになる。また、
この分析音声付加タイプと通常の言葉を翻訳するノーマ
ルタイプと2種類の音声にグルービングして、音声認識
を行なうことにより、音声の認識率の向上を図ることが
できる0以上の結果、装置の価格の低減を図ることがで
きるとともに、操作性のよい音声認識装置を提供するこ
とができる。
【図面の簡単な説明】
第1図は本発明の一実施例におけるブロック図、第2図
は従来の音声翻訳装置の一例のブロック図、第3図は本
発明の一実施例における外観図、第4図は分析音声付加
タイプ時のタイムチャートである。 1・・・マイク、2・・・音声区間切出し部、3・・・
標準パターン用RAM、4・・・音声認識部、5・・・
音声分析用RAM、6・・・音声分析部、7・・・音声
合成データ用RAM、8・・・音声合成部、9・・・ス
ピーカアンプ、10・・・スピーカ、11・・・制御部
、12・・・判定回路、13・・・スイッチ。

Claims (1)

  1. 【特許請求の範囲】 入力された音声が音声認識の対象となる被認識音声か音
    声分析の対象となる被分析音声かを判定する判定手段と
    、 当該判定手段により被認識音声であると判定された入力
    音声を認識する音声認識手段と、前記判定手段により被
    分析音声であると判定された入力音声を分析して音声デ
    ータを作成する音声分析手段と、 前記音声認識手段により認識された音声パターンに対応
    した音声合成データと音声分析手段により作成された音
    声データとを合成して音声出力を行なう音声合成手段と
    を備えたことを特徴とする音声翻訳装置。
JP2291979A 1990-10-31 1990-10-31 音声翻訳装置 Pending JPH04167070A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2291979A JPH04167070A (ja) 1990-10-31 1990-10-31 音声翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2291979A JPH04167070A (ja) 1990-10-31 1990-10-31 音声翻訳装置

Publications (1)

Publication Number Publication Date
JPH04167070A true JPH04167070A (ja) 1992-06-15

Family

ID=17775944

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2291979A Pending JPH04167070A (ja) 1990-10-31 1990-10-31 音声翻訳装置

Country Status (1)

Country Link
JP (1) JPH04167070A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017151619A (ja) * 2016-02-23 2017-08-31 株式会社ログバー 翻訳機

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017151619A (ja) * 2016-02-23 2017-08-31 株式会社ログバー 翻訳機

Similar Documents

Publication Publication Date Title
US7260529B1 (en) Command insertion system and method for voice recognition applications
JPH05165486A (ja) テキスト音声変換装置
EP0472193A2 (en) Translation device based on voice recognition and voice synthesis
JPH04167070A (ja) 音声翻訳装置
JPH06337876A (ja) 文章読み上げ装置
KR102107447B1 (ko) 선택적 음성 모델의 적용에 기초한 번역 기능을 제공하는 텍스트 음성 변환 장치 및 그 동작 방법
US20080249776A1 (en) Methods and Arrangements for Enhancing Machine Processable Text Information
JP2723214B2 (ja) 音声文書作成装置
JP2001042883A (ja) テキスト音声合成装置
JPH05313685A (ja) 文章読み上げ装置
JPH03217900A (ja) テキスト音声合成装置
JP2000010977A (ja) 翻訳装置
JPH082015A (ja) プリンタ装置
JPH04167069A (ja) 辞書分割型音声翻訳機
JP3136038B2 (ja) 通訳装置
JPH04110900A (ja) 音声入出力装置
JPH05173589A (ja) 音声認識応答装置
JPS6146557A (ja) 音声ワ−ドプロセツサ
JPH04362774A (ja) 文書読み上げ装置
JPH0195323A (ja) 音声入力装置
JPS61262967A (ja) 音声ワ−ド・プロセサ
JPS63155229A (ja) ワ−ドプロセツサの変換方式
JPH10274998A (ja) 文書読み上げ方法および文書読み上げ装置
JPS62233830A (ja) 音声処理装置
JPS60173663A (ja) ワ−ドプロセツサ