JPS60144799A - 自動通訳装置 - Google Patents

自動通訳装置

Info

Publication number
JPS60144799A
JPS60144799A JP59001645A JP164584A JPS60144799A JP S60144799 A JPS60144799 A JP S60144799A JP 59001645 A JP59001645 A JP 59001645A JP 164584 A JP164584 A JP 164584A JP S60144799 A JPS60144799 A JP S60144799A
Authority
JP
Japan
Prior art keywords
speech
data
circuit
information
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59001645A
Other languages
English (en)
Inventor
伏木田 勝信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59001645A priority Critical patent/JPS60144799A/ja
Publication of JPS60144799A publication Critical patent/JPS60144799A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は自動通訳装置に関する。
従来、必る言語の音声の自動認識を行ない文字列に変換
し、前記文字列を同じ意味を持つこれと同一または他の
言語の文字列に変換(通訳)した後、音声合成を行なっ
て音声出力する自動通訳方式が知られている。
しかしながら、前記自動通訳方式においては、前記入力
として与えられる音声の感情的な面や、話者に特有の特
徴を伝えることがほとんど考慮でれておらず、発声者の
感情等の非言語的な情緒情報2話者情報を十分伝達でき
ない欠点があった。
本発明の目的は発声者の感情等の情緒的な情報、話者の
情報等非言語的な情報の伝達も可能な自動通訳装置を提
供することにある。
本第1の発明によるとある言語の音声をこれと同一また
は他の言語の音声に変換する自動通訳装置において、入
力音声から情緒情報を抽出する手段と、通訳された前記
入力音声に対応する音声の合成を前記情緒情報を用いて
行なう手段とを有することを特徴とする自動通訳装置が
得られる。
本第2の発明によるとある言語の音声をこれと同一また
は他の言語の音声に変換する自動通訳装置において、入
力音声から情緒情報および話者の声道形状情報を抽出す
る手段と、通訳された前記入力音声に対応する音声の合
成を前記情緒情報および前記話者の声道形状情報を併用
して行なう手段とを有することを特徴とする自動通訳装
置が得られる。
すなわち本発明は入力音声より抽出された発声速度に関
する情報、ピッチ周波数変化等の抑揚情報等の情緒的な
情報、更には発声者の声道形状に関する情報を翻訳され
た単語、文章等の音声合成の際に制御パラメータとして
用いることにある。
従って、本発明によれば、言語情報のみでなく非言語的
な情報の伝達も可能となるという効果がある。
一般に、音声における情緒情報はピッチ周波数あるいは
振幅の比較的グロスな変化、あるいは発声速度の変化に
主に含まれていることが知られており、この性質は異な
った言語間でもほぼ共通している。
従って、例えば入力音声から周知の方式によりピッチ抽
出、振幅値抽出7発声速度抽出を行ない、翻訳された音
声の合成の際にこれらの情報を用いて音声合成を行なえ
ば、入力音声の感情に比較的近い音声が得られることは
明らかである。
ピッチに関するデータとしては例えば、各単語の平均的
なピッチの値および変化幅を用いることができる。また
、発声速度については、例えば、認識された単語の時間
長を音素数で割ることにより音素の平均的な時間長(発
声速度の逆数)を算出し翻訳された言葉の合成の際に用
いれば良い。
更に、話者に関する情報は前記ピッチ周波数変化および
声道の形状に主に含まれるが、話者の声道形状に関する
情報はホルマント周波数に含まれており、声道長が変わ
るとホルマント周波数が全体的にシフトすることが知ら
れている。従って入力音声のホルマント抽出を用いない
声道長を算出して声道形状情報として用いることができ
る。この際、音素データを用いればより正確に声道形状
情報の抽出を行なうことができることは明らかである。
次に図面を用いて本発明の実施例を詳細に説明する。第
1図は本第1の発明の一実施例を示すブロック図である
才ず発声者の音声波形を示す信号が音声波形入力端子1
を介して分析部102内のホルマント抽出回路2.有声
無声判別回路3.振幅データ抽出回路4およびピッチ抽
出回路5にそれぞれ入力される。ホルマント抽出回路2
は前記音声波形よりホルマントパラメータ値を抽出し、
音声認識部103内のセグメンテーション回路6に出力
する。
音声波形からホルマントパラメータ値を抽出する方式は
例えば下記資料に詳しいのでここでは説明を省略する。
伏木田「自己相関領域での逆フィルタリングを用いたホ
ルマントの多段推定方式」日本音響学会音声研究会資料
、S 81−41(1981−10) )また、有声無声判別回路3およびピッチ抽出回路5は
前記音声波形の有声無声の判別およびピッチの抽出を行
ない、有声無声データおよびピッチデータとしてセグメ
ンテーション回路6およびピッチパターンデータ算出回
路10にそれぞれ出力する。振幅データ抽出回路4は前
記音声波形の瞬時振幅値の短時間区間の平均電力値の平
方根を振幅データとして算出し、セグメンテーション回
路6および平均振幅値算出回路9に出力する。
音声認識部103内のセグメンテーション回路6は前記
ホルマントパラメータ値、有声無声データおよび振幅デ
ータに従って入力音声のセグメンテーションを行ない、
各セグメント毎に該当するホルマントパラメータ値、有
声無声データ、振幅データおよびセグメントの時間長デ
ータを単語認識回路7に出力するとともに、セグメント
の時間長データを発声速度算出回路8に出力する。
単語認識回路7は前記セグメント回路6の出力に従って
単語の認識を行ない、認識結果を自動翻訳装置100に
出力するとともに、単語の境界データを発声速度算出回
路8.平均振幅値算出回路9、およびピッチパターンデ
ータ算出回路10に出力する。
セグメンテーションの方式および単語認識の方式罠つい
ては例えば下記文献に詳しいのでここでは説明を省略す
る。新美[音声認RJ情報料学構座E・19・3.昭和
55年共立出版株式会社発行、 一方、発声速度算出回路8は前記各甚グメントの時間長
データと、前記単語の境界データに従って該単語内にお
ける発声速度データを生成し、自動翻訳装置100に出
方する。平均娠幅値算出回路9は前記振幅データと、前
記単語の境界データに従って該単語内の平均振幅値を算
出し、平均振幅データとして自動翻訳装置100に出力
する。
壕だ、ピッチバター/データ算出回路1oは前記ビッチ
データと、前記単語の境界データに従って該単語内にお
けるビッチデータの平均値および最大値と最小値の差分
値(変化幅)を算出し、ピッチパターンデータとして自
動翻訳装置1()OK出力する。
自動翻訳装置100はまず音声認識部103内の単語認
識回路7より出方される前記単語認識結果を、辞書メモ
リ101に格納されている入力された音声の言語(言語
A)と翻訳されるべき言語(言語B)間の単語辞書を参
照して、言語Bの単語列に変換し、単語列を表わす文字
列を合成データ編集回路12.振幅データ生成回路13
およびピッチパターン生成回路14に出方する。
更に自動翻訳装置100は翻訳された言語Bの単語の文
字列の出力に同期でせて、対応する発声速度データを合
成データ編集回路12.振幅データ生成回路13.ピッ
チパターン生成回路14に出力するとともに、対応する
平均振幅データおよびピッチバター/データを振幅デー
タ生成回路13およびピッチパターン生成回路14にそ
れぞれ出力する。
次に翻訳でれた言語Bの音声合成方式について説明する
。合成データ編集回路12は前記言語Bの文字列に従っ
て合成データメモリ11に記憶されているホルマント等
の合成データの中から該当する合成データを読み出し、
これらの合成データを前記発声速度データに従って編集
合成し、合成テーク系列として音声合成回路104に出
力する。
一方、振幅データ生成回路13は前記文字列。
前記平均振幅データおよび前記発声速度データに従って
音源波形の振幅パターン値を生成し、音源波形生成回路
15に出力する。また、ピッチパターン生成回路14は
前記文字列、前記ピッチバター/データおよび前記発声
速度データに従って前記平均値と変化幅を有するピッチ
パターン値を生成し、音源波形生成回路15に出力する
音源波形生成回路15は前記振幅パターン値および前記
ピッチパターン値に従って音源波形を生成し、音声合成
回路104に出力する。音声合成回路104は前記合成
データ系列および前記音源波形に従って音声波形を合成
し、音声波形出力端子16’e介して出力する。
以上の実施例の説明においては入力音声の話者の声道形
状に関しては考慮されていなかったが、次に話者の声道
形状も考慮に入れ、より正確に話者に関する情報伝達が
可能な本館2の発明の自動通訳装置の実施例を第2図を
用いて説明する。
第2図において、声道データ算出回路17とホルマント
データ調整回路18以外の各部の動作は基本的に全く同
様であり、データの入出力が一部変更されているだけで
ある。第2図における実施例においては、まず、声道デ
ータ算出回路17が音声認識部103内のセグメンテー
ンヨ7回路6から出力される前記入力音声に対するホル
マントデータと単語認識回路7から出力される前記単語
認識結果を用いて声道形状データの算出を行ない、自動
翻訳装置100を介して言語Bの対応する単語の音声合
成時に、ホルマントデータ調整回路18に出力する。ホ
ルマントデータ調整回路18は前記合成データ系列のう
ちホルマントデータに対して、前記声道形状データに従
ってホルマント周波数の変換(シフト)を行ない音声合
成回路104に出力する。
音声合成回路104は前記変換されたホルマントデータ
および前記音源波形に従って音声波形を合成し音声波形
出力端子16を介して出力する。
以上述べた第2図における実施例によれば話者に関する
情報もより正確に伝達されるようになることは明らかで
ある。
以上述べた実施例においては自動翻訳装置によって言語
Aから言語Bに翻訳するものとして説明したが、特殊な
場合として言語Aと言語Bとを一致させて(すなわち翻
訳しないで)用いることも可能であり、単なる音声の情
報量圧縮伝送(低ビツトレート伝送)装置としても有効
に用いることができることは明らかである。
本発明によると、以上説明したように自動通訳装置にお
いて言語情報のみでなく、非言語的な情報の伝達も可能
となる効果がある。
【図面の簡単な説明】
第1図および第2図は本館1および第2の発明の実施例
を示すブロック図である。図において、1・・・・・・
音声波形入力端子、2・・・・・・ホルマント抽出回路
、3・・・・・・有声無声判別回路、4・・川・振幅デ
ータ抽出回路、5・・・・・・ピッチ抽出回路、6・・
・・・・セグメンテーション回路、7・・・・・・単語
認識回路、8・・・・・・発声速度算出回路、9・・・
・・・平均振幅値算出回路、10・・・・・・ピッチパ
ターンデータ算出回路、11・・・・・・合成データメ
モリ、12・・・・・・合成データ編集回路、13・・
・・・・振幅データ生成回路、14・・・・・・ピッチ
パターン生成回路、15・・・・・・音源波形生成回路
、16・・・・・・音声波形出力端子、17・・・・・
・声道データ算出回路、18・・・・・・ホルマントデ
ータ調整回路、100・・・・・・自動翻訳装置、10
1・・・・・・・辞書メモリ、102・・・・・・分析
部、103・・・・・・音声認識部、104・・・・・
・音声合成回路。

Claims (1)

  1. 【特許請求の範囲】 1、ある言語の音声をこれと同一または他の言語の音声
    に変換する自動通訳装置において、入力音声から情緒情
    報を抽出する手段と、通訳された前記入力音声に対応す
    る音声の合成を前記情緒情報を用いて行なう手段とを有
    することを特徴とする自動通訳装置。 2、ある言語の音声をこれと同一または他の言語の音声
    に変換する自動通訳装置において、入力音声から情緒情
    報および話者の声道形状情報を抽出する手段と、通訳さ
    れた前記入力音声に対応する音声の合成を前記情緒情報
    および前記話者の声道形状情報を併用して行なう手段と
    を有することを%徴とする自動通訳装置。
JP59001645A 1984-01-09 1984-01-09 自動通訳装置 Pending JPS60144799A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59001645A JPS60144799A (ja) 1984-01-09 1984-01-09 自動通訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59001645A JPS60144799A (ja) 1984-01-09 1984-01-09 自動通訳装置

Publications (1)

Publication Number Publication Date
JPS60144799A true JPS60144799A (ja) 1985-07-31

Family

ID=11507252

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59001645A Pending JPS60144799A (ja) 1984-01-09 1984-01-09 自動通訳装置

Country Status (1)

Country Link
JP (1) JPS60144799A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02106799A (ja) * 1988-10-14 1990-04-18 A T R Shichiyoukaku Kiko Kenkyusho:Kk 合成音声情緒付与回路
JPH02236600A (ja) * 1989-03-10 1990-09-19 A T R Shichiyoukaku Kiko Kenkyusho:Kk 合成音声情緒付与回路

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5757375A (en) * 1981-08-06 1982-04-06 Noriko Ikegami Electronic translator
JPS5774799A (en) * 1980-10-28 1982-05-11 Sharp Kk Word voice notifying system
JPS57122497A (en) * 1980-12-30 1982-07-30 Tokuko Ikegami Voice input/output apparatus
JPS58142479A (ja) * 1982-02-18 1983-08-24 Noriko Ikegami 電子翻訳装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5774799A (en) * 1980-10-28 1982-05-11 Sharp Kk Word voice notifying system
JPS57122497A (en) * 1980-12-30 1982-07-30 Tokuko Ikegami Voice input/output apparatus
JPS5757375A (en) * 1981-08-06 1982-04-06 Noriko Ikegami Electronic translator
JPS58142479A (ja) * 1982-02-18 1983-08-24 Noriko Ikegami 電子翻訳装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02106799A (ja) * 1988-10-14 1990-04-18 A T R Shichiyoukaku Kiko Kenkyusho:Kk 合成音声情緒付与回路
JPH02236600A (ja) * 1989-03-10 1990-09-19 A T R Shichiyoukaku Kiko Kenkyusho:Kk 合成音声情緒付与回路

Similar Documents

Publication Publication Date Title
US5327498A (en) Processing device for speech synthesis by addition overlapping of wave forms
US5400434A (en) Voice source for synthetic speech system
EP0140777B1 (en) Process for encoding speech and an apparatus for carrying out the process
JP4536323B2 (ja) 音声−音声生成システムおよび方法
US7010488B2 (en) System and method for compressing concatenative acoustic inventories for speech synthesis
JPH031200A (ja) 規則型音声合成装置
EP0239394B1 (en) Speech synthesis system
KR100373329B1 (ko) 음운환경과 묵음구간 길이를 이용한 텍스트/음성변환 장치 및그 방법
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JPH08335096A (ja) テキスト音声合成装置
CA2343071A1 (en) Device and method for digital voice processing
JPS60144799A (ja) 自動通訳装置
JP2536169B2 (ja) 規則型音声合成装置
JP2021148942A (ja) 声質変換システムおよび声質変換方法
JP2001034284A (ja) 音声合成方法及び装置、並びに文音声変換プログラムを記録した記録媒体
JPH05224689A (ja) 音声合成装置
JPH0258640B2 (ja)
JPS62102294A (ja) 音声符号化方式
JPS63131191A (ja) 規則型音声合成装置
Crystal et al. Segmental durations in connected speech signals
Razak et al. A preliminary speech analysis for recognizing emotion
Lienard An over-view of speech synthesis
JPS63285597A (ja) 音素接続形パラメ−タ規則合成方式
JPS63262699A (ja) 音声分析,合成装置
JPS58168096A (ja) 複数言語音声合成装置