JP2000099100A - 音声変換装置 - Google Patents

音声変換装置

Info

Publication number
JP2000099100A
JP2000099100A JP10272052A JP27205298A JP2000099100A JP 2000099100 A JP2000099100 A JP 2000099100A JP 10272052 A JP10272052 A JP 10272052A JP 27205298 A JP27205298 A JP 27205298A JP 2000099100 A JP2000099100 A JP 2000099100A
Authority
JP
Japan
Prior art keywords
voice
fundamental frequency
input
power
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10272052A
Other languages
English (en)
Inventor
Kiyo Hara
紀代 原
Kenji Matsui
謙二 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Technology Research Association of Medical and Welfare Apparatus
Original Assignee
Technology Research Association of Medical and Welfare Apparatus
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Technology Research Association of Medical and Welfare Apparatus filed Critical Technology Research Association of Medical and Welfare Apparatus
Priority to JP10272052A priority Critical patent/JP2000099100A/ja
Publication of JP2000099100A publication Critical patent/JP2000099100A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】咽頭摘出手術を受けた人の発声を助けるための
従来の音声変換装置は十分明瞭な発声が獲得出来ない。 【解決手段】 音声を一定周期毎に分析する手段2と、
音声のパワーを計算する手段4と、パワー情報から基本
周波数情報を作成する手段6と、基本周波数を用いて音
声を再合成する手段8、11とを備え、話者毎に決定さ
れている、F0max:基本周波数の最大値(Hz) F0min:基本周波数の最小値(Hz) Amax :振幅の最大値(dB) Amin :振幅の最小値(dB) COF:(F0max−F0min)/(Amax−Amin):係数 を前提として、AMP:そのフレームの振幅の値(d
B) F0:求めるべき基本周波数値として、 【数1】AMP<Amin の時 F0=0 Amin <AMP<Amax の時 F0=COF*(AMP
−Amin)+F0min Amax <AMP の時 F0=F0maxで、基本
周波数を求める。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された音声に
処理を施し、明瞭性や聞きやすさを向上させて出力する
音声変換装置に関するものである。
【0002】
【従来の技術】喉頭ガンによる咽頭摘出手術を受けた患
者は、声を失ってしまうが、声帯の代わりに食道を振動
させて発声する食道発声法を訓練することにより、発声
が可能となる。しかしながら、食道発声された音声に
は、以下のような問題点がある。
【0003】・呼気の量が不十分なため、大きな声がで
ない、かすれ声になってしまう。
【0004】・基本周波数が低く、乱れている。
【0005】・明確なアクセントやイントネーションを
付与することができない。
【0006】・気孔音などのノイズが多い。
【0007】これらの多くは、音源生成器官としての声
帯が存在しないことに起因する。そのため、デジタル音
声処理を利用して、健常者の音源(もしくは本人の喉頭
摘出手術以前の音声から抽出した音源)に置き換えて再
合成を行なう方法が提案されている(松井他:ホルマン
ト合成を用いた食道発声補助方式の検討:日本音響学会
春季全国大会 1-Q-7(1997.03))。 この分析再合成方式
を利用するためには、基本周波数情報が必要不可欠とな
る。
【0008】次に図8を用いて、分析再合成を用いた従
来の音声変換装置の構成について説明する。1は音声入
力端で、入力された音声は、線形予測分析部2、基本周
波数抽出・補正部3およびパワー計算部4において、一
定時間(フレーム)毎に線形予測係数および振幅情報が
求められる。この分析結果を用いて、V/UV判定部7
において、有声/無声/無音の判定を行い、無声および
無音の場合は、子音波形切り出し部9において、そのフ
レームの音声波形を切り出し、波形接続部12に送る。
有声/無声/無音判定結果が有声の場合には、あらかじ
め音源波形が記憶されている音源記憶部10から音源情
報を取り出し、音源生成部8で、パワー情報および基本
周波数情報に基づいて音源波形を生成する。ホルマント
抽出・補正部5では、線形予測係数よりホルマント周波
数およびバンド幅を求める。音声合成フィルタ11で
は、ホルマント周波数・バンド幅および音源波形を入力
として音声合成処理を行なう。波形接続部12では、再
合成された波形(有声部)、入力音声より切り出された
波形(無声/無音部)の接続を行ない、音声出力端13
に声質を変換した波形を得る。
【0009】
【発明が解決しようとする課題】ところで、このような
分析再合成系においては、基本周波数、V/UV判定、
ホルマント周波数など各パラメータの抽出誤りが、合成
音の音質劣化の要因となるが、特に基本周波数の抽出誤
りが与える影響は大きい。ところが、前述したように、
食道発声音声の基本周波数抽出は非常に困難である。図
9(a),(b)と図10(c)、(d)に「葵を植え
る」と発声した時の、食道発声(師範級)、食道発声
(一般)の原音波形、自己相関法による基本周波数抽出
して5点メディアンスムージングを行なった後の基本周
波数を示す。食道発声音声(特に一般)では、基本周波
数の値がばらばらであり、基本周波数抽出の困難さがわ
かる。食道発声音声でも、師範級の場合はかなりうまく
基本周波数をコントロールでき、基本周波数抽出可能な
食道発声者もいるが、一般的に基本周波数抽出は難し
い。また師範級の方の場合でも、体調の悪い時など基本
周波数制御がうまくできない場合もある。
【0010】本発明は、前記従来技術の項で説明した基
本周波数抽出ミスによる合成の劣化という課題に鑑み、
食道発声音声の明瞭性・音質を改善できる音声変換装置
を提供することを目的とする。
【0011】
【課題を解決するための手段】請求項1の本発明は、音
声を入力し、別の音声に変換する音声変換装置におい
て、音声を入力する音声入力手段と、入力された音声を
一定周期毎に分析する音声分析手段と、その入力された
音声のパワーを計算するパワー計算手段と、前記パワー
計算手段で計算されたパワー情報から基本周波数情報を
作成する基本周波数生成手段と、少なくともその生成さ
れた基本周波数を用いて音声を再合成する音声合成手段
とを備えたことを特徴とする音声変換装置である。
【0012】請求項2の本発明は、音声を入力し、別の
音声に変換する音声変換装置において、音声を入力する
音声入力手段と、入力された音声を一定周期毎に分析す
る音声分析手段と、入力された音声を帯域に分割して帯
域毎のパワーを計算する帯域パワー計算手段と、帯域パ
ワー計算手段で計算された帯域パワー情報から基本周波
数情報を作成する基本周波数生成手段と、少なくともそ
の生成された基本周波数を用いて音声を再合成する音声
合成手段とを備えたことを特徴とする音声変換装置であ
る。
【0013】請求項3の本発明は、音声を入力し、別の
音声に変換する音声変換装置において、音声を入力する
音声入力手段と、入力された音声を一定周期毎に分析す
る音声分析手段と、その音声分析手段での音声分析結果
を用いて逆フィルタ処理を行ない残差パワーを計算する
残差パワー計算手段と、その残差パワー計算手段で計算
された残差パワー情報から基本周波数情報を作成する基
本周波数生成手段と、少なくともその生成された基本周
波数を用いて音声を再合成する音声合成手段とを備えた
ことを特徴とする音声変換装置である。
【0014】請求項4の本発明は、音声を入力し、別の
音声に変換する音声変換装置において、音声を入力する
音声入力手段と、入力された音声を一定周期毎に分析す
る音声分析手段と、前記入力された音声から基本周波数
を抽出する基本周波数抽出手段と、前記入力された音声
のパワー又は帯域パワーを計算するパワー計算手段と、
その計算されたパワー情報から擬似基本周波数を作成す
る基本周波数生成手段と、前記抽出された基本周波数
と、前記生成された擬似基本周波数のどちらを使用する
かを使用者が決定する決定手段と、その決定された基本
周波数又は疑似基本周波数を少なくとも用いて音声を再
合成する音声合成手段とを備えたことを特徴とする音声
変換装置である。
【0015】請求項5の本発明は、音声を入力し、別の
音声に変換する音声変換装置において、音声を入力する
音声入力手段と、入力された音声を一定周期毎に分析す
る音声分析手段と、前記入力された音声から基本周波数
を抽出する基本周波数抽出手段と、前記音声分析手段で
の音声分析結果を用いて逆フィルタ処理を行ない残差パ
ワーを計算する残差パワー計算手段と、その残差パワー
計算手段で計算された残差パワー情報から擬似基本周波
数を作成する基本周波数生成手段と、前記抽出された基
本周波数と、前記生成された擬似基本周波数のどちらを
使用するかを使用者が決定する決定手段と、その決定さ
れた基本周波数又は疑似基本周波数を少なくとも用いて
音声を再合成する音声合成手段とを備えたことを特徴と
する音声変換装置である。
【0016】請求項6の本発明は、音声を入力し、別の
音声に変換する音声変換装置において、音声を入力する
音声入力手段と、入力された音声を一定周期毎に分析す
る音声分析手段と、前記入力された音声から基本周波数
を抽出する基本周波数抽出手段と、前記入力された音声
のパワー又は帯域パワーを計算するパワー計算手段と、
その計算されたパワー情報から擬似基本周波数を作成す
る基本周波数生成手段と、前記抽出された基本周波数
と、前記生成された擬似基本周波数のどちらを使用する
かを、前記入力された音声の状態によって選択する選択
手段と、その選択された基本周波数又は疑似基本周波数
を少なくとも用いて音声を再合成する音声合成手段とを
備えたことを特徴とする音声変換装置である。
【0017】請求項7の本発明は、音声を入力し、別の
音声に変換する音声変換装置において、音声を入力する
音声入力手段と、入力された音声を一定周期毎に分析す
る音声分析手段と、前記入力された音声から基本周波数
を抽出する基本周波数抽出手段と、前記音声分析手段で
の音声分析結果を用いて逆フィルタ処理を行ない残差パ
ワーを計算する残差パワー計算手段と、その残差パワー
計算手段で計算された残差パワー情報から擬似基本周波
数を作成する基本周波数生成手段と、前記抽出された基
本周波数と、前記生成された擬似基本周波数のどちらを
使用するかを、前記入力された音声の状態によって選択
する選択手段と、その選択された基本周波数又は疑似基
本周波数を少なくとも用いて音声を再合成する音声合成
手段とを備えたことを特徴とする音声変換装置である。
【0018】
【発明の実施の形態】以下に本発明の実施の形態を図面
を参照しながら説明する。 (実施の形態1)図1は、請求項1に記載の本発明の1
実施の形態の構成図である。1は音声入力端で、入力さ
れた音声は、線形予測分析部2およびパワー計算部4に
おいて一定時間(フレーム)毎に線形予測係数および振
幅情報が求められる。この分析結果を用いて、V/UV
判定部7において、有声/無声/無音の判定を行い、無
声および無音の場合は、子音波形切り出し部9におい
て、そのフレームの音声波形を切り出し、波形接続部1
2に送る。
【0019】有声/無声/無音判定結果が有声の場合に
は、基本周波数生成部6で、振幅情報から基本周波数情
報を生成する。機能については、後に詳述する。そして
音源生成部8で、あらかじめ音源波形が記憶されている
音源記憶部10から音源情報を取り出し、パワー情報お
よび基本周波数情報に基づいて音源波形を生成する。ホ
ルマント抽出・補正部5では、線形予測係数よりホルマ
ント周波数およびバンド幅を求める。
【0020】音声合成フィルタ11では、ホルマント周
波数・バンド幅および音源波形を入力として音声合成処
理を行なう。波形接続部12では、再合成された波形
(有声部)、入力音声より切り出された波形(無声/無
音部)の接続を行ない、音声出力端13に声質を変換し
た波形を得る。
【0021】次に、基本周波数生成部7の機能について
説明する。まず以下のパラメータをを話者毎に決定す
る。
【0022】F0max:基本周波数の最大値(Hz) F0min:基本周波数の最小値(Hz) Amax :振幅の最大値(dB) Amin :振幅の最小値(dB)/この値より小さい場合無音
フレームと判定される。
【0023】COF:(F0max−F0min)/(Amax−
Amin) :係数 次に、これらの値を用いて以下の式で、基本周波数を求
める。
【0024】AMP:そのフレームの振幅の値(dB) F0:求めるべき基本周波数値
【0025】
【数1】AMP<Amin の時 F0=0 Amin <AMP<Amax の時 F0=COF*(AMP
−Amin)+F0min Amax <AMP の時 F0=F0max 図2(a)、(b)、(c)と図3(d),(e)に、
食道発声音声波形、振幅情報、基本周波数情報および、
F0max=160、F0min=60、Amax=70、Amin=35 とし
た時の振幅情報から作成した基本周波数情報を示す。基
本周波数抽出は、うまく行なえていないが、振幅情報よ
り基本周波数値を求めることにより、滑らかな基本周波
数パタンが得られている。
【0026】このように本発明によれば、基本周波数抽
出のための処理が不要となるだけでなく、基本周波数抽
出誤りによる合成音の劣化を回避することができ、再合
成音の品質を安定させることができる。
【0027】(実施の形態2)図4は、請求項2に記載
の本発明の実施の形態の構成図である。発明の実施の形
態1と同機能のものには、同じ番号を付与して、説明を
割愛する。実施の形態1のブロック図に加えて、帯域パ
ワー計算部14が存在する。帯域パワー計算部14は、
バンドパスフィルタ、もしくはローパスフィルタによっ
て、入力波形の帯域制限を行い、基本周波数が存在する
と考えられる低域パワーより、実施の形態1と同様の手
法で、基本周波数情報を作成するものである。本実施の
形態では、カットオフ周波数500Hzのローパスを行な
うものとする。このようにして得られた帯域パワーを用
いて、基本周波数生成部6で、基本周波数情報を作成す
る。作成に用いる式は、実施の形態1と同様とするが、
Amax、Amin(振幅の最大値、最小値)は、帯域パワー
の最大値、最小値として設定されるものとする。
【0028】このように、本発明によれば、実施の形態
1の効果に加えて、基本周波数を含む帯域のエネルギー
を用いて基本周波数パタンの生成を行なうので、全帯域
のパワーを用いる場合より、実際の基本周波数に近い制
御を行なうことができる。
【0029】なお、本実施の形態では、帯域パワー計算
部とは別に、パワー計算部(全帯域パワー)を有する構
成として、V/UV判定において全帯域パワーを用いた
が、全帯域パワー計算部を廃して、帯域パワーを用いて
V/UV判定を行なうことも可能である。(実施の形態
3)図5は、請求項3に記載の本発明の実施の形態の構
成図である。発明の実施の形態1と同機能のものには、
同じ番号を付与して、説明を割愛する。実施の形態1の
ブロック図に加えて、残差パワー計算部(逆フィルタ処
理部)が存在する。残差パワーは、ホルマント抽出・補
正部5で得られた、ホルマント・バンド幅を用いて、入
力音声の逆フィルタ処理を行なうことによって得られ
る。なお逆フィルタ処理手法は既に公知の技術である。
声道の周波数特性の予測が完全に行われた場合、残差
は、声帯情報を示す音源波形となる。一般に音声波形か
ら得られるパワーは、唇の放射特性の影響を受けて母音
種類による差(例えば、「い」のパワーは「あ」のパワ
ーに比べて小さいといった)が観察されるが、残差パワ
ーはこのような音韻の種類にによる影響を排除して、声
帯振動のパワーを捕らえることができる。このようにし
て得られた残差パワーを用いて、基本周波数生成部6
で、基本周波数情報を作成する。作成に用いる式は、実
施の形態1と同様とするが、Amax、Amin(振幅の最大
値、最小値)は、残差パワーの最大値、最小値として設
定されるものとする。なお、残差パワーについては、上
述のように、ホルマント・バンド幅を用いる必要は必ず
しもなく、その代わりに、線形予測分析部2による分析
結果と、入力音声とを利用して残差パワーを算出するこ
ともできる。 このように、本発明によれば、実施の形
態1の効果に加えて、母音種類によるパワーの差を排除
した残差パワーをを用いて基本周波数パタンの生成を行
なうので、全帯域のパワーを用いる場合より、実際の基
本周波数に近い制御を行なうことができる。
【0030】なお、本実施の形態では、残差パワー計算
部とは別に、パワー計算部(全帯域パワー)を有する構
成として、V/UV判定において全帯域パワーを用いた
が、全帯域パワー計算部を廃して、帯域パワーを用いて
V/UV判定を行なうことも可能である。 (実施の形態4)図6は、請求項4に記載の本発明の実
施の形態の構成図である。発明の実施の形態1と同機能
のものには、同じ番号を付与して、説明を割愛する。実
施の形態1のブロック図に加えて、基本周波数分析部3
および基本周波数選択スイッチ16が存在する。基本周
波数選択スイッチ16を用いて、比較的基本周波数抽出
可能な話者の場合は、分析によって得られた基本周波数
を用いて合成し、基本周波数抽出が困難な話者の場合に
は、振幅から生成した擬似基本周波数を用いて合成す
る。基本周波数選択スイッチ16はあらかじめ話者毎に
設定しておく。
【0031】このように、本発明によれば、基本周波数
抽出可能な話者の場合には、分析した基本周波数を用い
ることができ、ユーザのレベルに合わせた音声変換装置
を提供することができる。 (実施の形態5)図7は、請求項5に記載の本発明の実
施の形態の構成図である。発明の実施の形態1と同機能
のものには、同じ番号を付与して、説明を割愛する。実
施の形態1のブロック図に加えて、基本周波数分析部3
および基本周波数選択部17が存在する。基本周波数選
択部17では、振幅、基本周波数抽出時の自己相関係数
値などを用いて、抽出された基本周波数に信頼性を付与
し、信頼性の高いところでは、抽出された基本周波数
を、低いところでは、振幅より生成した擬似基本周波数
を用いて合成する。使用者のオリジナルの基本周波数を
出来る限り残した食道発声補助装置を提供する。
【0032】このように、本発明によれば、可能な限
り、使用者のオリジナルの基本周波数基本周波数を用い
ることができ、かつ、基本周波数の抽出ミスによる劣化
を押さえた音声変換装置を提供することができる。
【0033】本実施の形態では、一例としてホルマント
分析合成系を用いた場合について説明したが、これは本
発明を何ら拘束するものではなく、PARCOR分析合
成方式などすべての分析合成手法が利用できる。また、
振幅情報から基本周波数情報を生成する手法について
も、本実施の形態は線形変換を用いたが、これも本発明
を拘束するものではない。
【0034】なお、本発明の各手段が有する全部又は一
部の機能は、コンピュータを用いてソフトウェア的に実
現してもよいし、それぞれの機能専用の回路、機器を用
いて実現してもかまわない。
【0035】また、本発明は、本発明の音声変換装置に
おける、各手段が有する全部又は一部の機能をコンピュ
ータで実現するためのプログラムを格納したROMなど
のプログラム格納媒体でもある。
【0036】
【発明の効果】以上のように本発明によれば、食道発声
音声の明瞭度・聞き易さを大きく改善することができ
る。
【図面の簡単な説明】
【図1】本発明実施の形態1の音声変換装置の構成図
【図2】本発明実施の形態1における入力波形、分析結
果等を示す図の一部 (a)入力波形(食道発声) (b)自己相関方によるピッチ抽出結果(5点メディアン
スムージング処理後) (c)振幅情報(5点メディアンスムージング処理後)
【図3】本発明実施の形態1における入力波形、分析結
果等を示す図の一部 (d)振幅から作成した基本周波数情報を用いた再合成音
声波形 (e)振幅から作成した基本周波数情報
【図4】本発明実施の形態2の音声変換装置の構成図
【図5】本発明実施の形態3の音声変換装置の構成図
【図6】本発明実施の形態4の音声変換装置の構成図
【図7】本発明実施の形態5の音声変換装置の構成図
【図8】従来例の音声変換装置の構成図
【図9】食道発声音声の自己相関法による基本周波数抽
出の一例を示した図の一部 (a)入力波形(食道発声・師範レベル) (b)(a)より抽出した基本周波数
【図10】食道発声音声の自己相関法による基本周波数
抽出の一例を示した図の一部 (c)入力波形(食道発声・中級) (d)(c)より抽出した基本周波数
【符号の説明】
1 音声入力端(マイク) 2 線形予測分析部 3 基本周波数抽出部 4 パワー計算部 5 ホルマント抽出・補正部 6 基本周波数生成部 7 V/UV判定部 8 音源生成部 9 子音波形切り出し部 10 音源記憶部 11 音声合成フィルタ 12 波形接続部 13 音声出力端(スピーカ) 14 帯域パワー計算部 15 残差パワー計算部 16 基本周波数選択SW設定部 17 基本周波数選択部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力し、別の音声に変換する音声
    変換装置において、音声を入力する音声入力手段と、入
    力された音声を一定周期毎に分析する音声分析手段と、
    その入力された音声のパワーを計算するパワー計算手段
    と、前記パワー計算手段で計算されたパワー情報から基
    本周波数情報を作成する基本周波数生成手段と、少なく
    ともその生成された基本周波数を用いて音声を再合成す
    る音声合成手段とを備えたことを特徴とする音声変換装
    置。
  2. 【請求項2】 音声を入力し、別の音声に変換する音声
    変換装置において、音声を入力する音声入力手段と、入
    力された音声を一定周期毎に分析する音声分析手段と、
    入力された音声を帯域に分割して帯域毎のパワーを計算
    する帯域パワー計算手段と、帯域パワー計算手段で計算
    された帯域パワー情報から基本周波数情報を作成する基
    本周波数生成手段と、少なくともその生成された基本周
    波数を用いて音声を再合成する音声合成手段とを備えた
    ことを特徴とする音声変換装置。
  3. 【請求項3】 音声を入力し、別の音声に変換する音声
    変換装置において、音声を入力する音声入力手段と、入
    力された音声を一定周期毎に分析する音声分析手段と、
    その音声分析手段での音声分析結果を用いて逆フィルタ
    処理を行ない残差パワーを計算する残差パワー計算手段
    と、その残差パワー計算手段で計算された残差パワー情
    報から基本周波数情報を作成する基本周波数生成手段
    と、少なくともその生成された基本周波数を用いて音声
    を再合成する音声合成手段とを備えたことを特徴とする
    音声変換装置。
  4. 【請求項4】 音声を入力し、別の音声に変換する音声
    変換装置において、音声を入力する音声入力手段と、入
    力された音声を一定周期毎に分析する音声分析手段と、
    前記入力された音声から基本周波数を抽出する基本周波
    数抽出手段と、前記入力された音声のパワー又は帯域パ
    ワーを計算するパワー計算手段と、その計算されたパワ
    ー情報から擬似基本周波数を作成する基本周波数生成手
    段と、前記抽出された基本周波数と、前記生成された擬
    似基本周波数のどちらを使用するかを使用者が決定する
    決定手段と、その決定された基本周波数又は疑似基本周
    波数を少なくとも用いて音声を再合成する音声合成手段
    とを備えたことを特徴とする音声変換装置。
  5. 【請求項5】 音声を入力し、別の音声に変換する音声
    変換装置において、音声を入力する音声入力手段と、入
    力された音声を一定周期毎に分析する音声分析手段と、
    前記入力された音声から基本周波数を抽出する基本周波
    数抽出手段と、前記音声分析手段での音声分析結果を用
    いて逆フィルタ処理を行ない残差パワーを計算する残差
    パワー計算手段と、その残差パワー計算手段で計算され
    た残差パワー情報から擬似基本周波数を作成する基本周
    波数生成手段と、前記抽出された基本周波数と、前記生
    成された擬似基本周波数のどちらを使用するかを使用者
    が決定する決定手段と、その決定された基本周波数又は
    疑似基本周波数を少なくとも用いて音声を再合成する音
    声合成手段とを備えたことを特徴とする音声変換装置。
  6. 【請求項6】 音声を入力し、別の音声に変換する音声
    変換装置において、音声を入力する音声入力手段と、入
    力された音声を一定周期毎に分析する音声分析手段と、
    前記入力された音声から基本周波数を抽出する基本周波
    数抽出手段と、前記入力された音声のパワー又は帯域パ
    ワーを計算するパワー計算手段と、その計算されたパワ
    ー情報から擬似基本周波数を作成する基本周波数生成手
    段と、前記抽出された基本周波数と、前記生成された擬
    似基本周波数のどちらを使用するかを、前記入力された
    音声の状態によって選択する選択手段と、その選択され
    た基本周波数又は疑似基本周波数を少なくとも用いて音
    声を再合成する音声合成手段とを備えたことを特徴とす
    る音声変換装置。
  7. 【請求項7】 音声を入力し、別の音声に変換する音声
    変換装置において、音声を入力する音声入力手段と、入
    力された音声を一定周期毎に分析する音声分析手段と、
    前記入力された音声から基本周波数を抽出する基本周波
    数抽出手段と、前記音声分析手段での音声分析結果を用
    いて逆フィルタ処理を行ない残差パワーを計算する残差
    パワー計算手段と、その残差パワー計算手段で計算され
    た残差パワー情報から擬似基本周波数を作成する基本周
    波数生成手段と、前記抽出された基本周波数と、前記生
    成された擬似基本周波数のどちらを使用するかを、前記
    入力された音声の状態によって選択する選択手段と、そ
    の選択された基本周波数又は疑似基本周波数を少なくと
    も用いて音声を再合成する音声合成手段とを備えたこと
    を特徴とする音声変換装置。
  8. 【請求項8】 前記各手段が有する全部又は一部の機能
    は、コンピュータを用いてソフトウェア的に実現される
    ことを特徴とする請求項1〜7のいずれかに記載の音声
    変換装置。
  9. 【請求項9】 前記基本周波数生成手段は、話者毎に決
    定されている、 F0max:基本周波数の最大値(Hz) F0min:基本周波数の最小値(Hz) Amax :振幅の最大値(dB) Amin :振幅の最小値(dB) COF:(F0max−F0min)/(Amax−Amin) :係
    数 を前提として、 AMP:そのフレームの振幅の値(dB) F0:求めるべき基本周波数値 として、 【数1】AMP<Amin の時 F0=0 Amin <AMP<Amax の時 F0=COF*(AMP
    −Amin)+F0min Amax <AMP の時 F0=F0max で、基本周波数を求め、 前記振幅は、前記計算されたパワー、帯域パワー、又は
    残差パワーの振幅であることを特徴とする請求項1〜8
    のいずれかに記載の音声変換装置。
  10. 【請求項10】 請求項1〜7のいずれかに記載の音声
    変換装置における、各手段が有する全部又は一部の機能
    をコンピュータで実現するためのプログラムを格納した
    ことを特徴とするプログラム格納媒体。
JP10272052A 1998-09-25 1998-09-25 音声変換装置 Pending JP2000099100A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10272052A JP2000099100A (ja) 1998-09-25 1998-09-25 音声変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10272052A JP2000099100A (ja) 1998-09-25 1998-09-25 音声変換装置

Publications (1)

Publication Number Publication Date
JP2000099100A true JP2000099100A (ja) 2000-04-07

Family

ID=17508449

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10272052A Pending JP2000099100A (ja) 1998-09-25 1998-09-25 音声変換装置

Country Status (1)

Country Link
JP (1) JP2000099100A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016002246A (ja) * 2014-06-17 2016-01-12 株式会社電制 電気式人工喉頭
JP2020140178A (ja) * 2019-03-01 2020-09-03 富士通クライアントコンピューティング株式会社 音声変換装置、音声変換システム及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016002246A (ja) * 2014-06-17 2016-01-12 株式会社電制 電気式人工喉頭
JP2020140178A (ja) * 2019-03-01 2020-09-03 富士通クライアントコンピューティング株式会社 音声変換装置、音声変換システム及びプログラム

Similar Documents

Publication Publication Date Title
JP3875513B2 (ja) デジタルに圧縮されたスピーチの了解度を向上させる方法および装置
JP4705203B2 (ja) 声質変換装置、音高変換装置および声質変換方法
KR101475894B1 (ko) 장애 음성 개선 방법 및 장치
US8311842B2 (en) Method and apparatus for expanding bandwidth of voice signal
US8996378B2 (en) Voice synthesis apparatus
JP4490507B2 (ja) 音声分析装置および音声分析方法
JP2005157363A (ja) フォルマント帯域を利用したダイアログエンハンシング方法及び装置
Raitio et al. Phase perception of the glottal excitation and its relevance in statistical parametric speech synthesis
JP2904279B2 (ja) 音声合成方法および装置
Lu et al. Glottal source modeling for singing voice synthesis.
JP5075865B2 (ja) 音声処理装置、方法、及びプログラム
JP2000099100A (ja) 音声変換装置
JP3197975B2 (ja) ピッチ制御方法及び装置
JP2008058379A (ja) 音声合成システム及びフィルタ装置
JP5745453B2 (ja) 音声明瞭度変換装置、音声明瞭度変換方法及びそのプログラム
JP2000003200A (ja) 音声信号処理装置及び音声信号処理方法
JP3289511B2 (ja) 音声合成用音源データ作成方法
Lehana et al. Speech synthesis in Indian languages
JP2000242287A (ja) 発声補助装置およびプログラム記録媒体
JP5723568B2 (ja) 話速変換装置及びプログラム
JP5677137B2 (ja) 韻律変換装置およびプログラム
JP4267954B2 (ja) 概周期信号生成方法、装置、それを用いた音声合成方法、装置、音声合成プログラムおよびその記録媒体
KR101567566B1 (ko) 개인 음색을 반영한 통계적 음성합성 시스템 및 방법
JP2000099094A (ja) 時系列信号処理装置
Hagmüller et al. Voice enhancement of male speakers with laryngeal neoplasm