JP2003345373A

JP2003345373A - 音声合成装置及び音声明瞭化方法

Info

Publication number: JP2003345373A
Application number: JP2002155683A
Authority: JP
Inventors: Yumiko Kato; 弓子加藤; Katsuyoshi Yamagami; 勝義山上
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2002-05-29
Filing date: 2002-05-29
Publication date: 2003-12-03
Anticipated expiration: 2022-05-29
Also published as: JP3921416B2

Abstract

(57)【要約】【課題】適切な強調帯域を自動的に設定し、合成
音声の明瞭度の向上を図ること。【解決手段】分離部１０２は音声波形から無声子音素
片を分離し、スペクトル抽出部１０３は無声子音素片か
ら音韻全体あるいは音韻の一部に対して時間平均したス
ペクトル分布を求める。フィルタ係数計算部１０４は、
スペクトル分布をｎ次関数で近似し、この近似曲線とス
ペクトル分布との差分を求めることにより、無声子音素
片の特徴を表すスペクトル特性を算出する。フィルタ１
０５は、そのスペクトル特性を伝達関数とするフィルタ
を構成し、素片のスペクトル分布に対してフィルタ処理
を施すことにより、スペクトル分布の特徴を強調する。
音声素片記憶部１０６は、強調された無声子音素片と処
理を施していない母音及び有声子音を素片として記憶
し、素片接続部１０７は、音声素片を接続することによ
り任意の音声を合成する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、テキストを音声に
変換する音声規則合成システムに用いられ、特に高齢
者、聴覚障害者に対する場合、あるいは騒音下で使用す
る場合に明瞭に音声伝達を行う音声合成装置及び音声明
瞭化方法に関する。

【０００２】

【従来の技術】テキストを音声に変換する音声規則合成
技術は、文字で伝送されてきた情報を人間にとってわか
りやすい形式で伝達する一つの手段として知られてい
る。特に端末が携帯用の小型端末である場合には、テキ
ストを音声に変換することが効果的である。

【０００３】従来の音声合成装置は、入力されたテキス
トを構文解析して読み情報、韻律情報を生成し、生成さ
れた読み情報に従って合成単位である音声素片を素片デ
ータベースより選択し、韻律情報に従って接続して合成
音声を生成する。

【０００４】音声素片はあらかじめ録音された音声の波
形からＣＶ、ＶＣＶ、ＣＶＣなどの単位で切り出して作
成される。ここで、Ｃは子音を、Ｖは母音を、各々あら
わす。いずれの単位で切り出された素片を用いるもので
あっても、音声素片を次々と接続していくことにより合
成音を生成する。

【０００５】ところが、このような音声合成装置は、合
成音は限られた音声素片を用いていることや、合成時の
接続処理や変形処理によって欠落している情報が多く、
騒音によるマスキングや聴覚障害の影響を受けやすい。
このため、騒音下での使用や聴覚に障害がある人が、こ
のような音声合成装置を使用すると、合成された音声が
聞き取りにくいという問題が指摘されている。

【０００６】これに対して、特開平１０−８３１９３号
公報において、使用者の聴覚特性に合わせて、音声合成
に使用する合成単位に特定の帯域の強調処理を施す、あ
るいは振幅のダイナミックレンジを圧縮する処理を施す
等の処理に関する技術が提案されている。

【０００７】ここで、音声明瞭化技術においては、素片
を作成しようとする音声毎、また、素片の音韻毎、場合
によっては素片毎に強調帯域を設定しなければならな
い。

【０００８】

【発明が解決しようとする課題】しかしながら、従来の
音声明瞭化技術においては、使用者や環境あるいは素片
用の音声に合わせた適切な強調帯域を自動的に設定する
方法が開示されていない。このため、強調帯域と強調度
合いの設定を人手で行わなければならず、多大な労力を
必要とするという問題がある。

【０００９】本発明はかかる点に鑑みてなされたもので
あり、適切な強調帯域を自動的に設定することができ、
合成音声の明瞭度の向上を図ることができる音声合成装
置及び音声明瞭化方法を提供することを目的とする。

【００１０】

【課題を解決するための手段】本発明の音声合成装置
は、音声波形から特定の音声素片を分離する分離手段
と、前記音声素片のスペクトルの特徴を強調するフィル
タ処理を行うフィルタ手段と、前記フィルタ手段にて処
理された音声素片を他の音声素片と接続して音声を合成
する素片接続手段とを具備する構成を採る。

【００１１】本発明の音声合成装置は、分離手段にて分
離された音声素片のスペクトルをｎ次関数で近似するこ
とにより近似曲線を計算し、前記音声素片のスペクトル
から前記近似曲線を差し引いて得られたスペクトル特性
を算出するフィルタ係数計算手段を具備し、フィルタ手
段は、前記スペクトル特性を伝達関数とするフィルタを
構成する構成を採る。

【００１２】これらの構成により、特定の音声素片毎に
スペクトル特性を求めて素片毎に最適な強調フィルタを
自動的に設定することができるため、各音声素片の特徴
に応じて的確にスペクトルを強調することが可能であ
り、録音音声に対して一定の強調フィルタ処理を施す場
合に明瞭度を大幅に向上させることができる。

【００１３】本発明の音声合成装置は、音声波形から複
数の音韻カテゴリを選び出す音韻カテゴリ判定手段と、
前記選び出された複数の音韻カテゴリの平均スペクトル
を計算する平均スペクトル計算手段と、前記平均スペク
トルをｎ次関数で近似することにより近似曲線を計算
し、前記平均スペクトルから前記近似曲線を差し引いて
得られたスペクトル特性を算出するフィルタ係数計算手
段を具備し、フィルタ手段は、前記スペクトル特性を伝
達関数とするフィルタを構成する構成を採る。

【００１４】この構成により、通常の発話だけでなく、
揺れのある発話や曖昧な発話についても、その音韻らし
い特徴を持った素片に修正することが可能となる。

【００１５】本発明の音声合成装置におけるフィルタ係
数計算手段は、音声素片のスペクトルの低域成分を除去
して近似曲線を計算する構成を採る。

【００１６】この構成により、音声波形データに含まれ
るバイアス成分などが現れていることが多い低域のスペ
クトルを除去することができ、スペクトル分布の特徴
（凹凸）を正しく抽出することができる。

【００１７】本発明の音声合成装置におけるフィルタ係
数計算手段は、所定の定数を乗算してスペクトル特性の
振幅を一様に拡大する構成を採る。

【００１８】この構成により、スペクトル強調の度合い
を強化することができ、雑音下でも聞き取りやすい音声
を提供することができる。

【００１９】本発明の音声合成装置におけるフィルタ係
数計算手段は、使用者の聴力曲線と健聴者の聴力曲線の
差である補償曲線をスペクトル特性に加算して新たなス
ペクトル特性とする構成を採る。

【００２０】この構成により、聴覚特性において個人差
が大きい高齢者や難聴者に対しても、各々に聞き取りや
すい合成音声を提供することができる。

【００２１】本発明の音声合成装置は、分離手段が音声
波形から分離する特定の音声素片は子音素片である構成
を採る。

【００２２】本発明の音声合成装置は、分離手段が音声
波形から分離する特定の音声素片は無声子音素片である
構成を採る。

【００２３】これらの構成により、適切な強調帯域を自
動的に設定することができ、合成音声の明瞭度を大幅に
向上することができる。

【００２４】本発明の音声明瞭化方法は、予め録音され
た音声波形である音声素片の接続によって任意の音声を
合成する音声合成システムに用いられ、音声波形の音韻
スペクトルの特徴を強調するフィルタを構成し、そのフ
ィルタを用いて前記音韻スペクトルを強調する方法をと
る。

【００２５】本発明の音声明瞭化方法は、音声波形から
分離した特定の音声素片のスペクトルの特徴を強調する
フィルタ処理を行う工程と、フィルタ処理された音声素
片を他の音声素片と接続して音声を合成する工程とを有
する方法をとる。

【００２６】本発明の音声明瞭化方法は、音声波形から
分離した特定の音声素片のスペクトルをｎ次関数で近似
することにより近似曲線を計算する工程と、前記音声素
片のスペクトルから前記近似曲線を差し引いて得られた
スペクトル特性を算出する工程と、前記スペクトル特性
を伝達関数とするフィルタを構成する工程と、前記特定
の音声素片に対してフィルタ処理を行う工程と、フィル
タ処理された音声素片を他の音声素片と接続して音声を
合成する工程とを有する方法をとる。

【００２７】これらの方法により、特定の音声素片毎に
スペクトル特性を求めて素片毎に最適な強調フィルタを
自動的に設定することができるため、各音声素片の特徴
に応じて的確にスペクトルを強調することが可能であ
り、録音音声に対して一定の強調フィルタ処理を施す場
合に明瞭度を大幅に向上させることができる。

【００２８】本発明の音声明瞭化方法は、音声波形から
複数の音韻カテゴリを選び出す工程と、前記選び出され
た複数の音韻カテゴリの平均スペクトルを計算する工程
と、前記平均スペクトルをｎ次関数で近似することによ
り近似曲線を計算する工程と、前記平均スペクトルから
前記近似曲線を差し引いて得られたスペクトル特性を算
出する工程と、前記スペクトル特性を伝達関数とするフ
ィルタを構成する工程と、前記特定の音声素片に対して
フィルタ処理を行う工程と、フィルタ処理された音声素
片を他の音声素片と接続して音声を合成する工程とを有
する方法をとる。

【００２９】この方法により、通常の発話だけでなく、
揺れのある発話や曖昧な発話についても、その音韻らし
い特徴を持った素片に修正することが可能となる。

【００３０】

【発明の実施の形態】本願発明者は、音声波形に含まれ
る特定の音声素片（例えば、子音素片、無声子音素片
等）のスペクトルの特徴を強調することにより、合成音
声の明瞭度が大幅に向上することに着目して本発明をす
るに至った。

【００３１】すなわち、本発明の骨子は、音声波形から
特定の音声素片を分離し、分離した音声素片のスペクト
ルの特徴を強調するフィルタ処理を行った後に他の素片
と接続することである。

【００３２】（実施の形態１）図１は、本発明の実施の
形態１に係る音声合成装置を示すブロック図である。図
１に示す音声合成装置は、録音音声記憶部１０１と、分
離部１０２と、スペクトル抽出部１０３と、フィルタ係
数計算部１０４と、フィルタ１０５と、音声素片記憶部
１０６と、素片接続部１０７とから主に構成されてい
る。

【００３３】録音音声記憶部１０１に録音されている音
声波形は、素片と呼ばれる合成単位の集まりに置きかえ
ることができ、素片には母音、有声子音、無声子音が存
在する。

【００３４】分離部１０２は、録音音声記憶部１０１に
録音されている音声波形を素片に置きかえ、母音、有声
子音、無声子音に分離する。分離された無声子音はスペ
クトル抽出部１０３へ出力され、母音及び有声子音は音
声素片記憶部１０６へ出力される。

【００３５】スペクトル抽出部１０３は、分離部１０２
から出力された無声子音素片から音韻全体あるいは音韻
の一部に対して時間平均したスペクトル分布を求める。
スペクトル分布は、フィルタ係数計算部１０４及びフィ
ルタ１０５に出力される。

【００３６】フィルタ係数計算部１０４は、スペクトル
抽出部１０３で求められたスペクトル分布をｎ次関数で
近似し、この近似曲線とスペクトル分布との差分を求め
ることにより、無声子音素片の特徴を表すスペクトル特
性を算出する。スペクトル特性は、フィルタ１０５に出
力される。

【００３７】フィルタ１０５は、フィルタ係数計算部１
０４で求められたスペクトル特性を伝達関数とするフィ
ルタを構成し、スペクトル抽出部１０３より出力された
スペクトル分布に対してフィルタ処理を施す。これによ
り、無声子音素片のスペクトルの特徴が強調される。ス
ペクトルの特徴が強調された無声子音素片は、音声素片
記憶部１０６に出力される。

【００３８】音声素片記憶部１０６は、フィルタ１０５
によりスペクトルの特徴が強調された無声子音素片を記
憶する。また、母音及び有声子音についてはそのまま記
憶する。

【００３９】素片接続部１０７は、音声素片記憶部１０
６に記憶されている音声素片を接続することにより任意
の音声を合成し、合成音声として出力する。

【００４０】次に、本実施の形態のフィルタ生成方法に
ついて図２を用いて具体的に説明する。なお、ここでは
フィルタ係数計算部１０４で用いるｎ次関数として最小
二乗直線を用いることとする。

【００４１】スペクトル抽出部１０３からフィルタ係数
計算部１０４に出力された無声子音素片のスペクトル分
布が、図２の（２０１）であるとする。フィルタ係数計
算部１０４は、（２０２）に示すように最小二乗直線を
求め、スペクトル分布と最小二乗直線との差分（２０
３）を求め、フィルタ１０５に出力する。

【００４２】フィルタ１０５は、この差分を伝達関数と
するフィルタを構成し、もとのスペクトル分布にフィル
タ処理を施す。これにより、特徴が強調された無声子音
素片のスペクトル分布（２０４）が得られる。

【００４３】ここでスペクトル分布の最小二乗直線を求
める際、以下の点を考慮している。低域のスペクトルは
音声波形データに含まれるバイアス成分などが現れてい
ることが多いため、図３の（３０１）に示すように最小
二乗直線の傾斜に大きく影響を与える。この直線とスペ
クトル分布の差分（３０２）を求めても、スペクトル分
布の特徴（凹凸）を正しく抽出することができない。そ
こで、図３の（３０３）に示すようにスペクトル分布の
低域成分を無視して最小二乗直線を求める。そして、こ
の直線とスペクトル分布の差分（３０４）を求めること
により、スペクトル分布の凹凸の特徴を抽出することが
可能となる。

【００４４】このように、無声子音素片毎にスペクトル
特性を求めて強調フィルタの伝達関数として用いること
により、各無声子音素片の特徴に応じて的確にスペクト
ルを強調することが可能であり、録音音声に対して一定
の強調フィルタ処理を施す場合に明瞭度を大幅に向上さ
せることができる。

【００４５】さらに、上記のようにして求めた伝達関数
を用途に応じて変形して用いることで、より多様なスペ
クトル強調が可能となる。例えば、所定の定数を乗算し
て伝達関数の振幅を一様に拡大することにより、スペク
トル強調の度合いを強化することができ、雑音下でも聞
き取りやすい音声を提供することができる。

【００４６】また、図４の（４０１）に示すような聴力
の損失を示す使用者に対して、使用者の聴力を補う補償
曲線（４０２）を求め、これを素片のスペクトル特性と
合わせることで、スペクトル分布（４０３）に示すよう
に使用者の聴覚特性を補うように変形された伝達関数を
生成することができ、聴覚特性において個人差が大きい
高齢者や難聴者に対しても、各々に聞き取りやすい合成
音声を提供することができる。

【００４７】（実施の形態２）図５は、本発明の実施の
形態２に係る音声合成装置を示すブロック図である。な
お、図５の音声合成装置において、図１と共通する構成
部分には図１と同一符号を付して詳細な説明を省略す
る。

【００４８】図５の音声合成装置は、図１に対して音韻
カテゴリ判定部５０１と平均スペクトル計算部５０２を
追加する構成を採る。また、図５の音声合成装置では、
フィルタ係数計算部１０４、フィルタ１０５及び平均ス
ペクトル計算部５０２が音韻カテゴリの個数分用意され
る。以下、音韻カテゴリの個数をｍとし、音韻カテゴリ
ｋ（１≦ｋ≦ｍ）に対応させて、フィルタ係数計算部１
０４−ｋ、フィルタ１０５−ｋ及び平均スペクトル計算
部５０２−ｋであらわす。

【００４９】スペクトル抽出部１０３は、分離部１０２
より出力された無声子音素片から、音韻全体あるいは音
韻の一部に対して時間平均したスペクトル分布を求め
る。スペクトル分布は、音韻カテゴリ判定部５０１及び
フィルタ１０５に出力される。

【００５０】音韻カテゴリ判定部５０１は、スペクトル
抽出部１０３から出力されたスペクトル分布が、予め決
定しておいた音韻カテゴリｍ個のいずれに属するかを判
定する。各音韻カテゴリｋに対応するスペクトル分布
は、平均スペクトル計算部５０２−ｋ及びフィルタ１０
５−ｋへ出力される。

【００５１】平均スペクトル計算部５０２−ｋは、これ
までに入力されたスペクトル分布の平均、すなわち、音
韻カテゴリ判定部５０１でカテゴリｋと判定された複数
のスペクトル分布の平均を求める。平均スペクトルは、
フィルタ係数計算部１０４−ｋへ出力される。

【００５２】フィルタ係数計算部１０４−ｋは、平均ス
ペクトル計算部５０２−ｋで求められた平均スペクトル
をｎ次関数で近似し、この近似曲線とスペクトル分布と
の差分を求めることにより、無声子音素片の特徴を表す
スペクトル特性を算出する。

【００５３】フィルタ１０５−ｋは、フィルタ係数計算
部１０４−ｋで求めたスペクトル特性を伝達関数とする
フィルタを構成し、音韻カテゴリ判定部５０１より出力
されたスペクトル分布に対してフィルタ処理を施すこと
により、スペクトル分布の特徴を強調する。

【００５４】音声素片記憶部１０６は、フィルタ１０５
−１〜ｍにより強調された無声子音素片を記憶する。ま
た、母音及び有声子音についてはそのまま記憶する。

【００５５】素片接続部１０７は、音声素片記憶部１０
６に記憶されている音声素片を接続することにより任意
の音声を合成し、合成音声として出力する。

【００５６】次に、本実施の形態のフィルタ生成方法に
ついて図６を用いて具体的に説明する。なお、ここでも
フィルタ係数計算部１０４で用いるｎ次関数として最小
二乗直線を用いることとし、最小二乗直線を求める際に
はスペクトル分布の低域成分を無視するものとする。

【００５７】図６において、スペクトル分布（６０１）
は、音韻カテゴリ判定部５０１から各平均スペクトル計
算部５０２−１〜ｍに出力された無声子音素片のスペク
トル分布であるとする。

【００５８】平均スペクトル計算部５０２−１〜ｍは、
それぞれ、これらのスペクトル分布の平均（６０２）を
求め、対応するフィルタ係数計算部１０４−１〜ｍに出
力する。

【００５９】フィルタ係数計算部１０４−１〜ｍは、そ
れぞれ、最小二乗直線を求め（６０３）、平均スペクト
ルと最小二乗直線との差分（６０４）を求め、対応する
フィルタ１０５−１〜ｍに出力する。

【００６０】フィルタ１０５−１〜ｍは、この差分を伝
達関数とするフィルタを構成し、もとのスペクトル分布
にフィルタ処理を施す。これにより、特徴が強調された
無声子音素片のスペクトル分布（６０５）が得られる。

【００６１】本実施の形態は、実施の形態１と比較して
以下の点で異なる。

【００６２】すなわち、実施の形態１では、処理対象と
なる無声子音素片のスペクトル特性そのものを強調フィ
ルタの伝達関数として用いており、通常の無声子音のス
ペクトル分布に対して非常に有効な処理である。

【００６３】これに対し、本実施の形態は、無声子音素
片が属する音韻カテゴリの平均スペクトルの特性を強調
フィルタとして用いていることを特徴とする。平均スペ
クトルは、同一カテゴリ内の複数のスペクトルの平均を
求めたものである。録音音声記憶部には多種多様な音声
が記憶されており、それらの中には揺れのある発話や曖
昧な発話による音声も含まれているため、スペクトルの
平均をとることにより、その音韻カテゴリのおおまかな
特徴を表すことができる。従って、この平均スペクトル
を用いて無声子音を強調することで、通常の発話だけで
なく、揺れのある発話や曖昧な発話についても、その音
韻らしい特徴を持った素片に修正することが可能とな
る。

【００６４】なお、上記の各実施の形態において、音声
波形から無声子音素片を分離してスペクトルの特徴を強
調するフィルタ処理を行う場合について説明したが、本
発明はこれに限られず、無声子音素片以外の他の素片
（例えば子音素片）を分離してスペクトルの特徴を強調
してもよい。

【００６５】

【発明の効果】以上のように本発明によれば、音声波形
から特定の音声素片を分離し、分離した音声素片のスペ
クトルの特徴を強調するフィルタ処理を行った後に他の
素片と接続することにより、合成音声の明瞭度の向上を
図るように適切な強調帯域を自動的に設定することがで
き、素片作成の労力を大幅に削減することができる。

【図面の簡単な説明】

【図１】本発明の実施の形態１に係る音声合成装置の構
成を示すブロック図

【図２】本発明の実施の形態１によるフィルタ生成方法
の具体例を示す図

【図３】本発明の実施の形態１によるスペクトル抽出方
法の具体例を示す図

【図４】本発明の実施の形態１によるフィルタ生成方法
の具体例を示す図

【図５】本発明の実施の形態２に係る音声合成装置の構
成を示すブロック図

【図６】本発明の実施の形態２によるフィルタ生成方法
の具体例を示す図

【符号の説明】

１０１録音音声記憶部１０２分離部１０３スペクトル抽出部１０４フィルタ係数計算部１０５フィルタ１０６音声素片記憶部１０７素片接続部５０１音韻カテゴリ判定部５０２平均スペクトル計算部

Claims

【特許請求の範囲】

【請求項１】音声波形から特定の音声素片を分離する
分離手段と、前記音声素片のスペクトルの特徴を強調す
るフィルタ処理を行うフィルタ手段と、前記フィルタ手
段にて処理された音声素片を他の音声素片と接続して音
声を合成する素片接続手段とを具備することを特徴とす
る音声合成装置。
【請求項２】分離手段にて分離された音声素片のスペ
クトルをｎ次関数で近似することにより近似曲線を計算
し、前記音声素片のスペクトルから前記近似曲線を差し
引いて得られたスペクトル特性を算出するフィルタ係数
計算手段を具備し、フィルタ手段は、前記スペクトル特
性を伝達関数とするフィルタを構成することを特徴とす
る請求項１記載の音声合成装置。
【請求項３】音声波形から複数の音韻カテゴリを選び
出す音韻カテゴリ判定手段と、前記選び出された複数の
音韻カテゴリの平均スペクトルを計算する平均スペクト
ル計算手段と、前記平均スペクトルをｎ次関数で近似す
ることにより近似曲線を計算し、前記平均スペクトルか
ら前記近似曲線を差し引いて得られたスペクトル特性を
算出するフィルタ係数計算手段を具備し、フィルタ手段
は、前記スペクトル特性を伝達関数とするフィルタを構
成することを特徴とする請求項１記載の音声合成装置。
【請求項４】フィルタ係数計算手段は、音声素片のス
ペクトルの低域成分を除去して近似曲線を計算すること
を特徴とする請求項２又は請求項３記載の音声合成装
置。
【請求項５】フィルタ係数計算手段は、所定の定数を
乗算してスペクトル特性の振幅を一様に拡大することを
特徴とする請求項２から請求項４のいずれかに記載の音
声合成装置。
【請求項６】フィルタ係数計算手段は、使用者の聴力
曲線と健聴者の聴力曲線の差である補償曲線をスペクト
ル特性に加算して新たなスペクトル特性とすることを特
徴とする請求項２から請求項４のいずれかに記載の音声
合成装置。
【請求項７】分離手段が音声波形から分離する特定の
音声素片は子音素片であることを特徴とする請求項１か
ら請求項６のいずれかに記載の音声合成装置。
【請求項８】分離手段が音声波形から分離する特定の
音声素片は無声子音素片であることを特徴とする請求項
１から請求項６のいずれかに記載の音声合成装置。
【請求項９】予め録音された音声波形である音声素片
の接続によって任意の音声を合成する音声合成システム
に用いられ、音声波形の音韻スペクトルの特徴を強調す
るフィルタを構成し、そのフィルタを用いて前記音韻ス
ペクトルを強調することを特徴とする音声明瞭化方法。
【請求項１０】音声波形から分離した特定の音声素片
のスペクトルの特徴を強調するフィルタ処理を行う工程
と、フィルタ処理された音声素片を他の音声素片と接続
して音声を合成する工程とを有することを特徴とする音
声明瞭化方法。
【請求項１１】音声波形から分離した特定の音声素片
のスペクトルをｎ次関数で近似することにより近似曲線
を計算する工程と、前記音声素片のスペクトルから前記
近似曲線を差し引いて得られたスペクトル特性を算出す
る工程と、前記スペクトル特性を伝達関数とするフィル
タを構成する工程と、前記特定の音声素片に対してフィ
ルタ処理を行う工程と、フィルタ処理された音声素片を
他の音声素片と接続して音声を合成する工程とを有する
ことを特徴とする音声明瞭化方法。
【請求項１２】音声波形から複数の音韻カテゴリを選
び出す工程と、前記選び出された複数の音韻カテゴリの
平均スペクトルを計算する工程と、前記平均スペクトル
をｎ次関数で近似することにより近似曲線を計算する工
程と、前記平均スペクトルから前記近似曲線を差し引い
て得られたスペクトル特性を算出する工程と、前記スペ
クトル特性を伝達関数とするフィルタを構成する工程
と、前記特定の音声素片に対してフィルタ処理を行う工
程と、フィルタ処理された音声素片を他の音声素片と接
続して音声を合成する工程とを有することを特徴とする
音声明瞭化方法。