JP3410387B2 - 音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体 - Google Patents

音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体

Info

Publication number
JP3410387B2
JP3410387B2 JP11991099A JP11991099A JP3410387B2 JP 3410387 B2 JP3410387 B2 JP 3410387B2 JP 11991099 A JP11991099 A JP 11991099A JP 11991099 A JP11991099 A JP 11991099A JP 3410387 B2 JP3410387 B2 JP 3410387B2
Authority
JP
Japan
Prior art keywords
voice
waveform
consonant
vowel
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP11991099A
Other languages
English (en)
Other versions
JP2000310994A (ja
Inventor
貴夫 小山
文徳 吉谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP11991099A priority Critical patent/JP3410387B2/ja
Publication of JP2000310994A publication Critical patent/JP2000310994A/ja
Application granted granted Critical
Publication of JP3410387B2 publication Critical patent/JP3410387B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声素片作成装
置、音声合成装置、音音声素片作成方法及び音声合成方
法等に関する。
【0002】
【従来の技術】従来、音声合成の一方法として、各音声
の音声素片をデータベースに記憶蓄積しておき、合成に
必要な音声素片をデータベースから選択して接続するこ
とにより音声を合成する方法がある。
【0003】
【発明が解決しようとする課題】しかし、上記のように
音声素片を接続して音声合成を行う方法では、データベ
ースに登録されている音声素片のうち、例えば無声摩擦
子音が後続する母音については、その後半部分に無声摩
擦子音成分が含まれていた。従って、そのような母音に
摩擦以外の無声子音を後続させた場合等には、その接続
点において不連続が生じ、合成音声にノイズ感が生じる
という問題があった。
【0004】本発明は、上述した事情に鑑みてなされた
もので、音声素片の接続点において生ずるノイズ感を抑
制し、合成音声の自然性を向上させるための音声素片作
成装置、音声合成装置、音声素片作成方法及び音声合成
方法等を提供することを目的とする。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、本発明の第1の観点に係る音声素片作成装置は、予
め用意された音声波形を音韻毎に切り分けて、音声合成
のための音声素片を生成する音声素片作成装置におい
て、母音と該母音に後続する所定の子音の音声波形を検
出する検出手段と、前記検出手段により検出された母音
及び子音の音声波形における該母音から該子音への過渡
区間について、所定の高域成分を除去する第1除去手段
と、前記過渡区間の音声波形について、前記第1除去手
段により所定の高域成分が除去された波形を前記過渡区
間における前記母音の音声波形として、前記母音の音声
素片を生成する第1生成手段と、前記過渡区間の音声波
形について、所定の低域成分を除去する第2除去手段
と、前記過渡区間の音声波形について、前記第2除去手
段により所定の低域成分が除去された波形を前記過渡区
間における前記子音の音声波形として、前記子音の音声
素片を生成する第2生成手段と、を備える。
【0006】このような構成によれば、音声合成のため
の音声素片の生成に際し、母音とその母音に後続する子
音の音声波形について、低域通過フィルタを用いて互い
の成分を含めることなく母音の音声素片と子音の音声素
片に切り分けることができる。これにより、音声合成の
際に、子音に先行する母音素片の後ろに、摩擦以外の無
声子音を接続する場合でも、接続点でのノイズ感等が生
ずることを防止でき、合成音声の自然性を向上すること
ができる。
【0007】前記母音に後続する所定の子音は、/f
/、/s/、/h/等の無声摩擦子音を含んでもよい。
【0008】前記第2除去手段は、前記過渡区間の音声
波形について、前記第1除去手段による高域成分の除去
前の波形と除去後の波形との差分をとってもよく、前記
第2生成手段は、前記差分を前記過渡区間における前記
子音の波形として、前記子音の音声素片を生成してもよ
い。
【0009】前記第1除去手段は、前記過渡区間におい
て、遮断周波数を徐々に下げてもよい。
【0010】前記音声素片作成装置は、予め用意された
音声波形を音韻毎に切り分けて生成した音声素片を記憶
する記憶手段と、前記記憶手段に記憶されている前記音
声素片を接続することにより音声を合成する音声合成手
段と、を備え、前記記憶手段は、前記第1生成手段と前
記第2生成手段により生成された各音声素片をさらに記
憶し、前記音声合成手段は、前記第1生成手段により生
成された前記母音の音声素片と、前記第2生成手段によ
り生成された前記子音の音声素片と、を接続する際に、
前記過渡区間における各音声波形を重畳させて接続する
ようにしてもよい。
【0011】これにより、元来、所定の子音(例えば、
無声摩擦子音等)が後続していた母音の音声素片の後ろ
にその子音の音声素片を接続する場合には、過渡区間に
おいて分離した互いの音声信号を重ね合わせるため、音
声を劣化させることなく復元することができる。
【0012】また、本発明の第2の観点に係る音声合成
装置は、予め用意された音声波形を音韻毎に切り分けて
生成した音声素片を接続して音声を合成する音声合成装
置であって、母音の音素片と所定の子音の音素片を接続
する際に、前記母音の音素片の後方の所定区間の音声波
形と、前記子音の前方の所定区間の音声波形と、を重畳
させて接続する重畳接続手段を備える。
【0013】これにより、元来、所定の子音が後続して
いた母音の音声素片の後ろにその子音の音声素片を接続
する場合には、過渡区間において分離した互いの音声信
号を重ね合わせるため、音声を劣化させることなく復元
することができる。
【0014】前記所定の子音は、/f/、/s/、/h
/等の無声摩擦子音を含んでもよい。
【0015】前記重畳接続手段により接続される母音の
音素片と子音の音素片において、前記母音の音素片は、
予め用意された音声波形から、所定の母音と該母音に後
続する子音の音声波形を検出して、該母音から該子音へ
の過渡区間について、所定の高域成分を除去した波形を
該過渡区間における該母音の音声波形として生成されて
もよく、前記子音の音素片は、前記母音から子音への過
渡区間の音声波形について、所定の低域成分を除去した
波形を該過渡区間における該子音の音声波形として生成
されてもよい。
【0016】また、本発明の第3の観点に係る音声素片
作成方法は、予め用意された音声波形を音韻毎に切り分
けて、音声合成のための音声素片を生成する音声素片作
成方法であって、母音と該母音に後続する所定の子音の
音声波形を検出する検出ステップと、前記検出ステップ
により検出された母音及び子音の音声波形における該母
音から該子音への過渡区間について、所定の高域成分を
除去する第1除去ステップと、前記過渡区間の音声波形
について、前記第1除去ステップにより所定の高域成分
が除去された波形を前記過渡区間における前記母音の音
声波形として、前記母音の音声素片を生成する第1生成
ステップと、前記過渡区間の音声波形について、所定の
低域成分を除去する第2除去ステップと、前記過渡区間
の音声波形について、前記第2除去ステップにより所定
の低域成分が除去された波形を前記過渡区間における前
記子音の音声波形として、前記子音の音声素片を生成す
る第2生成ステップと、を備える。
【0017】このような構成によれば、音声合成のため
の音声素片の生成に際し、母音とその母音に後続する所
定の子音の音声波形について、低域通過フィルタを用い
て互いの成分を含めることなく母音の音声素片と子音の
音声素片に切り分けることができる。これにより、音声
合成の際に、無声摩擦子音に先行する母音素片の後ろ
に、所定の子音を接続する場合でも、接続点でのノイズ
感等が生ずることを防止でき、合成音声の自然性を向上
することができる。
【0018】前記母音に後続する所定の子音は、/f
/、/s/、/h/等の無声摩擦子音を含んでもよい。
【0019】前記第2除去ステップは、前記過渡区間の
音声波形について、前記第1除去ステップによる高域成
分の除去前の波形と除去後の波形との差分をとってもよ
く、前記第2生成ステップは、前記差分を前記過渡区間
における前記無声摩擦子音の波形として、前記無声摩擦
子音の音声素片を生成してもよい。
【0020】また、本発明の第4の観点に係る音声合成
方法は、予め用意された音声波形を音韻毎に切り分けて
生成した音声素片を接続して音声を合成する音声合成方
法であって、母音の音素片と所定の子音の音素片を接続
する際に、前記母音の音素片の後方の所定区間の音声波
形と、前記子音の前方の所定区間の音声波形と、を重畳
させて接続する重畳接続ステップを備える。
【0021】これにより、元来所定の子音が後続してい
た母音の音声素片の後ろにその子音の音声素片を接続す
る場合には、過渡区間において分離した互いの音声信号
を重ね合わせるため、音声を劣化させることなく復元す
ることができる。
【0022】前記所定の子音は、/f/、/s/、/h
/等の無声摩擦子音を含んでもよい。
【0023】前記重畳接続ステップにより接続される母
音の音素片と子音の音素片において、前記母音の音素片
は、予め用意された音声波形から、所定の母音と該母音
に後続する子音の音声波形を検出して、該母音から該子
音への過渡区間について、所定の高域成分を除去した波
形を該過渡区間における該母音の音声波形として生成さ
れてもよく、前記子音の音素片は、前記母音から子音へ
の過渡区間の音声波形について、所定の低域成分を除去
した波形を該過渡区間における該子音の音声波形として
生成されてもよい。
【0024】また、本発明の第5の観点に係る記録媒体
は、コンピュータを、予め用意された音声波形を音韻毎
に切り分けて、音声合成のための音声素片を生成する音
声素片作成装置として機能させるためのプログラムを記
録したコンピュータ読み取り可能な記録媒体であって、
母音と該母音に後続する無声摩擦子音の音声波形を検出
する検出手段、前記検出手段により検出された母音及び
無声摩擦子音の音声波形における該母音から該無声摩擦
子音への過渡区間について、低域通過フィルタにより高
域成分を除去する除去手段、前記過渡区間の音声波形に
ついて、前記除去手段により高域成分が除去された波形
を前記過渡区間における前記母音の音声波形として、前
記母音の音声素片を生成する手段、前記過渡区間の音声
波形について、前記除去手段による高域成分の除去前の
波形と除去後の波形との差分を前記過渡区間における前
記無声摩擦子音の波形として、前記無声摩擦子音の音声
素片を生成する手段、として機能させるためのプログラ
ムを記録する。
【0025】また、本発明の第6の観点に係る記録媒体
は、コンピュータを、予め用意された音声波形を音韻毎
に切り分けて生成した音声素片を接続して音声を合成す
る音声合成装置として機能させるためのプログラムを記
録したコンピュータ読み取り可能な記録媒体であって、
該コンピュータを、母音の音素片と無声摩擦子音の音素
片を接続する際に、前記母音の音素片の後方の所定区間
の音声波形と、前記無声摩擦子音の前方の所定区間の音
声波形と、を重畳させて接続する手段、として機能させ
るためのプログラムを記録する。
【0026】
【発明の実施の形態】以下、本発明の実施の形態に係る
音声合成装置について図面を参照して説明する。この音
声合成装置1は、図1に示すように、音声素片生成部1
1と、音声素片記憶部15と、音声素片接続部17と、
出力部19と、を備える。
【0027】音声素片生成部11は、図2に示すよう
に、音声記憶部111と、再生部112と、生成部11
3と、フォルマント検出部114と、フィルタ115
と、を備える。音声記憶部111は、マイクから入力さ
れた音声をPCM変換等して取得した音声信号を記憶す
る。再生部112は、音声記憶部111に記憶されてい
る音声信号を再生し、再生した音声信号を音韻又は音節
に従って切り出す。再生部112は、音声信号の再生時
に、母音とそれに後続する無声摩擦子音が検出された場
合、その母音とそれに後続する無声摩擦子音を生成部1
13及びフィルタ115に渡す。ここで、母音とそれに
後続する無声摩擦子音からなる音声とは、例えば、/f
/a/、/i/、/u/、/e/、/o/、/N/の母
音等と、/f/、/s/、/h/等の無声摩擦子音が連
続した音声である。
【0028】生成部113は、再生部112により切り
出された各信号(音声素片)に、その信号を識別するた
めの識別データを付与して音声素片記憶部15に記憶す
る。この音声素片を生成する際、生成部113は、母音
とそれに後続する無声摩擦子音の信号を再生部112か
ら受けた場合、その信号のフォルマントの検出等をフォ
ルマント検出部114に指示する。生成部113は、母
音とそれに後続する無声摩擦子音の信号について、再生
部112から受け取った信号と、フィルタ115から受
け取った信号の差分を取る。そして、フィルタ115か
ら受け取った信号から、母音とそれに後続する無声摩擦
子音のうちの母音の音声素片を生成し、また、取得した
差分から、母音とそれに後続する無声摩擦子音のうちの
無声摩擦子音の音声素片を生成する。
【0029】フォルマント検出部114は、生成部11
3からの指示に従って、母音とそれに後続する無声摩擦
子音について、フォルマントの検出を行い、第3フォル
マントを検出したときにフィルタ115に通知する。フ
ィルタ115は、予め定められた遮断周波数を有するデ
ジタルフィルタであり、フォルマント検出部114から
の通知に応じて、第3フォルマントの検出以降、遮断周
波数を徐々に下げる。そして、母音の区間と母音から無
声摩擦子音への過渡区間とにおいて通過した低域成分を
生成部113に戻す。
【0030】音声素片記憶部15は、音声素片生成部1
1により生成された音声素片を記憶する。音声素片接続
部17は、外部からの音声合成の指示等に応じて、例え
ばテキスト等の合成すべき音声を示すデータに基づき、
音声素片記憶部15に記憶されている音声素片から必要
な音声素片を選択し、それらを接続等して音声合成を行
い、合成した音声データを出力部19に渡す。また、音
声素片接続部17は、音声合成時において、次に合成す
べき音声の接続対象となる音声素片が母音と無声摩擦子
音である場合には、該当するラベルが付された母音と子
音を読み出して、各音声素片の一部を重畳させて合成す
る。この合成方法については、後述する。出力部19
は、音声素片接続部17から受け取った音声データを音
声に変換して出力する。
【0031】一般的に、母音(有声音)から無声摩擦子
音への過渡区間においては、例えば図3に示すように、
有声音のエネルギーが消失しつつ、無声摩擦音のエネル
ギーが増加し始める。この母音と子音のエネルギーが混
在する区間は50ミリ秒程度の時間長があり、これは音
韻の継続時間長として無視できる長さではなく、合成音
声のリズムに影響を与える長さである。
【0032】過渡区間における子音のエネルギーを残し
たまま、その区間の音声信号を母音音声素片に含めた場
合、この母音素片の後ろに無声摩擦子音以外の音声素片
を接続すると合成音声にノイズ感を生ずる。また、この
過渡区間の音声信号を子音素片に含めた場合、子音素片
にその子音に先行する母音の音色が保存されることとな
り、合成時にこの子音の前に接続する母音素片の種類
と、もとの母音素片の種類(子音素片に保存されている
母音の種類)が異なる場合には、異聴又は合成音声の不
連続感が生じてしまう。
【0033】これに対して、この音声合成装置1では、
音声合成のための音声素片の生成に際し、母音とその母
音に後続する無声摩擦子音を分離する際、低域通過フィ
ルタを用いた方法により互いの成分を含めることなく母
音素片と無声摩擦子音素片に切り分けるため、無声摩擦
子音に先行する母音素片の後ろに、摩擦以外の無声子音
を接続する場合でも、接続点でのノイズ感等を生じさせ
ない。
【0034】以下、本発明に係る音声合成装置1の特徴
部分である、母音とその母音に後続する無声摩擦子音を
各音声素片に分離する分離処理を図4を参照して説明す
る。
【0035】音声素片生成部11のフィルタ115は、
フォルマント検出部114からの通知に応じて、母音と
その母音に後続する無声摩擦子音のうち、母音から無声
摩擦子音への過渡区間(t1〜t2)の部分について、
徐々に高域を抑圧する高域遮断周波数により高域の子音
成分を除去する。これは、日本語の母音では有声音音源
の特性より第1から第3フォルマントまでの低域のエネ
ルギーが優勢であり、また、摩擦音のようなホワイトノ
イズ的な音源をベースとする音韻では、放射特性により
高域のエネルギーが優勢になるという特性に鑑みたもの
である。なお、通過帯域の利得は例えば0dBである。
【0036】この分離処理で低域通過フィルタとして使
用される遮断周波数Cf(t)は、話者の音声の特性に
応じて、それぞれ設定されている。例えば遮断周波数C
f(t)とフィルタ特性の関係の一例を図5に示す。こ
の遮断周波数Cf(t)を用いた場合、音声波形の周波
数が約3000Hzを越える高域部分については取り除
かれることとなる。
【0037】また、図4における母音から無声子音への
過渡区間(t1〜t2)について、フィルタ処理を行っ
ていない元の信号をS(t)、フィルタ処理を行った過
渡区間の母音素片信号をS'(t)、フィルタ処理を行
った過渡区間の子音素片信号をS''(t)とすると、こ
れらの関係は次のようになる。
【0038】
【数1】 S''(t)=S(t)−S'(t) (t1≦t≦t2)
【0039】生成部113は、再生部112から受け取
った元の音声信号S(t)と、フィルタ115によるフ
ィルタ処理後の音声信号S'(t)の差分をとり、過渡
区間における子音素片信号S''(t)とする。このよう
にして分離された過渡区間における各音声信号S'
(t)、S''(t)は、各母音素片又は子音素片にそれ
ぞれ含められて、音声素片記憶部15に記憶される。
【0040】次に、音声素片接続部17が、音声合成に
おいて、音声素片生成部11による分離処理にて生成さ
れた音声素片を他の音声素片と接続する場合の処理を説
明する。上述したように、音声素片記憶部15に記憶さ
れている各音声素片には、それぞれを識別するための識
別データが付与されている。音声素片接続部17は、例
えばテキスト等の合成すべき音声を示すデータを順次取
り込み、例えば、接続対象の音声素片が、分離処理によ
り分離された母音素片と無声摩擦子音である場合には、
図6に示すように、母音素片の過渡区間の部分S'
(t)と、無声摩擦素片の過渡区間の部分S''(t)
と、を重畳させて各音声素片を合成する。また、接続対
象の音声素片が、分離処理により分離された母音素片と
摩擦以外の無声子音である場合には、図7に示すよう
に、母音素片と後続の子音とを重畳させずに直接接続す
る。
【0041】これにより、元来無声摩擦音が後続してい
た母音素片の後ろに無声摩擦子音を接続する場合には、
過渡区間において分離した音声信号を重ね合わせるた
め、音声を劣化させることなく復元することができ、ま
た、母音素片の後ろに摩擦以外の無声子音を接続する場
合には接続点におけるノイズ感を生じさせることなく合
成できる。
【0042】なお、上記説明では、音声素片を生成する
手段(音声素片生成部11)と、音声素片を接続して音
声を合成する手段(音声素片接続部17、出力部19)
と、を同一装置内に設けているが、これに限定されず、
音声素片を生成する手段と、音声素片を接続してして音
声の合成を行う手段と、を異なる装置として実現しても
よい。この場合、例えば、音声素片の生成装置により生
成された音声素片が音声素片記憶部15に記憶され、音
声合成装置1は、音声素片記憶部15から音声素片を読
み出して音声の合成を行う。音声素片記憶部15は、少
なくともいずれか一方の装置に存在してもよく、他の装
置に存在してもよい。
【0043】また、音声素片生成部11において、低域
通過フィルタを用いて低域成分を取得し、もとの信号と
低域成分の差分から高域成分を取得するようにしている
が、これに限定されず、高域通過フィルタを用いて高域
成分を取得し、これに基づいて、低域成分を取得しても
よい。また、差分を取らずに、低域通過フィルタと高域
通過フィルタの双方を使用して、各成分を取得するよう
にしてもよい。
【0044】また、上記説明では、フォルマント検出部
114が第3フォルマントの検出を行うようにしている
が、例えば、所定の解析により検出が行われ、これに基
づく指示が外部からなされるようにしてもよい。この場
合、外部からの指示に応じて、遮断周波数が徐々に下げ
られる。また、上記分離処理にて用いられる遮断周波数
は、実験等によって、話者の音声の特性に応じた最適な
遮断周波数を取得するようにしてもよい。
【0045】なお、この発明の音声合成装置は、専用の
システムによらず、通常のコンピュータシステムを用い
て実現可能である。例えば、コンピュータに上述の動作
を実行するためのプログラムを格納した媒体(フロッピ
ーディスク、CD−ROM等)から該プログラムをイン
ストールすることにより、上述の処理を実行する音声合
成装置1等を構成することができる。なお、上述の機能
を、OSが分担又はOSとアプリケーションの共同によ
り実現する場合等には、OS以外の部分のみを媒体に格
納してもよい。
【0046】また、コンピュータにプログラムを供給す
るための媒体は、通信媒体(通信回線、通信ネットワー
ク、通信システムのように、一時的にプログラムを保持
する媒体)でも良い。例えば、通信ネットワークの掲示
板(BBS)に該プログラムを掲示し、これをネットワ
ークを介して配信してもよい。そして、このプログラム
を起動し、OSの制御下で、他のアプリケーションプロ
グラムと同様に実行することにより、上述の処理を実行
することができる。
【0047】
【発明の効果】以上説明したように、本発明によれば、
音声合成のための音声素片の生成に際し、母音とその母
音に後続する無声摩擦子音の音声波形について、低域通
過フィルタを用いて互いの成分を含めることなく母音の
音声素片と無声摩擦子音の音声素片に切り分けることが
できる。これにより、音声合成の際に、無声摩擦子音に
先行する母音素片の後ろに、摩擦以外の無声子音を接続
する場合でも、接続点でのノイズ感等が生ずることを防
止でき、合成音声の自然性を向上することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る音声合成装置の構成
を模式的に示す図である。
【図2】図1の音声合成装置で使用される音声素片生成
部の構成を模式的に示す図である。
【図3】母音から無声摩擦子音への過渡区間における音
声のエネルギーについて説明するための図である。
【図4】母音とその母音に後続する無声摩擦子音を各音
声素片に分離する分離処理を説明するための図である。
【図5】遮断周波数とフィルタ特性の関係の一例を示す
図である。
【図6】分離処理により分離された母音素片の後ろに、
無声摩擦子音を接続する場合の接続処理を説明するため
の図である。
【図7】分離処理により分離された母音素片の後ろに、
摩擦以外の無声子音を接続する場合の接続処理を説明す
るための図である。
【符号の説明】
1 音声合成装置 11 音声素片生成部 15 音声素片記憶部 17 音声素片接続部 19 出力部 111 音声記憶部 112 再生部 113 生成部 114 フォルマント検出部 115 フィルタ
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 13/06

Claims (16)

    (57)【特許請求の範囲】
  1. 【請求項1】予め用意された音声波形を音韻毎に切り分
    けて、音声合成のための音声素片を生成する音声素片作
    成装置において、 母音と該母音に後続する所定の子音の音声波形を検出す
    る検出手段と、 前記検出手段により検出された母音及び子音の音声波形
    における該母音から該子音への過渡区間について、所定
    の高域成分を除去する第1除去手段と、 前記過渡区間の音声波形について、前記第1除去手段に
    より所定の高域成分が除去された波形を前記過渡区間に
    おける前記母音の音声波形として、前記母音の音声素片
    を生成する第1生成手段と、 前記過渡区間の音声波形について、所定の低域成分を除
    去する第2除去手段と、 前記過渡区間の音声波形について、前記第2除去手段に
    より所定の低域成分が除去された波形を前記過渡区間に
    おける前記子音の音声波形として、前記子音の音声素片
    を生成する第2生成手段と、 を備えることを特徴とする音声素片作成装置。
  2. 【請求項2】前記母音に後続する所定の子音は無声摩擦
    子音を含む、 ことを特徴とする請求項1に記載の音声素片作成装置。
  3. 【請求項3】前記第2除去手段は、前記過渡区間の音声
    波形について、前記第1除去手段による高域成分の除去
    前の波形と除去後の波形との差分をとり、 前記第2生成手段は、前記差分を前記過渡区間における
    前記子音の波形として、前記子音の音声素片を生成す
    る、 ことを特徴とする請求項1又は2に記載の音声素片作成
    装置。
  4. 【請求項4】前記第1除去手段は、前記過渡区間におい
    て、遮断周波数を徐々に下げる、 ことを特徴とする請求項1乃至3のいずれか1項に記載
    の音声素片作成装置。
  5. 【請求項5】前記音声素片作成装置は、 予め用意された音声波形を音韻毎に切り分けて生成した
    音声素片を記憶する記憶手段と、 前記記憶手段に記憶されている前記音声素片を接続する
    ことにより音声を合成する音声合成手段と、を備え、 前記記憶手段は、前記第1生成手段と前記第2生成手段
    により生成された各音声素片をさらに記憶し、 前記音声合成手段は、前記第1生成手段により生成され
    た前記母音の音声素片と、前記第2生成手段により生成
    された前記子音の音声素片と、を接続する際に、前記過
    渡区間における各音声波形を重畳させて接続する、 ことを特徴とする請求項1乃至4のいずれか1項に記載
    の音声素片作成装置。
  6. 【請求項6】予め用意された音声波形を音韻毎に切り分
    けて生成した音声素片を接続して音声を合成する音声合
    成装置であって、 母音の音素片と所定の子音の音素片を接続する際に、前
    記母音の音素片の後方の所定区間の音声波形と、前記子
    音の前方の所定区間の音声波形と、を重畳させて接続す
    る重畳接続手段を備えることを特徴とする音声合成装
    置。
  7. 【請求項7】前記所定の子音は、無声摩擦子音を含む、 ことを特徴とする請求項6に記載の音声合成装置。
  8. 【請求項8】前記重畳接続手段により接続される母音の
    音素片と子音の音素片において、 前記母音の音素片は、 予め用意された音声波形から、所定の母音と該母音に後
    続する子音の音声波形を検出して、該母音から該子音へ
    の過渡区間について、所定の高域成分を除去した波形を
    該過渡区間における該母音の音声波形として生成され、 前記子音の音素片は、 前記母音から子音への過渡区間の音声波形について、所
    定の低域成分を除去した波形を該過渡区間における該子
    音の音声波形として生成される、 ことを特徴とする請求項6又は7に記載の音声合成装
    置。
  9. 【請求項9】予め用意された音声波形を音韻毎に切り分
    けて、音声合成のための音声素片を生成する音声素片作
    成方法であって、 母音と該母音に後続する所定の子音の音声波形を検出す
    る検出ステップと、 前記検出ステップにより検出された母音及び子音の音声
    波形における該母音から該子音への過渡区間について、
    所定の高域成分を除去する第1除去ステップと、 前記過渡区間の音声波形について、前記第1除去ステッ
    プにより所定の高域成分が除去された波形を前記過渡区
    間における前記母音の音声波形として、前記母音の音声
    素片を生成する第1生成ステップと、 前記過渡区間の音声波形について、所定の低域成分を除
    去する第2除去ステップと、 前記過渡区間の音声波形について、前記第2除去ステッ
    プにより所定の低域成分が除去された波形を前記過渡区
    間における前記子音の音声波形として、前記子音の音声
    素片を生成する第2生成ステップと、 を備えることを特徴とする音声素片作成方法。
  10. 【請求項10】前記母音に後続する所定の子音は無声摩
    擦子音を含む、 ことを特徴とする請求項9に記載の音声素片作成方法。
  11. 【請求項11】前記第2除去ステップは、前記過渡区間
    の音声波形について、前記第1除去ステップによる高域
    成分の除去前の波形と除去後の波形との差分をとり、 前記第2生成ステップは、前記差分を前記過渡区間にお
    ける前記無声摩擦子音の波形として、前記無声摩擦子音
    の音声素片を生成する、 ことを特徴とする請求項9又は10に記載の音声素片作
    成方法。
  12. 【請求項12】予め用意された音声波形を音韻毎に切り
    分けて生成した音声素片を接続して音声を合成する音声
    合成方法であって、 母音の音素片と所定の子音の音素片を接続する際に、前
    記母音の音素片の後方の所定区間の音声波形と、前記子
    音の前方の所定区間の音声波形と、を重畳させて接続す
    る重畳接続ステップを備えることを特徴とする音声合成
    方法。
  13. 【請求項13】前記所定の子音は、無声摩擦子音を含
    む、 ことを特徴とする請求項12に記載の音声合成方法。
  14. 【請求項14】前記重畳接続ステップにより接続される
    母音の音素片と子音の音素片において、 前記母音の音素片は、 予め用意された音声波形から、所定の母音と該母音に後
    続する子音の音声波形を検出して、該母音から該子音へ
    の過渡区間について、所定の高域成分を除去した波形を
    該過渡区間における該母音の音声波形として生成され、 前記子音の音素片は、 前記母音から子音への過渡区間の音声波形について、所
    定の低域成分を除去した波形を該過渡区間における該子
    音の音声波形として生成される、 ことを特徴とする請求項12又は13に記載の音声合成
    方法。
  15. 【請求項15】コンピュータを、予め用意された音声波
    形を音韻毎に切り分けて、音声合成のための音声素片を
    生成する音声素片作成装置として機能させるためのプロ
    グラムを記録したコンピュータ読み取り可能な記録媒体
    であって、 該コンピュータを、 母音と該母音に後続する無声摩擦子音の音声波形を検出
    する検出手段、 前記検出手段により検出された母音及び無声摩擦子音の
    音声波形における該母音から該無声摩擦子音への過渡区
    間について、低域通過フィルタにより高域成分を除去す
    る除去手段、 前記過渡区間の音声波形について、前記除去手段により
    高域成分が除去された波形を前記過渡区間における前記
    母音の音声波形として、前記母音の音声素片を生成する
    手段、 前記過渡区間の音声波形について、前記除去手段による
    高域成分の除去前の波形と除去後の波形との差分を前記
    過渡区間における前記無声摩擦子音の波形として、前記
    無声摩擦子音の音声素片を生成する手段、 として機能させるためのプログラムを記録したコンピュ
    ータ読み取り可能な記録媒体。
  16. 【請求項16】コンピュータを、予め用意された音声波
    形を音韻毎に切り分けて生成した音声素片を接続して音
    声を合成する音声合成装置として機能させるためのプロ
    グラムを記録したコンピュータ読み取り可能な記録媒体
    であって、 該コンピュータを、母音の音素片と無声摩擦子音の音素
    片を接続する際に、前記母音の音素片の後方の所定区間
    の音声波形と、前記無声摩擦子音の前方の所定区間の音
    声波形と、を重畳させて接続する手段、 として機能させるためのプログラムを記録したコンピュ
    ータ読み取り可能な記録媒体。
JP11991099A 1999-04-27 1999-04-27 音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体 Expired - Lifetime JP3410387B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11991099A JP3410387B2 (ja) 1999-04-27 1999-04-27 音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11991099A JP3410387B2 (ja) 1999-04-27 1999-04-27 音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体

Publications (2)

Publication Number Publication Date
JP2000310994A JP2000310994A (ja) 2000-11-07
JP3410387B2 true JP3410387B2 (ja) 2003-05-26

Family

ID=14773233

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11991099A Expired - Lifetime JP3410387B2 (ja) 1999-04-27 1999-04-27 音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体

Country Status (1)

Country Link
JP (1) JP3410387B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3901475B2 (ja) * 2001-07-02 2007-04-04 株式会社ケンウッド 信号結合装置、信号結合方法及びプログラム
US11276390B2 (en) * 2018-03-22 2022-03-15 Casio Computer Co., Ltd. Audio interval detection apparatus, method, and recording medium to eliminate a specified interval that does not represent speech based on a divided phoneme

Also Published As

Publication number Publication date
JP2000310994A (ja) 2000-11-07

Similar Documents

Publication Publication Date Title
JP3078205B2 (ja) 波形の連結及び部分的重複化による音声合成方法
EP1901286B1 (en) Speech enhancement apparatus, speech recording apparatus, speech enhancement program, speech recording program, speech enhancing method, and speech recording method
JP3450237B2 (ja) 音声合成装置および方法
JP3410387B2 (ja) 音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体
JP2002525663A (ja) ディジタル音声処理装置及び方法
JP2841797B2 (ja) 音声分析・合成装置
JP3901475B2 (ja) 信号結合装置、信号結合方法及びプログラム
JP4778402B2 (ja) 休止時間長算出装置及びそのプログラム、並びに音声合成装置
JP3578598B2 (ja) 音声合成装置
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JP3089940B2 (ja) 音声合成装置
Verhelst et al. Rejection phenomena in inter-signal voice transplantations
JP3289511B2 (ja) 音声合成用音源データ作成方法
US6112178A (en) Method for synthesizing voiceless consonants
JP2900454B2 (ja) 音声合成装置の音節データ作成方式
JP3241582B2 (ja) 韻律制御装置及び方法
JP2987089B2 (ja) 音声素片作成方法および音声合成方法とその装置
JP2577372B2 (ja) 音声合成装置および方法
JP3336098B2 (ja) 音声効果装置
JPH11109992A (ja) 音声素片データベースの作成方法、音声合成方法、音声素片データベース、音声素片データベース作成装置および音声合成装置
JPS6295595A (ja) 音声応答方式
JP2008262140A (ja) 音程変換装置及び音程変換方法
JP2002244693A (ja) 音声合成装置および音声合成方法
MANUAL CONSTRUCTION
JPH02252000A (ja) 波形素片作成方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080320

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090320

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090320

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100320

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100320

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110320

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110320

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120320

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120320

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130320

Year of fee payment: 10