JPWO2007097215A1 - 波動合成装置 - Google Patents
波動合成装置 Download PDFInfo
- Publication number
- JPWO2007097215A1 JPWO2007097215A1 JP2008501677A JP2008501677A JPWO2007097215A1 JP WO2007097215 A1 JPWO2007097215 A1 JP WO2007097215A1 JP 2008501677 A JP2008501677 A JP 2008501677A JP 2008501677 A JP2008501677 A JP 2008501677A JP WO2007097215 A1 JPWO2007097215 A1 JP WO2007097215A1
- Authority
- JP
- Japan
- Prior art keywords
- wave
- pulse train
- electronic circuit
- circuit
- medium
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004088 simulation Methods 0.000 claims abstract description 24
- 230000005540 biological transmission Effects 0.000 claims abstract description 13
- 230000001755 vocal effect Effects 0.000 claims description 43
- 230000015572 biosynthetic process Effects 0.000 claims description 35
- 238000003786 synthesis reaction Methods 0.000 claims description 33
- 210000001260 vocal cord Anatomy 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 16
- 230000002194 synthesizing effect Effects 0.000 claims description 11
- 238000010586 diagram Methods 0.000 description 11
- 238000000034 method Methods 0.000 description 11
- 210000000214 mouth Anatomy 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 210000003928 nasal cavity Anatomy 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 210000003800 pharynx Anatomy 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000009172 bursting Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 210000004704 glottis Anatomy 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
波動を表すパルス列を生成するパルス列生成部(10)と、波動が伝播する媒体を電子回路により近似的に模擬し、パルス列が入力され、媒体の波動伝播特性に応じたパルス列を出力する波動伝播特性シミュレーション回路(20)とを有する。媒体を波動が伝播する伝播時間と電子回路の入出力間のパルス信号列の伝達時間とが関連付けられるように、電子回路が構成される。これにより、波動の伝播特性を忠実に模擬しつつ、その変化する伝播特性に容易に対応できる。
Description
本発明は、音波などの波動を合成する波動合成装置に関する。
1950年頃より、音声合成を目指して、音の導波管をモデル化した格子形状の回路で表現し、そこに伝播するアナログ波(電流波、電圧波)をZ変換し、回路の零点、極を用いて伝達特性を解析していた。
またその後、線形予測分析など多くの音声分析手法が提案されてきた。この方法は、基本的特性を解析するには適しているが、形状が複雑な場合には、解析が困難である。そして、合成された音声は、不自然なロボット声となる。
このロボット声になる原因としては、連続な周期音をフーリエ級数で展開し、三角波に分けた基本波を重ね合わせることで、任意の波を合成する技術を利用していることにある。
したがって、従来の技術では、原理的に高調波を取り除くことは不可能である。フーリエ展開の代わりにWavelet展開を利用する技術も知られている。フーリエ展開よりは良好な結果が得られると考えられる。しかし、基本波で合成することに変わりはなく、たとえば、人間の声道のような複雑な過程で発生した波形を基本波で合成すると、その合成波形の形には限界がある。
また、模型による人工声道を使用し、より自然な音声を再現できるようにしたもの、あるいは特許文献1に開示されているような人間の声帯の振動をバネ−質量モデルよりなる物理モデルにより模擬する手法などが提案されている。
特開2003−58175号公報
従来技術によるような人工声道の使用、機械的物理モデルでの模擬には、いったん模型またはモデルを作成するとその変更が困難であるという問題があり、一方、基本波の合成による音声合成には、人間の声道のような複雑な過程で発生した波形の再現に適さないという問題があった。
またその後、線形予測分析など多くの音声分析手法が提案されてきた。この方法は、基本的特性を解析するには適しているが、形状が複雑な場合には、解析が困難である。そして、合成された音声は、不自然なロボット声となる。
このロボット声になる原因としては、連続な周期音をフーリエ級数で展開し、三角波に分けた基本波を重ね合わせることで、任意の波を合成する技術を利用していることにある。
したがって、従来の技術では、原理的に高調波を取り除くことは不可能である。フーリエ展開の代わりにWavelet展開を利用する技術も知られている。フーリエ展開よりは良好な結果が得られると考えられる。しかし、基本波で合成することに変わりはなく、たとえば、人間の声道のような複雑な過程で発生した波形を基本波で合成すると、その合成波形の形には限界がある。
また、模型による人工声道を使用し、より自然な音声を再現できるようにしたもの、あるいは特許文献1に開示されているような人間の声帯の振動をバネ−質量モデルよりなる物理モデルにより模擬する手法などが提案されている。
特開2003−58175号公報
従来技術によるような人工声道の使用、機械的物理モデルでの模擬には、いったん模型またはモデルを作成するとその変更が困難であるという問題があり、一方、基本波の合成による音声合成には、人間の声道のような複雑な過程で発生した波形の再現に適さないという問題があった。
本発明の目的は、波動の伝播特性を忠実に模擬しつつ、その変化する伝播特性に容易に対応することが可能な波動合成装置を提供することである。
本発明の第1の側面による波動合成装置は、波動を表すパルス列を生成するパルス列生成部と、波動が伝播する媒体を電子回路により近似的に模擬し、パルス列が入力され、媒体の波動伝播特性に応じたパルス列を出力する波動伝播特性シミュレーション回路とを有する。そして、媒体を波動が伝播する伝播時間と電子回路の入出力間のパルス信号列の伝達時間とが関連付けられるように、電子回路が構成されていることを特徴とする。
このような構成としたことにより、波動伝播特性を模擬する電子回路の構成を変更することにより、種々の波動伝播特性を有するモデルに対する波動合成が可能となる。たとえば、本発明を、音声合成装置に適用すれば、人間の声道の多様な変形による多様な音声に対応することができ、合成音声は非常に自然なものとなる。
具体的には、電子回路は、パルス列処理回路であり、その入出力間でのパルス列伝達時間が、媒体を波動が伝播する伝播時間に関連付けられて設定されていることを特徴とする。
このようにすることにより、その入出力間でのパルス列伝達時間が、媒体を波動が伝播する伝播時間に所定の比率で関連付けられるように、パルス列処理回路を設計することができる。これは、パルス列処理回路の入出力間でのパルス列伝達時間は、その設計により決めることができるからである。
また、波動が伝播する系における波動の反射、減衰、共鳴のうちの少なくとも一つの物理現象を模擬するように、電子回路が構成されていることを特徴とする。
このようにすることにより、複雑な現実の物理現象を模擬することが可能となる。
具体的には、波動の減衰を模擬する電子回路は、媒体中での波動の減衰を表す減衰パラメータを設定する減衰パラメータ設定部と、波動を表すパルス列が入力され、減衰パラメータに基づき、減衰された波動を表すパルス列を出力するパルス列処理部とを有することを特徴とする。
波動の反射を模擬する電子回路は、波動が伝播する系における順方向波動を表す順方向パルス列と、この順方向波動の反射波を表す反対方向パルス列とを合成するパルス列合成部を有することを特徴とする。
波動の分波を模擬する電子回路は、パルス列を分波するパルス列分波部と、このパルス列分波部での分波割合を制御するパルス列分波制御部とを有することを特徴とする。
波動の合成を模擬する電子回路は、パルス列を合成するパルス列合成部と、このパルス列合成部での合成割合を制御するパルス列合成制御部とを有することを特徴とする。
本発明を音声合成装置に適用する場合、媒体が空気となり、電子回路は、シフトレジスタを含む回路で実現でき、シフトレジスタの段数が、そのクロック周波数および空気媒体を音波が伝播する伝播時間に基づいて決定されることを特徴とする。
このようにすることにより、波動(たとえば音波)の伝播を模擬する電子回路を適切に設計できる。
本発明の第1の側面による波動合成装置は、波動を表すパルス列を生成するパルス列生成部と、波動が伝播する媒体を電子回路により近似的に模擬し、パルス列が入力され、媒体の波動伝播特性に応じたパルス列を出力する波動伝播特性シミュレーション回路とを有する。そして、媒体を波動が伝播する伝播時間と電子回路の入出力間のパルス信号列の伝達時間とが関連付けられるように、電子回路が構成されていることを特徴とする。
このような構成としたことにより、波動伝播特性を模擬する電子回路の構成を変更することにより、種々の波動伝播特性を有するモデルに対する波動合成が可能となる。たとえば、本発明を、音声合成装置に適用すれば、人間の声道の多様な変形による多様な音声に対応することができ、合成音声は非常に自然なものとなる。
具体的には、電子回路は、パルス列処理回路であり、その入出力間でのパルス列伝達時間が、媒体を波動が伝播する伝播時間に関連付けられて設定されていることを特徴とする。
このようにすることにより、その入出力間でのパルス列伝達時間が、媒体を波動が伝播する伝播時間に所定の比率で関連付けられるように、パルス列処理回路を設計することができる。これは、パルス列処理回路の入出力間でのパルス列伝達時間は、その設計により決めることができるからである。
また、波動が伝播する系における波動の反射、減衰、共鳴のうちの少なくとも一つの物理現象を模擬するように、電子回路が構成されていることを特徴とする。
このようにすることにより、複雑な現実の物理現象を模擬することが可能となる。
具体的には、波動の減衰を模擬する電子回路は、媒体中での波動の減衰を表す減衰パラメータを設定する減衰パラメータ設定部と、波動を表すパルス列が入力され、減衰パラメータに基づき、減衰された波動を表すパルス列を出力するパルス列処理部とを有することを特徴とする。
波動の反射を模擬する電子回路は、波動が伝播する系における順方向波動を表す順方向パルス列と、この順方向波動の反射波を表す反対方向パルス列とを合成するパルス列合成部を有することを特徴とする。
波動の分波を模擬する電子回路は、パルス列を分波するパルス列分波部と、このパルス列分波部での分波割合を制御するパルス列分波制御部とを有することを特徴とする。
波動の合成を模擬する電子回路は、パルス列を合成するパルス列合成部と、このパルス列合成部での合成割合を制御するパルス列合成制御部とを有することを特徴とする。
本発明を音声合成装置に適用する場合、媒体が空気となり、電子回路は、シフトレジスタを含む回路で実現でき、シフトレジスタの段数が、そのクロック周波数および空気媒体を音波が伝播する伝播時間に基づいて決定されることを特徴とする。
このようにすることにより、波動(たとえば音波)の伝播を模擬する電子回路を適切に設計できる。
〔第1実施例〕
本発明の一実施形態を説明するに先立って、その基礎となる原理を説明する。
音波などの波の伝播は、媒体により異なり、空気中では、常温1気圧で、音波は、粗密波として、350メートル/秒(m/sec)程度の伝播速度を有する。たとえば、35センチメートル(cm)の長さの一様な断面形状の管を、音波が伝わる場合、その伝播時間は、35cm/(35,000cm/sec)=1ミリ秒(msec)である。
この35cmの管中での音波の伝播を、電子回路であるシフトレジスタで近似することを考える。音波の粗密波をパルス密度の変化でとらえ、音波が伝播する媒体モデルをシフトレジスタで表現する。この近似比を1000倍とすると、上述の伝播時間は、1マイクロ秒(μsec)となる。
シフトレジスタの同期回路のクロック周波数fを、100メガヘルツ(MHz)とする。パルスは、シフトレジスタ1段を、1/100MHz=1/100マイクロ秒(μsec)で伝播する。1マイクロ秒では、シフトレジスタを100段移動する。したがって、シフトレジスタ1段は、35cm/100=3.5mmの長さの空気媒体に対応する。このように、任意の形状の媒体を、シフトレジスタを用いて表現することが可能である。
図6は、この原理を模式的に示したものであり、近似比1000倍の場合、クロック周波数f=100メガヘルツ(MHz)で動作する100段のシフトレジスタは、音波にとって、常温1気圧の35cmの長さの空気媒体管に対応することを表している。
ところで、人間の「声の通り道」を、「声道」と呼ぶ。声道は、声門より上方の共鳴腔で,喉頭,咽頭,口腔,鼻腔から構成される。声道での「響き」により音声の特徴が変化し。その形状を変えることで様々な母音や子音が作られる。その際,母音の場合には声帯の振動が音源となり,子音の場合には声道内の狭めの位置で摩擦音源や破裂音源が作られたりする。
成人男性の声道は、平均17.5cmの長さである。そこで、平均的成人男性の声道は、175mm/3.5mm=50、すなわち50段のシフトレジスタで表現することができる。なお、近似比を100倍とすれば、伝播時間は10マイクロ秒となり、500段のシフトレジスタで表現されることになる。
以下、図面を参照して、本発明の一実施形態による波動合成装置の構成を説明する。
図1は、本発明の一実施形態による波動合成装置1の構成を示す。図1において、パルス列生成部10は、たとえば、人間の声帯の振動を表すパルス列を生成する。人間の声帯の振動によるアナログ音声信号をディジタル信号に変換するADコンバータ、およびディジタル音声周波数帯域信号に対してパルス密度変調を行なうΔΣ変調器などによっても構成することができる。このパルス列生成部10からのパルス列が、波動伝播特性シミュレーション回路20に入力される。
この波動伝播特性シミュレーション回路20は、図6を参照して説明した原理に基づき、人間の声道を模擬した電子回路であり、シフトレジスタで構成される。波動伝播特性シミュレーション回路20からは、人間の声道を伝播した音波を表すパルス列が出力される。この得られたパルス列は、パルス列−波動変換部30で、音波に変換される。このパルス列−波動変換部30は、パルス密度復調器、DAコンバータ、スピーカなどを含む。この波動合成装置1は、音声合成装置として機能する。すなわち、パルス列生成部10からのパルス列(声帯の振動)が、波動伝播特性シミュレーション回路20(声道)を経由して、パルス列−波動変換部30からの合成音声となる。
つぎに、波動伝播特性シミュレーション回路20に含まれる構成要素を説明する。図2は、伝播媒体における波動の減衰を模擬する回路の構成を示す。図2において,減衰パラメータ設定部21は、媒体中での波動の減衰(たとえば、声道における減衰)についてのパラメータを設定する。パルス列処理部22は、入力されたパルス列に対して、減衰パラメータ設定部21からの減衰パラメータにしたがって、減衰された波動を表すパルス列を出力する。
図3は、波動の反射を模擬する回路の構成を示す。図3において、反対方向パルス列生成部23には、たとえば口腔の内壁に向かって進む音波を表す順方向パルス列が入力される。反対方向パルス列生成部23は、内壁で反射された音波を表す反対方向パルス列を生成する。なお、口腔内壁での反射は、単純な反射ではなく、音波が内壁である程度吸収されるので、その吸収を考慮した反射音波を表す反対方向パルス列を生成する。パルス列合成部24には、順方向パルス列および反対方向パルス列が与えられ、順方向パルス列と反対方向パルス列との合成パルス列を生成する。この合成パルス列は、口腔内壁での音波反射を表す。
図4は、波動の分波を模擬する回路の構成を示す。図4において、パルス列分波部25には、パルス列が入力され、パルス列分波制御部26により指示される割合で、2つのパルス列(パルス列―1、パルス列―2)に分波される。これにより、声道での音波の分波が模擬される。
図5は、波動の合成を模擬する回路の構成を示す。図5において、パルス列合成部27には、2つのパルス列(パルス列―1、パルス列―2)が入力され、パルス列合成制御部28により指示される割合で、2つのパルス列が1つのパルス列に合成される。これにより、声道での音波の合成が模擬される。
以上、図2から図5を参照して説明した回路構成要素を数多く組み合わせて、波動伝播特性シミュレーション回路を構成することにより、減衰、反射、分波、合成、共鳴などの声道内での音波の複雑な伝播を模擬することができ、得られる合成音声は、人間の声に近い自然なものとなる。
次に、図2において示した波動の減衰を模擬する回路構成要素をシフトレジスタにより構成する例を、図7を参照して説明する。図7において、減衰パラメータ設定部21は、減衰パラメータが設定されたシフトレジスタ71を含み、パルス列処理部22は、パルス列が入力されるシフトレジスタ72を含む。また、パルス列処理部22は、シフトレジスタ72からの入力パルス列と、シフトレジスタ71からの減衰パラメータパルス列を合成するパルス列合成部73を含む。
図示の例では、シフトレジスタ71は、4段のシフトレジスタであり、減衰パラメータが格納されており、順次その内容を、パルス列合成部73に循環的に送出する。シフトレジスタ72は、入力パルス列を「0」「1」のデータで格納し、順次その内容を、パルス列合成部73に送出する。パルス列合成部73では、入力パルス列に減衰パラメータを合成し、減衰された波動に相当するパルス列を出力する。
他の、図3ないし図5に示した波動の反射、分波、合成を模擬する回路構成要素についても、同様にシフトレジスタを使用して実現できる。なお、波動伝播特性シミュレーション回路20は、これらの回路構成要素を組み合わせて構成されるが、そのシフトレジスタの段数は、図6について説明した原理にしたがって、決定される。
〔第2実施例〕
図8に示す本発明の波動伝播特性シミュレーションシステム8は、基本的には、音声合成(音声調音)部81と、制御部82と、出力部83とからなる。
音声合成部81は、発声器官をモデル化した音声合成回路であり、音声信号のディジタル処理にパルスを用いる。
制御部82は音声合成部81の制御やパラメータ設定を行うプロセッサおよびこのプロセッサを動作させるソフトウェア(ROMやRAMに格納されているプログラム)である。
出力部83は音声合成部81からの信号を、アンプ(デジタル増幅器すなわちD級アンプ)831を介してスピーカ832から出力する。
図9に示すように、音声合成部81は声帯擬似部811と声道擬似部812とからなる。声帯擬似部811は声帯を模擬するもので声帯回路8111とパルス変換回路8112とを含み、声道擬似部812は声道(咽頭,鼻腔,口腔)を模擬するもので、声道回路8121とPWM回路8122とを含む。
声帯回路8111はゲート6,000個から構成され49.643MHzで動作する。声帯回路8111では、音声信号を1bitのパルス列信号で扱い、音声生成の処理を行う。声道回路8121はゲート426,000個から構成され832.170MHzで動作する。
声帯回路8111は、VolumeとPitchのラメータの値を受け、基本波の振幅および周波数を変化させ、パルス変換回路8112がパルス変調を行う。
振幅の変化はVolumeパラメータとデータの値の乗算処理により算出される。また、周波数の変換も基本波の周波数とパラメータの値の乗算処理を行い、たとえば1倍から255倍まで周波数の変化をさせる。具体的には、基本波が10Hzである場合、10,20,30,・・・,2550Hzの範囲で変化することができる。
パルス変換回路8112は、振幅と周波数の変化(変調)を受けた基本波から、データの値の大きさ分のパルス(パルスの疎密信号)を生成して、後段に送出する。
声道回路8121は、声道をモデル化をした回路である。声道は、形を変える管状の器官であり、円筒管の連結として考えられる。そこで、音響管内部を音波が伝達しながら足し合わさる現象をディジタル処理で行う。パラメータによりパルス信号を調節して、音の減衰を表現をする。
また、音波の足し合わせの制御を行い、音波の足し合わせから、複雑な形の波が生成される。ここで、生成されたパルス信号は、PWM回路8122により変調して、前述したアンプ831に出力される。
〔実験例〕
製作した音声合成回路の各回路のパラメータによる処理結果を、ソフトウェアのアプリケーションやオシロスコープを用いて波形表示するとともにテキストファイル化した。
図10に、音声データ(波形図A1で示す)が音声合成ソフトウェア(ROMやRAMに格納されているプログラム)によりパルス化され、声帯擬似部811において声帯がシミュレートされて生成されたパルスが、声道擬似部812のレジスタ(声道回路8121)により声道のシミュレートを受け、これにより音声データ(波形図A2で示す)が生成された様子が示されている。
ソフトウェアにより生成された、量子化ビット8bit、サンプリング周波数44.1kHzの音声の基本波を入力信号とし、ハードウェア内部では基本波を値の大きさ分のパルスで変調を行った1bitのパルス列の信号で扱い、ソフトウェアからのパラメータ(声道パラメータ,減衰パラメータ)により調音処理を行う。後段のD級アンプには処理されたパルス列の信号をパルス幅変調をかけて出力しスピーカを通して音となって確認する。
また、信号測定を行って仕様どおりの処理結果であるかを声帯回路8111、声道回路8121についてそれぞれ別々に評価し、動作の確認をした。さらに、スピーカからの出力音を聞いてパラメータ変化による音の変化を確認した。
声帯回路8111の動作評価においては、周波数10HzのRosenberg波を基本波として、Pitchパラメータの値を変えることで仕様どおりパラメータ倍に基本波の周波数が調整できるかオシロスコープによって測定された波の周波数と仕様から予想される周波数を比較し確認した。また、音として変化を確認した。Volumeパラメータ調整についても同様に、音として変化を確認し、出力波形データをテキストファイル化し、それをグラフ化したもので比較し確認した。
周波数変化の波形を図12(A)〜(H)に示す。周波数は、仕様どおりPitchパラメータの値ずつ周波数が高くなっていることを,一定時間の範囲に含まれる波の数から確認した。また、図12(G)および(H)の二つは、Pitchパラメータより生成された150HzのRosenberg波と、ソフト側で生成した150HzのRosenberg波であり、波形が一致している。Pitchパラメータが図12(A)〜(H)で与えられた値のときに出力された音波の周波数をオシロスコープで測定した結果は、それぞれ仕様の周波数の値と一致した。
振幅変化の波形を図13に示す。振幅は、Volumeパラメータの値によって大きさが変化していることを確認できた。
すなわち、出力される音は、徐々に高くなっていく、または大きくなっていくというように、周波数、振幅ともにスムーズな変化を確認した。
声道回路8121の動作評価においては、音波が声道を伝達しながら足し合わされていくという現象を表現する。音波の伝達を検証するため、声道ブロックにおける入力段の音波波形と出力段の音波波形をアプリケーションから表示させ、音波のずれから伝達を確認した。また、音波の足し合わせを検証するため、パルスで表現をした音波の足し合わせ処理と、ソフトウェアで加算演算を行った結果とを比較する。
ここでは、振幅値を8ビット、0から255の値のなかから62に設定した10HzのRosenberg波を用いて音波の足し合わせを行った。
音波の伝達処理では、図14のように音波のずれ(δ)が発生し、声道回路8121の伝達動作を確認できた。音波の時間のずれは、約98.9msという結果が得られた。この値は、仕様で設定した値と一致している。パルスを用いたディジタル処理で音波の足し合わせを行った結果をソフトウェアにより計算した音波の足し合わせの結果と比較した(図15)。波の値を確認したところ、振幅が基本波の2倍になっていた。また、波形においてもソフトでの処理結果と一致した。
なお、音声のパルス列による表現例を以下に述べる。
音声は空気の粗密波(20〜20,000Hz)を、単位領域内のパルス密度で表す。たとえば、平均パルス密度波をdとし(d>0)、処理しようとしている2つの音声の密度変位をda(t),db(t)(>−d)としたときに、
パルス密度波Pa(t),Pb(t)は、
Pa(t)=d+da(t)(>0)
Pb(t)=d+db(t)(>0)
で表される。
たとえば、図11に示すように、密度波の重ね合わせは、変位成分のみが波として伝播し、進行波と後退波との合成,反射をレジスタR1〜R4および合成回路C1,反射回路C2により回路化することができる。
図11では、d+dc(t)=(d+da(t))+(d+db(t))−dとしてある。
なお、波動伝播特性シミュレーション回路が、シフトレジスタで構成できることは、コンピュータで実現することができることを意味する。コンピュータプログラムにより、波動伝播特性シミュレーション回路の構成を変更することは容易にできる。したがって、本発明を音声合成装置に適用する場合、多様に変化する人間の声道の形状にあわせて、回路構成を変更することが可能である。
なお、本発明は、上述の例のような音声合成に限られるものではなく、その原理から明らかなように、物質中を伝播する波動に広く適用することが可能である。
〔実験波形〕
図16に声道で共鳴して合成された波形例を示す。図17(A)〜(D)に合成位置,周波数,強度,減衰率などを変えた、合成変化が少なく周期的な合成波の例を示す。図18(A)〜(D)に合成位置,周波数,強度,減衰率などを変えた、合成変化が大きい周期的な合成波の例を示す。
本発明の一実施形態を説明するに先立って、その基礎となる原理を説明する。
音波などの波の伝播は、媒体により異なり、空気中では、常温1気圧で、音波は、粗密波として、350メートル/秒(m/sec)程度の伝播速度を有する。たとえば、35センチメートル(cm)の長さの一様な断面形状の管を、音波が伝わる場合、その伝播時間は、35cm/(35,000cm/sec)=1ミリ秒(msec)である。
この35cmの管中での音波の伝播を、電子回路であるシフトレジスタで近似することを考える。音波の粗密波をパルス密度の変化でとらえ、音波が伝播する媒体モデルをシフトレジスタで表現する。この近似比を1000倍とすると、上述の伝播時間は、1マイクロ秒(μsec)となる。
シフトレジスタの同期回路のクロック周波数fを、100メガヘルツ(MHz)とする。パルスは、シフトレジスタ1段を、1/100MHz=1/100マイクロ秒(μsec)で伝播する。1マイクロ秒では、シフトレジスタを100段移動する。したがって、シフトレジスタ1段は、35cm/100=3.5mmの長さの空気媒体に対応する。このように、任意の形状の媒体を、シフトレジスタを用いて表現することが可能である。
図6は、この原理を模式的に示したものであり、近似比1000倍の場合、クロック周波数f=100メガヘルツ(MHz)で動作する100段のシフトレジスタは、音波にとって、常温1気圧の35cmの長さの空気媒体管に対応することを表している。
ところで、人間の「声の通り道」を、「声道」と呼ぶ。声道は、声門より上方の共鳴腔で,喉頭,咽頭,口腔,鼻腔から構成される。声道での「響き」により音声の特徴が変化し。その形状を変えることで様々な母音や子音が作られる。その際,母音の場合には声帯の振動が音源となり,子音の場合には声道内の狭めの位置で摩擦音源や破裂音源が作られたりする。
成人男性の声道は、平均17.5cmの長さである。そこで、平均的成人男性の声道は、175mm/3.5mm=50、すなわち50段のシフトレジスタで表現することができる。なお、近似比を100倍とすれば、伝播時間は10マイクロ秒となり、500段のシフトレジスタで表現されることになる。
以下、図面を参照して、本発明の一実施形態による波動合成装置の構成を説明する。
図1は、本発明の一実施形態による波動合成装置1の構成を示す。図1において、パルス列生成部10は、たとえば、人間の声帯の振動を表すパルス列を生成する。人間の声帯の振動によるアナログ音声信号をディジタル信号に変換するADコンバータ、およびディジタル音声周波数帯域信号に対してパルス密度変調を行なうΔΣ変調器などによっても構成することができる。このパルス列生成部10からのパルス列が、波動伝播特性シミュレーション回路20に入力される。
この波動伝播特性シミュレーション回路20は、図6を参照して説明した原理に基づき、人間の声道を模擬した電子回路であり、シフトレジスタで構成される。波動伝播特性シミュレーション回路20からは、人間の声道を伝播した音波を表すパルス列が出力される。この得られたパルス列は、パルス列−波動変換部30で、音波に変換される。このパルス列−波動変換部30は、パルス密度復調器、DAコンバータ、スピーカなどを含む。この波動合成装置1は、音声合成装置として機能する。すなわち、パルス列生成部10からのパルス列(声帯の振動)が、波動伝播特性シミュレーション回路20(声道)を経由して、パルス列−波動変換部30からの合成音声となる。
つぎに、波動伝播特性シミュレーション回路20に含まれる構成要素を説明する。図2は、伝播媒体における波動の減衰を模擬する回路の構成を示す。図2において,減衰パラメータ設定部21は、媒体中での波動の減衰(たとえば、声道における減衰)についてのパラメータを設定する。パルス列処理部22は、入力されたパルス列に対して、減衰パラメータ設定部21からの減衰パラメータにしたがって、減衰された波動を表すパルス列を出力する。
図3は、波動の反射を模擬する回路の構成を示す。図3において、反対方向パルス列生成部23には、たとえば口腔の内壁に向かって進む音波を表す順方向パルス列が入力される。反対方向パルス列生成部23は、内壁で反射された音波を表す反対方向パルス列を生成する。なお、口腔内壁での反射は、単純な反射ではなく、音波が内壁である程度吸収されるので、その吸収を考慮した反射音波を表す反対方向パルス列を生成する。パルス列合成部24には、順方向パルス列および反対方向パルス列が与えられ、順方向パルス列と反対方向パルス列との合成パルス列を生成する。この合成パルス列は、口腔内壁での音波反射を表す。
図4は、波動の分波を模擬する回路の構成を示す。図4において、パルス列分波部25には、パルス列が入力され、パルス列分波制御部26により指示される割合で、2つのパルス列(パルス列―1、パルス列―2)に分波される。これにより、声道での音波の分波が模擬される。
図5は、波動の合成を模擬する回路の構成を示す。図5において、パルス列合成部27には、2つのパルス列(パルス列―1、パルス列―2)が入力され、パルス列合成制御部28により指示される割合で、2つのパルス列が1つのパルス列に合成される。これにより、声道での音波の合成が模擬される。
以上、図2から図5を参照して説明した回路構成要素を数多く組み合わせて、波動伝播特性シミュレーション回路を構成することにより、減衰、反射、分波、合成、共鳴などの声道内での音波の複雑な伝播を模擬することができ、得られる合成音声は、人間の声に近い自然なものとなる。
次に、図2において示した波動の減衰を模擬する回路構成要素をシフトレジスタにより構成する例を、図7を参照して説明する。図7において、減衰パラメータ設定部21は、減衰パラメータが設定されたシフトレジスタ71を含み、パルス列処理部22は、パルス列が入力されるシフトレジスタ72を含む。また、パルス列処理部22は、シフトレジスタ72からの入力パルス列と、シフトレジスタ71からの減衰パラメータパルス列を合成するパルス列合成部73を含む。
図示の例では、シフトレジスタ71は、4段のシフトレジスタであり、減衰パラメータが格納されており、順次その内容を、パルス列合成部73に循環的に送出する。シフトレジスタ72は、入力パルス列を「0」「1」のデータで格納し、順次その内容を、パルス列合成部73に送出する。パルス列合成部73では、入力パルス列に減衰パラメータを合成し、減衰された波動に相当するパルス列を出力する。
他の、図3ないし図5に示した波動の反射、分波、合成を模擬する回路構成要素についても、同様にシフトレジスタを使用して実現できる。なお、波動伝播特性シミュレーション回路20は、これらの回路構成要素を組み合わせて構成されるが、そのシフトレジスタの段数は、図6について説明した原理にしたがって、決定される。
〔第2実施例〕
図8に示す本発明の波動伝播特性シミュレーションシステム8は、基本的には、音声合成(音声調音)部81と、制御部82と、出力部83とからなる。
音声合成部81は、発声器官をモデル化した音声合成回路であり、音声信号のディジタル処理にパルスを用いる。
制御部82は音声合成部81の制御やパラメータ設定を行うプロセッサおよびこのプロセッサを動作させるソフトウェア(ROMやRAMに格納されているプログラム)である。
出力部83は音声合成部81からの信号を、アンプ(デジタル増幅器すなわちD級アンプ)831を介してスピーカ832から出力する。
図9に示すように、音声合成部81は声帯擬似部811と声道擬似部812とからなる。声帯擬似部811は声帯を模擬するもので声帯回路8111とパルス変換回路8112とを含み、声道擬似部812は声道(咽頭,鼻腔,口腔)を模擬するもので、声道回路8121とPWM回路8122とを含む。
声帯回路8111はゲート6,000個から構成され49.643MHzで動作する。声帯回路8111では、音声信号を1bitのパルス列信号で扱い、音声生成の処理を行う。声道回路8121はゲート426,000個から構成され832.170MHzで動作する。
声帯回路8111は、VolumeとPitchのラメータの値を受け、基本波の振幅および周波数を変化させ、パルス変換回路8112がパルス変調を行う。
振幅の変化はVolumeパラメータとデータの値の乗算処理により算出される。また、周波数の変換も基本波の周波数とパラメータの値の乗算処理を行い、たとえば1倍から255倍まで周波数の変化をさせる。具体的には、基本波が10Hzである場合、10,20,30,・・・,2550Hzの範囲で変化することができる。
パルス変換回路8112は、振幅と周波数の変化(変調)を受けた基本波から、データの値の大きさ分のパルス(パルスの疎密信号)を生成して、後段に送出する。
声道回路8121は、声道をモデル化をした回路である。声道は、形を変える管状の器官であり、円筒管の連結として考えられる。そこで、音響管内部を音波が伝達しながら足し合わさる現象をディジタル処理で行う。パラメータによりパルス信号を調節して、音の減衰を表現をする。
また、音波の足し合わせの制御を行い、音波の足し合わせから、複雑な形の波が生成される。ここで、生成されたパルス信号は、PWM回路8122により変調して、前述したアンプ831に出力される。
〔実験例〕
製作した音声合成回路の各回路のパラメータによる処理結果を、ソフトウェアのアプリケーションやオシロスコープを用いて波形表示するとともにテキストファイル化した。
図10に、音声データ(波形図A1で示す)が音声合成ソフトウェア(ROMやRAMに格納されているプログラム)によりパルス化され、声帯擬似部811において声帯がシミュレートされて生成されたパルスが、声道擬似部812のレジスタ(声道回路8121)により声道のシミュレートを受け、これにより音声データ(波形図A2で示す)が生成された様子が示されている。
ソフトウェアにより生成された、量子化ビット8bit、サンプリング周波数44.1kHzの音声の基本波を入力信号とし、ハードウェア内部では基本波を値の大きさ分のパルスで変調を行った1bitのパルス列の信号で扱い、ソフトウェアからのパラメータ(声道パラメータ,減衰パラメータ)により調音処理を行う。後段のD級アンプには処理されたパルス列の信号をパルス幅変調をかけて出力しスピーカを通して音となって確認する。
また、信号測定を行って仕様どおりの処理結果であるかを声帯回路8111、声道回路8121についてそれぞれ別々に評価し、動作の確認をした。さらに、スピーカからの出力音を聞いてパラメータ変化による音の変化を確認した。
声帯回路8111の動作評価においては、周波数10HzのRosenberg波を基本波として、Pitchパラメータの値を変えることで仕様どおりパラメータ倍に基本波の周波数が調整できるかオシロスコープによって測定された波の周波数と仕様から予想される周波数を比較し確認した。また、音として変化を確認した。Volumeパラメータ調整についても同様に、音として変化を確認し、出力波形データをテキストファイル化し、それをグラフ化したもので比較し確認した。
周波数変化の波形を図12(A)〜(H)に示す。周波数は、仕様どおりPitchパラメータの値ずつ周波数が高くなっていることを,一定時間の範囲に含まれる波の数から確認した。また、図12(G)および(H)の二つは、Pitchパラメータより生成された150HzのRosenberg波と、ソフト側で生成した150HzのRosenberg波であり、波形が一致している。Pitchパラメータが図12(A)〜(H)で与えられた値のときに出力された音波の周波数をオシロスコープで測定した結果は、それぞれ仕様の周波数の値と一致した。
振幅変化の波形を図13に示す。振幅は、Volumeパラメータの値によって大きさが変化していることを確認できた。
すなわち、出力される音は、徐々に高くなっていく、または大きくなっていくというように、周波数、振幅ともにスムーズな変化を確認した。
声道回路8121の動作評価においては、音波が声道を伝達しながら足し合わされていくという現象を表現する。音波の伝達を検証するため、声道ブロックにおける入力段の音波波形と出力段の音波波形をアプリケーションから表示させ、音波のずれから伝達を確認した。また、音波の足し合わせを検証するため、パルスで表現をした音波の足し合わせ処理と、ソフトウェアで加算演算を行った結果とを比較する。
ここでは、振幅値を8ビット、0から255の値のなかから62に設定した10HzのRosenberg波を用いて音波の足し合わせを行った。
音波の伝達処理では、図14のように音波のずれ(δ)が発生し、声道回路8121の伝達動作を確認できた。音波の時間のずれは、約98.9msという結果が得られた。この値は、仕様で設定した値と一致している。パルスを用いたディジタル処理で音波の足し合わせを行った結果をソフトウェアにより計算した音波の足し合わせの結果と比較した(図15)。波の値を確認したところ、振幅が基本波の2倍になっていた。また、波形においてもソフトでの処理結果と一致した。
なお、音声のパルス列による表現例を以下に述べる。
音声は空気の粗密波(20〜20,000Hz)を、単位領域内のパルス密度で表す。たとえば、平均パルス密度波をdとし(d>0)、処理しようとしている2つの音声の密度変位をda(t),db(t)(>−d)としたときに、
パルス密度波Pa(t),Pb(t)は、
Pa(t)=d+da(t)(>0)
Pb(t)=d+db(t)(>0)
で表される。
たとえば、図11に示すように、密度波の重ね合わせは、変位成分のみが波として伝播し、進行波と後退波との合成,反射をレジスタR1〜R4および合成回路C1,反射回路C2により回路化することができる。
図11では、d+dc(t)=(d+da(t))+(d+db(t))−dとしてある。
なお、波動伝播特性シミュレーション回路が、シフトレジスタで構成できることは、コンピュータで実現することができることを意味する。コンピュータプログラムにより、波動伝播特性シミュレーション回路の構成を変更することは容易にできる。したがって、本発明を音声合成装置に適用する場合、多様に変化する人間の声道の形状にあわせて、回路構成を変更することが可能である。
なお、本発明は、上述の例のような音声合成に限られるものではなく、その原理から明らかなように、物質中を伝播する波動に広く適用することが可能である。
〔実験波形〕
図16に声道で共鳴して合成された波形例を示す。図17(A)〜(D)に合成位置,周波数,強度,減衰率などを変えた、合成変化が少なく周期的な合成波の例を示す。図18(A)〜(D)に合成位置,周波数,強度,減衰率などを変えた、合成変化が大きい周期的な合成波の例を示す。
【0002】
また、模型による人工声道を使用し、より自然な音声を再現できるようにしたもの、あるいは特許文献1に開示されているような人間の声帯の振動をバネ−質量モデルよりなる物理モデルにより模擬する手法などが提案されている。
特開2003−58175号公報
従来技術によるような人工声道の使用、機械的物理モデルでの模擬には、いったん模型またはモデルを作成するとその変更が困難であるという問題があり、一方、基本波の合成による音声合成には、人間の声道のような複雑な過程で発生した波形の再現に適さないという問題があった。
発明の開示
本発明の目的は、波動の伝播特性を忠実に模擬しつつ、その変化する伝播特性に容易に対応することが可能な波動合成装置を提供することである。
本発明の第1の側面による波動合成装置は、波動の粗密状態を該複数のパルスの密度変化によって表現したパルス列を生成するパルス列生成部と、波動が伝播する媒体を模擬し、パルス列が入力され、媒体の波動伝播特性に応じて粗密状態が変化されたパルス列を出力する電子回路とを有する。そして、媒体を波動が伝播する伝播時間と電子回路の入出力間のパルス列の伝達時間とが関連付けられるように、電子回路が構成されていることを特徴とする。
このような構成としたことにより、波動伝播特性を模擬する電子回路の構成を変更することにより、種々の波動伝播特性を有するモデルに対する波動合成が可能となる。例えば、本発明を、音声合
また、模型による人工声道を使用し、より自然な音声を再現できるようにしたもの、あるいは特許文献1に開示されているような人間の声帯の振動をバネ−質量モデルよりなる物理モデルにより模擬する手法などが提案されている。
特開2003−58175号公報
従来技術によるような人工声道の使用、機械的物理モデルでの模擬には、いったん模型またはモデルを作成するとその変更が困難であるという問題があり、一方、基本波の合成による音声合成には、人間の声道のような複雑な過程で発生した波形の再現に適さないという問題があった。
発明の開示
本発明の目的は、波動の伝播特性を忠実に模擬しつつ、その変化する伝播特性に容易に対応することが可能な波動合成装置を提供することである。
本発明の第1の側面による波動合成装置は、波動の粗密状態を該複数のパルスの密度変化によって表現したパルス列を生成するパルス列生成部と、波動が伝播する媒体を模擬し、パルス列が入力され、媒体の波動伝播特性に応じて粗密状態が変化されたパルス列を出力する電子回路とを有する。そして、媒体を波動が伝播する伝播時間と電子回路の入出力間のパルス列の伝達時間とが関連付けられるように、電子回路が構成されていることを特徴とする。
このような構成としたことにより、波動伝播特性を模擬する電子回路の構成を変更することにより、種々の波動伝播特性を有するモデルに対する波動合成が可能となる。例えば、本発明を、音声合
Claims (9)
- 波動を表すパルス列を生成するパルス列生成部と、
波動が伝播する媒体を電子回路により近似的に模擬し、前記パルス列が入力され、前記媒体の波動伝播特性に応じたパルス列を出力する波動伝播特性シミュレーション回路とを有する波動合成装置であって、
前記媒体を波動が伝播する伝播時間と前記電子回路の入出力間のパルス信号列の伝達時間とが関連付けられるように、前記電子回路が構成されている
ことを特徴とする波動合成装置。 - 前記電子回路は、パルス列処理回路であり、その入出力間でのパルス列伝達時間が、前記媒体を波動が伝播する伝播時間に関連付けられて設定されていることを特徴とする請求の範囲第1項に記載の波動合成装置。
- 前記波動が伝播する系における波動の反射、減衰、共鳴のうちの少なくとも一つの物理現象を模擬するように、前記電子回路が構成されていることを特徴とする請求の範囲第1項または第2項に記載の波動合成装置。
- 前記電子回路が、
媒体中での波動の減衰を表す減衰パラメータを設定する減衰パラメータ設定部と、
波動を表すパルス列が入力され、前記減衰パラメータに基づき、減衰された波動を表すパルス列を出力するパルス列処理部とを有し、波動の減衰を模擬することを特徴とする請求の範囲第1項または第2項に記載の波動合成装置。 - 前記電子回路が、
前記波動が伝播する系における順方向波動を表す順方向パルス列と、
この順方向波動の反射波を表す反対方向パルス列とを合成するパルス列合成部とを有し、
波動の反射を模擬する
ことを特徴とする請求の範囲第1項または第2項に記載の波動合成装置。 - 前記電子回路が、
パルス列を分波するパルス列分波部と、
このパルス列分波部での分波割合を制御するパルス列分波制御部とを有する
ことを特徴とする請求の範囲第1項または第2項に記載の波動合成装置。 - 前記電子回路が、
パルス列を合成するパルス列合成部と、
このパルス列合成部での合成割合を制御するパルス列合成制御部とを有する
ことを特徴とする請求の範囲第1項または第2項に記載の波動合成装置。 - 前記波動が音波、前記媒体が空気、前記電子回路がシフトレジスタを含む回路であり、
前記シフトレジスタの段数が、そのクロック周波数および空気媒体を音波が伝播する伝播時間に基づいて決定される
ことを特徴とする請求の範囲第1項から第7項の何れかに記載の波動合成装置。 - 前記電子回路が声帯と声道を擬似することを特徴とする請求項1から8の何れかに記載の波動合成装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006026423 | 2006-02-03 | ||
JP2006026423 | 2006-02-03 | ||
PCT/JP2007/052431 WO2007097215A1 (ja) | 2006-02-03 | 2007-02-05 | 波動合成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2007097215A1 true JPWO2007097215A1 (ja) | 2009-07-09 |
Family
ID=38437255
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008501677A Pending JPWO2007097215A1 (ja) | 2006-02-03 | 2007-02-05 | 波動合成装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPWO2007097215A1 (ja) |
WO (1) | WO2007097215A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5103617B2 (ja) * | 2006-02-03 | 2012-12-19 | 国立大学法人東京農工大学 | 波動合成装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02294696A (ja) * | 1989-05-10 | 1990-12-05 | Yamaha Corp | 残響付与方法 |
JPH03255499A (ja) * | 1990-03-06 | 1991-11-14 | Yamaha Corp | 管体シミュレーション装置 |
JPH07146678A (ja) * | 1993-11-22 | 1995-06-06 | Kawai Musical Instr Mfg Co Ltd | 音響信号を電子的に処理する手段を有する管楽器 |
JPH0833749B2 (ja) * | 1987-06-15 | 1996-03-29 | 株式会社明電舎 | 音合成方法 |
JP2508340B2 (ja) * | 1990-02-14 | 1996-06-19 | ヤマハ株式会社 | 楽音波形信号形成装置 |
JP2007233379A (ja) * | 2006-02-03 | 2007-09-13 | Tokyo Univ Of Agriculture & Technology | 波動合成装置 |
-
2007
- 2007-02-05 JP JP2008501677A patent/JPWO2007097215A1/ja active Pending
- 2007-02-05 WO PCT/JP2007/052431 patent/WO2007097215A1/ja active Search and Examination
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0833749B2 (ja) * | 1987-06-15 | 1996-03-29 | 株式会社明電舎 | 音合成方法 |
JPH02294696A (ja) * | 1989-05-10 | 1990-12-05 | Yamaha Corp | 残響付与方法 |
JP2508340B2 (ja) * | 1990-02-14 | 1996-06-19 | ヤマハ株式会社 | 楽音波形信号形成装置 |
JPH03255499A (ja) * | 1990-03-06 | 1991-11-14 | Yamaha Corp | 管体シミュレーション装置 |
JPH07146678A (ja) * | 1993-11-22 | 1995-06-06 | Kawai Musical Instr Mfg Co Ltd | 音響信号を電子的に処理する手段を有する管楽器 |
JP2007233379A (ja) * | 2006-02-03 | 2007-09-13 | Tokyo Univ Of Agriculture & Technology | 波動合成装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2007097215A1 (ja) | 2007-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Linggard | Electronic synthesis of speech | |
EP0982713A2 (en) | Voice converter with extraction and modification of attribute data | |
Elie et al. | Extension of the single-matrix formulation of the vocal tract: Consideration of bilateral channels and connection of self-oscillating models of the vocal folds with a glottal chink | |
JP2002023775A (ja) | 音声合成における表現力の改善 | |
Styger et al. | Formant synthesis | |
Mullen et al. | Waveguide physical modeling of vocal tract acoustics: flexible formant bandwidth control from increased model dimensionality | |
EP0391545B1 (en) | Speech synthesizer | |
Borin et al. | Musical signal synthesis | |
Loscos et al. | Emulating rough and growl voice in spectral domain | |
JPWO2007097215A1 (ja) | 波動合成装置 | |
D’Alessandro et al. | Realtime and accurate musical control of expression in singing synthesis | |
Kob | Singing voice modelling as we know it today | |
JP2009116169A (ja) | シミュレーション装置およびプログラム | |
JP3394281B2 (ja) | 音声合成方式および規則合成装置 | |
JP2504324B2 (ja) | 楽音合成装置 | |
JP5103617B2 (ja) | 波動合成装置 | |
Raajan et al. | Mathematical modeling of speech production and its application to noise cancellation | |
Alexander et al. | VCV Synthesis Using Task Dynamics to Animate a Factor-Based Articulatory Model. | |
JP3130305B2 (ja) | 音声合成装置 | |
Childers et al. | Articulatory synthesis: nasal sounds and male and female voices | |
JP2824555B2 (ja) | 音圧推定装置 | |
JPH03210600A (ja) | 楽音制御装置 | |
JP2990693B2 (ja) | 音声合成装置 | |
JPH0833749B2 (ja) | 音合成方法 | |
JP2992995B2 (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111025 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120306 |