JP2012042722A - 音声生成装置およびその制御プログラム - Google Patents

音声生成装置およびその制御プログラム Download PDF

Info

Publication number
JP2012042722A
JP2012042722A JP2010183923A JP2010183923A JP2012042722A JP 2012042722 A JP2012042722 A JP 2012042722A JP 2010183923 A JP2010183923 A JP 2010183923A JP 2010183923 A JP2010183923 A JP 2010183923A JP 2012042722 A JP2012042722 A JP 2012042722A
Authority
JP
Japan
Prior art keywords
coordinate value
formant
frequency
sound
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010183923A
Other languages
English (en)
Other versions
JP5224552B2 (ja
Inventor
Tatsu Ifukube
達 伊福部
Mitsuo Hashiba
参生 橋場
Yasunori Sukai
保徳 須貝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Densei Kk
Hokkaido Research Organization
Densei Communication Inc
Original Assignee
Densei Kk
Hokkaido Research Organization
Densei Communication Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Densei Kk, Hokkaido Research Organization, Densei Communication Inc filed Critical Densei Kk
Priority to JP2010183923A priority Critical patent/JP5224552B2/ja
Publication of JP2012042722A publication Critical patent/JP2012042722A/ja
Application granted granted Critical
Publication of JP5224552B2 publication Critical patent/JP5224552B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】簡単な操作で、リアルタイムに音声を生成する。
【解決手段】表示部12には、第1ホルマント周波数と第2ホルマント周波数の2次元平面上における分布が音声生成GUIとして表示されており、そのGUI上には、母音a,i,u,e,oを発したときの第1ホルマント周波数と第2ホルマント周波数が、「a」、「i」、「u、「e」、「o」としてそれぞれ示されている。ユーザは、発話内容を、マウス11Aを用いて音声生成GUI上で操作する。音声生成装置1は、マウス11Aの動作に追随するポインタPが描いた軌跡から、第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるXY座標位置を検出し、検出したX座標値で規定されている第1ホルマント周波数の音声と、Y座標値で規定されている第2ホルマント周波数の音声とを合成し、合成した疑似的な音声をスピーカ13から発声させる。
【選択図】図2

Description

本発明は、音声生成装置およびその制御プログラムに関し、特に、簡単な操作で、リアルタイムに音声を生成することが可能な音声生成装置およびその制御プログラムに関する。
人間が互いに意思や感情を伝達し合うコミュニケーションの手段には、言語、文字、その他の視覚や聴覚に訴える身振り、表情、声などの手段があるが、日常生活においては、音声による会話が果たす役割は非常に大きい。音声は、コミュニケーションの手段として言語情報を伝達するだけでなく、その音質によって、話し手が誰であるかという情報や、音楽的情報をも表現することができる。
人が声を出す際には、肺の呼吸運動によって与えられる肺呼気(空気の流れ)を喉頭の中央にある声帯において振動エネルギーに変換し、この振動によって音声の基本となる音(声)を生成している。これを喉頭原音あるいは声帯原音と呼ぶ。
一方、人は、この喉頭原音(原音の基本周波数は、成人男性で約120Hz、女性で約240Hz程度)を、声道と呼ばれる咽頭、口腔、鼻腔などで共鳴させることによって修飾し、さらに唇、舌、顎などの助力によって音色に変化を与えることで所望の音声波形を生成している。これを構音と呼ぶ。
しかし、唇、舌、顎などの欠損や変形、脳性麻痺や脳血管障害、筋ジストロフィーやパーキンソン病等の筋・神経系難病などにより、唇、舌、顎などを使った構音機能に何らかの異常が生じると、音声会話に必要な音色の変化を十分に生成することができないという発声障害を引き起こしてしまう。
そこで、近年、このような発声障害を支援するいくつかの機器が提案されている。例えば、ユーザがスイッチを操作することによって予め決められた言葉を発する装置、発話内容を第3者が予め録音しておき、それを再生する装置、あるいは、キー操作によって発話内容を入力すると、その発話内容を音声合成して発する装置がある。
特開2005−241744号公報 特開平11−237946号公報
しかしながら、従来の発声障害支援装置は、発話内容が限定され、リアルタイムな発話が困難であり、さらに感情(抑揚)を表現することが困難であった。
本発明はこのような状況に鑑みてなされたものであり、その目的は、簡単な操作で、リアルタイムに音声を生成することが可能な音声生成装置およびその制御プログラムを提供することである。
本発明の一側面は、基本周波数の音声データを生成する音源生成手段と、入力手段の操作に基づいて座標値を検出する座標値検出手段と、音源生成手段で生成された前記基本周波数の音声データを、座標値検出手段により検出された座標値に対応する第1の周波数で共振させる第1の共振手段と、第1の共振手段により共振された音声データを、座標値検出手段により検出された座標値に対応する第2の周波数で共振させる第2の共振手段とを備えることを特徴とする。
本発明の一側面は、基本周波数の音声データを生成する音源生成ステップと、入力手段の操作に基づいて座標値を検出する座標値検出ステップと、音源生成ステップで生成された基本周波数の音声データを、座標値検出ステップにより検出された座標値に対応する第1の周波数で共振させる第1の共振ステップと、第1の共振ステップにより共振された音声データを、座標値検出ステップにより検出された座標値に対応する第2の周波数で共振させる第2の共振ステップとを含む処理をコンピュータに実行させることを特徴とする。
本発明によれば、簡単な操作で、リアルタイムに音声を生成することが可能な音声生成装置およびその制御プログラムを提供することができる。
母音の発声の仕組みについて説明するための図である。 第1の実施の形態に係る音声生成装置の構成例を示す図である。 音声生成GUIの表示例を示す図である。 音声生成装置の機能構成例を示すブロック図である。 音声生成処理を説明するフローチャートである。 第2の実施の形態に係る操作バーと携帯型の音声生成装置の接続例を示す図である。 操作バーと携帯型の音声生成装置の内部の構成例を示すブロック図である。 音声生成装置の他の機能構成例を示すブロック図である 本発明を適用したコンピュータの構成例を示すブロック図である。
以下、本発明の実施の形態について図面を参照して詳細に説明する。
[母音の発声の仕組み]
図1は、母音の発声の仕組みについて説明するための図である。
人間から発声される音声は、肺から押し出される呼気が唇から放射されるまでに通過する声道(喉頭、咽頭、口腔、鼻腔からなる共鳴腔)の形によって作り出される。つまり、声帯から唇までの声道を1つの音響管と考えると、声道で共鳴現象が生じることで発声される。この共鳴によって強められた共振周波数をホルマントと呼ぶ。ホルマントは、複数個発生し、周波数の低い方から第1ホルマント(F1)、第2ホルマント(F2)、・・・と呼ぶ。この複数のホルマントによって、声の種類(音色)が決まる。
また、声道は、母音によって極めて複雑な形状を示し、声道の形は、舌や唇を使って変えられている。図1(A)に示すように、舌の最も盛り上がっているところを舌の調音位置と呼び、この調音位置が母音a,i,u,e,oの種類によって特徴的に推移している。この推移しているところを線で結ぶと、五角形になる。母音の種類によって推移する顎の開閉具合と舌の調音位置(舌によって声道が狭められる位置)と、第1ホルマントの周波数および第2ホルマントの周波数の間には、図1(B)に示すような密接な対応関係がある。図1(B)において、横軸は第1ホルマント周波数(F1)を示し、縦軸は第2ホルマント周波数(F2)を示している。
図1(B)には、分かりやすい例として、代表的な男性の声(図中実線で示す)と代表的な女性の声(図中点線で示す)のパターンの例を示している。点Ma,点Mi,点Mu,点Me,点Moは、それぞれ、男性が母音a,i,u,e,oを発したときの第1ホルマント周波数と第2ホルマント周波数を示し、点Fa,点Fi,点Fu,点Fe,点Foは、それぞれ、女性が母音a,i,u,e,oを発したときの第1ホルマント周波数と第2ホルマント周波数を示している。
図1(B)に示すように、男性の声と女性の声とでは、同じ母音であっても、第1ホルマント周波数と第2ホルマント周波数の組み合わせが異なる。また、5つの母音全てについての組み合わせは、男性と女性とで異なる五角形を描くことができる。図1(B)では、男性と女性の例により示したが、実際には、この五角形は話者によって異なる。
以上のように、第1ホルマント周波数と第2ホルマント周波数の組み合わせ(合成)によって、母音を模倣することができ、音声を疑似的に生成することが可能となる。
[本発明の第1の実施の形態]
図2は、本発明の第1の実施の形態としての音声生成装置1の構成例を示す図である。
音声生成装置1は、CPU(Central Processing Unit)、ROM(Read Only Memory)、およびRAM(Random Access Memory)、HDD(Hard Disk Drive)などを実装した汎用のコンピュータシステムで構成され、入力デバイス11と表示部12を有している。なお、図2に示す入力デバイス11と表示部12は、音声生成装置1と一体に構成されているが、別体で構成するようにしても良い。
音声生成装置1は、入力デバイス11からの入力信号に基づいて、ROMなどに記憶されている音声生成ソフトウェアを読み出し、読み出した音声生成ソフトウェアを実行する。音声生成装置1は、音声生成ソフトウェアの実行により、表示部12に音声生成GUI(Graphical User Interface)を表示させ、そのGUIへの入力信号に基づいて、所定の音声を生成し、スピーカ13を介して再生(発声)させる。
例えば、表示部12には、図2に示すように、第1ホルマント周波数と第2ホルマント周波数の2次元平面上における分布が音声生成GUIとして表示されており、そのGUI上には、母音a,i,u,e,oを発したときの第1ホルマント周波数と第2ホルマント周波数が、「a」、「i」、「u、「e」、「o」としてそれぞれ示されている。
ユーザは、スピーカ13から発声させたい発話内容を、マウス11A(あるいはタッチパッド11B)を用いて音声生成GUI上に軌跡を描く。軌跡の描き方は、例えば、マウス11Aを押下したまま、発話内容に準ずる位置を辿りながら、所望の位置でマウス11Aの押下を解除する。音声生成装置1は、マウス11Aの動作に追随するポインタPが描いた軌跡から、第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるXY座標位置を検出し、検出したX座標値で規定されている第1ホルマント周波数の音声と、Y座標値で規定されている第2ホルマント周波数の音声とを合成し、合成した疑似的な音声をスピーカ13から発声させる。
入力デバイス11は、マウス11A、タッチパッド11B、およびキーボード11Cなどからなり、ユーザによって入力された入力信号を音声生成装置1に供給する。
表示部12は、例えば、液晶ディスプレイであり、ユーザによって起動された音声生成ソフトウェアに応じた音声生成GUIを表示する。
図3は、音声生成ソフトウェアが実行されることに応じて表示部12に表示される、音声生成GUIの表示例を示す図である。
図3に示す表示例では、軌跡L1(図中実線で示す)と軌跡L2(図中点線で示す)が示されている。ユーザによってマウス11Aを用いて軌跡L1が描かれると、音声生成装置1は、検出したXY座標値から、「おはよう」に聞こえる疑似的な音声を生成し、スピーカ13から発声させる。また、ユーザによってマウス11Aを用いて軌跡L2が描かれると、音声生成装置1は、検出したXY座標値から、「あおいうみ」に聞こえる疑似的な音声を生成し、スピーカ13から発声させる。
図4は、音声生成装置1の機能構成例を示すブロック図である。図4に示す機能部のうちの少なくとも一部は、音声生成装置1のCPUにより音声生成ソフトウェアが実行されることによって実現される。
音声生成装置1は、音源生成部21、音声生成部22、D/A(Digital to Analog)変換器23、および増幅器24から構成される。
音源生成部21は、ユーザの操作によって図示せぬON/OFFスイッチからオン信号が供給されると、基本周波数の音声データ(基本音声データ)を生成し、それを音声生成部22に出力する。
音声生成部22は、座標値検出部31、第1ホルマント共振器32、および第2ホルマント共振器33を有する。
座標値検出部31は、入力デバイス11からの入力信号に基づいて、第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるXY座標値を検出し、検出したX座標値を第1ホルマント共振器32に出力し、検出したY座標値を第2ホルマント共振器33に出力する。
第1ホルマント共振器32は、音源生成部21から入力された基本音声データを、座標値検出部31からの入力情報(第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるX座標値)に対応する第1ホルマント周波数で共振させた後、第2ホルマント共振器33に出力する。
第2ホルマント共振器33は、第1ホルマント共振器32から入力された、第1ホルマント周波数で共振された音声データを、座標値検出部31からの入力情報(第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるY座標値)に対応する第2ホルマント周波数でさらに共振させた後、D/A変換器23に出力する。
D/A変換器23は、第2ホルマント共振器32から入力された、第1ホルマント周波数および第2ホルマント周波数で共振された音声データをD/A変換し、増幅器24に出力する。
増幅器24は、D/A変換器23の出力信号(疑似的な音声)を増幅し、スピーカ13に出力する。
次に、図5のフローチャートを参照して、音声生成ソフトウェアが実行する音声生成処理について説明する。
この処理を開始するにあたり、音声生成ソフトウェアの起動に伴って、表示部12には、図2に示したような音声生成GUIが表示されている。
ステップS1において、座標値検出部31は、音声生成GUI上で操作が開始されたか否かを判定し、音声生成GUI上で操作が開始されるまで待機する。操作の開始とは、例えば、ユーザによりマウス11Aが押下されることである。また後述する、操作の終了とは、マウス11Aが押下されたままドラッグされた後(軌跡が描かれた後)、押下が解除されることである。
ステップS1において、座標値検出部31は、音声生成GUI上で操作が開始された、すなわち、マウス11Aが押下されたと判定した場合、ステップS2に進み、第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるXY座標値を検出する。またこのとき、ユーザの操作によって図示せぬON/OFFスイッチからオン信号が供給され、音源生成部21から基本周波数の音声データ(基本音声データ)が出力される。
ステップS3において、第1ホルマント共振器32は、音源生成部21から入力された基本音声データを、ステップS2の処理によって検出された、第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるX座標値に対応する第1ホルマント周波数で共振させる。
ステップS4において、第2ホルマント共振器33は、ステップS3の処理によって第1ホルマント周波数で共振された音声データを、ステップS2の処理によって検出された、第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるY座標値に対応する第2ホルマント周波数で共振させる。
ステップS5において、D/A変換器23は、ステップS4の処理によって第2ホルマント共振器33で共振された音声データをD/A変換する。増幅器24は、D/A変換された出力信号を増幅し、疑似的な音声、すなわち、第1ホルマント周波数と第2ホルマント周波数の変化に応じて模倣された母音をスピーカ13から発声させる。
ステップS6において、座標値検出部31は、音声生成GUI上で操作が終了されたか否か、すなわち、マウス11Aの押下が解除されたか否かを判定し、まだ操作が終了していないと判定した場合、ステップS2に戻り、上述した処理を繰り返し実行する。そして、ステップS6において、座標値検出部31は、音声生成GUI上で操作が終了したと判定した場合、音声生成処理を終了する。
[発明の第1の実施の形態における効果]
以上のように、第1の実施の形態によれば、マウス11Aやタッチパッド11Bなどを用いて、直感的な操作で、疑似的な音声をリアルタイムに生成することが可能となる。
また、音声生成部22は、第1ホルマント周波数と第2ホルマント周波数の値を通じて、発声時の顎の開閉具合や舌の位置による調音位置をシミュレートしているため、生成できる音声は、日本語5母音に限らず、外国語の各種母音や、日本語として意味をなさない音声を生成させることも可能となる。
さらに、マウス11Aやタッチパッド11Bによる操作軌跡と操作速度を適当に選択することによって、半母音や鼻音に似た音声を生成することも可能である。
[本発明の第2の実施の形態]
次に、本発明の第2の実施の形態について、図6および図7を参照して説明する。
図6は、第2の実施の形態としての操作バー51と携帯型の音声生成装置52の接続例を示し、図7は、操作バー51と携帯型の音声生成装置52の内部の構成例を示すブロック図である。
操作バー51には、図7に示すように、回転素子または振動素子などを内蔵したジャイロセンサ61が搭載されている。ジャイロセンサ61は、X軸方向、Y軸方向、Z軸方向の加速度をそれぞれ検出し、検出結果を音声生成装置52に出力する。音声生成装置52は、予め、空間上における操作バー51の動作(移動方向と移動量)に応じて、第1ホルマント周波数と第2ホルマント周波数の2次元平面上における分布を対応させた情報を記憶しており、操作バーの動作に応じて疑似的な音声を生成する。
音声生成装置52は、電源部71、音声生成部72、およびスピーカ73を有している。
電源部71は、例えば、電池あるいはバッテリであり、音声生成部72やスピーカ73などへ電力を供給する。
音声生成部72は、第1の実施の形態において図4に示した機能を有しており、操作バー51の動作(検出結果)から、第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるXY座標値を検出し、検出したX座標値で規定されている第1ホルマント周波数の音声と、Y座標値で規定されている第2ホルマント周波数の音声とを合成し、合成した疑似的な音声をスピーカ73から発声させる。
[発明の第2の実施の形態における効果]
以上のように、第2の実施の形態によれば、操作バー51を用いて、直感的な操作で、疑似的な音声をリアルタイムに生成することが可能となる。
[変形例]
1.以上においては、入力デバイスとして、マウス11A、タッチパッド11B、および操作バー51を用いる場合を例に説明したが、他にも、タッチペンやジョイスティックなどを利用することも勿論可能である。つまり、ユーザの症例に合わせて入力デバイスを切り替えるようにすることが好ましい。
2.また、操作バー51にジャイロセンサ61を搭載するようにしたが、加圧センサをさらに搭載することにより、操作バー51を握る量に応じて周波数を変化させ、生成する音声に抑揚を持たせることも可能である。
3.さらに、音源生成部21で生成する基本周波数の音声データの種類を変更することにより、男性の声、女性の声など様々な音声を生成することが可能となる。
4.なお、上述において、第1ホルマント周波数と第2ホルマント周波数を組み合わせることにより、母音を疑似的に生成することができるが、本実施の形態はこれに限定されず、第3ホルマント周波数と第4ホルマント周波数をさらに組み合わせることにより、声の性質や特徴をも加味することが可能である。
5.また、以上においては、母音の組み合わせで疑似的な音声を生成するようにしたが、さらに子音を組み合わせることにより、より自然な音声を生成することが可能となる。
図8は、より高品質な音声を生成する音声生成装置1の機能構成例を示すブロック図である。なお、図4に示した構成要素と同一の構成要素には同一の符号を付してあり、重複する説明は適宜省略する。
図8に示す音声生成装置1には、音源生成部21、音声生成部22、D/A変換器23、増幅器24の他、加算器25、乱流音生成部26、加算器27、鼻音生成部28、およびハイパスフィルタ(HPF)34が新たに設けられている。
音声生成部22には、座標値検出部31、第1ホルマント共振器32、第2ホルマント共振器33の他、第3ホルマント共振器35および第4ホルマント共振器36が新たに設けられている。また、鼻音生成部28には、鼻音生成用共振器37が設けられている。
座標値検出部31は、入力デバイス11からの入力信号に基づいて、第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるXY座標値を検出し、検出したX座標値を第1ホルマント共振器32および乱流音生成部26の第1ホルマント共振器86に出力し、検出したY座標値を第2ホルマント共振器33および乱流音生成部26の第2ホルマント共振器87に出力する。
また座標値検出部31は、入力デバイス11からの入力信号に基づいて、第3ホルマント周波数と第4ホルマント周波数の2次元平面上におけるXY座標値を検出し、検出したX座標値を第3ホルマント共振器35および乱流音生成部26の第3ホルマント共振器88に出力し、検出したY座標値を第4ホルマント共振器36および乱流音生成部26の第4ホルマント共振器89に出力する。さらに座標値検出部31は、入力デバイス11からの入力信号に基づいて、鼻音の有無を判断し、その判断結果を鼻音生成部28の鼻音生成用共振器37を通知する。たとえば、図3の例において、「u」のやや左側から「i」付近の位置に向かう軌跡を描くようにマウス11Aが操作されたとき、「み」に近い音(鼻音を含む音)が発生されるので、入力信号からそのような軌跡が検出された場合は、鼻音の有と判断され、その判断結果が、鼻音生成部28の鼻音生成用共振器37に通知される。
ハイパスフィルタ34は、音源生成部21からの基本周波数の音声データのうち、高周波を通過させ、遮断周波数より低い周波数の帯域を減衰させた後、第1ホルマント共振器32および鼻音生成用共振器37に出力する。
第1ホルマント共振器32、第2ホルマント共振器33、第3ホルマント共振器35、および第4ホルマント共振器36は、音源生成部21で生成されハイパスフィルタ34で低周波成分が除去された音声データを、座標値検出部31からの入力情報に対応してそれぞれの共振周波数で共振させる。鼻音生成用共振器37は、鼻音の有の旨が、座標値検出部31から通知されると、音源生成部21で生成された音声データを所定の共振周波数で共振させて鼻音となる音声データを生成する。
加算器25は、第1ホルマント共振器32、第2ホルマント共振器33、第3ホルマント共振器35、および第4ホルマント共振器36のそれぞれのホルマント周波数で共振された音声データと、鼻音生成用共振器37の共振周波数で共振された音声データを加算する。
乱流音生成部26は、疑似乱数発生器81乃至85、第1ホルマント共振器86、第2ホルマント共振器87、第3ホルマント共振器88、および第4ホルマント共振器89を有する。
疑似乱数発生器81乃至84は、摩擦音などの子音を合成するための音源を疑似乱数によって生成し、第1ホルマント共振器86、第2ホルマント共振器87、第3ホルマント共振器88、第4ホルマント共振器89にそれぞれ供給する。疑似乱数発生器85は、声道での共鳴を伴わない子音を合成するための音源を疑似乱数によって生成し、第4ホルマント共振器89の出力後段に供給している。
第1ホルマント共振器86は、疑似乱数発生器81で生成された子音用の音源データを、座標検出部31からの入力情報に対応する第1ホルマント周波数で共振させる。
第2ホルマント共振器87は、第1ホルマント共振器86から出力された音声データ、及び、疑似乱数発生器82で生成された子音用の音源データを、座標検出部31からの入力情報に対応する第2ホルマント周波数で共振させる。
第3ホルマント共振器88は、第2ホルマント共振器87から出力された音声データ、及び、疑似乱数発生器83で生成された子音用の音源データを、座標検出部31からの入力情報に対応する第3ホルマント周波数で共振させる。
第4ホルマント共振器89は、第3ホルマント共振器88から出力された音声データ、及び、疑似乱数発生器84で生成された子音用の音源データを、座標検出部31からの入力情報に対応する第4ホルマント周波数で共振させる。
加算器27は、加算器25から出力された音声データと乱流音生成部26から出力された音声データを加算する。D/A変換器23は、加算器27から入力された音声データをD/A変換し、増幅器24を介してスピーカ13に出力する。
以上のような構成によって、第1ホルマント周波数および第2ホルマント周波数だけでなく、第3ホルマント周波数および第4ホルマント周波数を組み合わせた音声を生成することが可能となる。また、鼻音と乱流音の音声データを組み合わせることにより、鼻音化された母音や、摩擦音などの子音を含んだより自然な音声を生成することが可能となる。
6.上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
図9は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU101,ROM102,RAM103、および入出力インターフェース104は、バス105により相互に接続されている。
入出力インターフェース104には、さらに、キーボード、マウス、タッチパッド、操作バー、マイクロホンなどよりなる入力部106、ディスプレイ、スピーカなどよりなる出力部107、ハードディスクや不揮発性のメモリなどよりなる記憶部108、ネットワークインタフェースなどよりなる通信部109、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111を駆動するドライブ110が接続されている。
以上のように構成されるコンピュータでは、CPU101が、例えば、記憶部108に記憶されているプログラムを、入出力インターフェース104およびバス105を介して、RAM103にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU101)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア111に記録して、あるいは、ローカルエリアネットワーク、インタネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
そして、プログラムは、リムーバブルメディア111をドライブ110に装着することにより、入出力インターフェース104を介して、記憶部108にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部109で受信し、記憶部108にインストールすることができる。その他、プログラムは、ROM102や記憶部108に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。また、プログラムを実行するハードウェアとして、汎用コンピュータの他に、携帯電話、ゲーム端末、電子音楽プレーヤ、電子書籍リーダなどを利用しても良い。
7.この発明は、上記実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化したり、上記実施の形態に開示されている複数の構成要素を適宜組み合わせたりすることにより種々の発明を形成できる。例えば、実施の形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施の形態に亘る構成要素を適宜組み合わせても良い。
1 音声生成装置
11 入力デバイス
12 表示部
13 スピーカ
21 音源生成部
22 音声生成部

Claims (5)

  1. 基本周波数の音声データを生成する音源生成手段と、
    入力手段の操作に基づいて座標値を検出する座標値検出手段と、
    前記音源生成手段で生成された前記基本周波数の音声データを、前記座標値検出手段により検出された前記座標値に対応する第1の周波数で共振させる第1の共振手段と、
    前記第1の共振手段により共振された前記音声データを、前記座標値検出手段により検出された前記座標値に対応する第2の周波数で共振させる第2の共振手段と
    を備えることを特徴とする音声生成装置。
  2. 前記第1の周波数と前記第2の周波数の2次元平面上における分布を表示する表示手段をさらに備え、
    前記座標値検出手段は、前記表示手段上で行われた前記入力手段の操作に基づく座標値を検出する
    ことを特徴とする請求項1に記載の音声生成装置。
  3. 前記第1の周波数は、第1ホルマント周波数であり、前記第2の周波数は、第2ホルマント周波数であり、
    前記座標値検出手段は、前記第1ホルマント周波数と前記第2ホルマント周波数の2次元平面上におけるX座標値とY座標値を検出する
    ことを特徴とする請求項1または請求項2に記載の音声生成装置。
  4. 前記第2の共振手段により共振された前記音声データを出力する出力手段をさらに備える
    ことを特徴とする請求項1乃至請求項3のいずれかに記載の音声生成装置。
  5. 基本周波数の音声データを生成する音源生成ステップと、
    入力手段の操作に基づいて座標値を検出する座標値検出ステップと、
    前記音源生成ステップで生成された前記基本周波数の音声データを、前記座標値検出ステップにより検出された前記座標値に対応する第1の周波数で共振させる第1の共振ステップと、
    前記第1の共振ステップにより共振された前記音声データを、前記座標値検出ステップにより検出された前記座標値に対応する第2の周波数で共振させる第2の共振ステップと
    を含む処理をコンピュータに実行させることを特徴とするプログラム。
JP2010183923A 2010-08-19 2010-08-19 音声生成装置およびその制御プログラム Active JP5224552B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010183923A JP5224552B2 (ja) 2010-08-19 2010-08-19 音声生成装置およびその制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010183923A JP5224552B2 (ja) 2010-08-19 2010-08-19 音声生成装置およびその制御プログラム

Publications (2)

Publication Number Publication Date
JP2012042722A true JP2012042722A (ja) 2012-03-01
JP5224552B2 JP5224552B2 (ja) 2013-07-03

Family

ID=45899114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010183923A Active JP5224552B2 (ja) 2010-08-19 2010-08-19 音声生成装置およびその制御プログラム

Country Status (1)

Country Link
JP (1) JP5224552B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106057192A (zh) * 2016-07-07 2016-10-26 Tcl集团股份有限公司 一种实时语音转换方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000503412A (ja) * 1996-01-15 2000-03-21 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 波形の合成
JP2009258366A (ja) * 2008-04-16 2009-11-05 Arcadia:Kk 音声制御装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000503412A (ja) * 1996-01-15 2000-03-21 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 波形の合成
JP2009258366A (ja) * 2008-04-16 2009-11-05 Arcadia:Kk 音声制御装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200600579011; 藪謙一郎他: '"発話障害者支援のための音声合成器の基礎的設計"' 電子情報通信学会技術研究報告 Vol.105,No.686(2006-03), pp.59-64 *
JPN6012031994; 藪謙一郎他: '"発話障害者支援のための音声合成器の基礎的設計"' 電子情報通信学会技術研究報告 Vol.105,No.686(2006-03), pp.59-64 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106057192A (zh) * 2016-07-07 2016-10-26 Tcl集团股份有限公司 一种实时语音转换方法和装置

Also Published As

Publication number Publication date
JP5224552B2 (ja) 2013-07-03

Similar Documents

Publication Publication Date Title
Heidemann A System for Describing Vocal Timbre in Popular Song.
Stylianou Voice transformation: a survey
Tran et al. Improvement to a NAM-captured whisper-to-speech system
JP4363590B2 (ja) 音声合成
Arimoto et al. Naturalistic emotional speech collection paradigm with online game and its psychological and acoustical assessment
CN111418006B (zh) 声音合成方法、声音合成装置及记录介质
Hansen et al. On the issues of intra-speaker variability and realism in speech, speaker, and language recognition tasks
JPWO2020145353A1 (ja) コンピュータプログラム、サーバ装置、端末装置及び音声信号処理方法
Barkana et al. Analysis of vowel production in Mandarin/Hindi/American-accented English for accent recognition systems
JP2018005048A (ja) 声質変換システム
Fine et al. Making myself understood: perceived factors affecting the intelligibility of sung text
Potamianos et al. A review of the acoustic and linguistic properties of children's speech
JP5224552B2 (ja) 音声生成装置およびその制御プログラム
Rilliard et al. Paradigmatic variation of vowels in expressive speech: Acoustic description and dimensional analysis
JP6291808B2 (ja) 音声合成装置及び方法
JP6044284B2 (ja) 音声合成装置
JP7069386B1 (ja) 音声変換装置、音声変換方法、プログラム、および記録媒体
JP2020003762A (ja) 簡易操作声質変換システム
Oh et al. LOLOL: Laugh Out Loud On Laptop.
Story TubeTalker: An airway modulation model of human sound production
Yoshimura et al. A" voice" instrument based on vocal tract models by using soft material for a 3D printer and an electrolarynx.
Howard The vocal tract organ and the vox humana organ stop
Jones Compositional control of phonetic/nonphonetic perception
JP6274470B1 (ja) 上下発声母音表記方法
Saiteja Towards building controllable Text to Speech systems

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120626

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130308

R150 Certificate of patent or registration of utility model

Ref document number: 5224552

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160322

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250