JP2014098802A - 音声合成装置 - Google Patents
音声合成装置 Download PDFInfo
- Publication number
- JP2014098802A JP2014098802A JP2012250441A JP2012250441A JP2014098802A JP 2014098802 A JP2014098802 A JP 2014098802A JP 2012250441 A JP2012250441 A JP 2012250441A JP 2012250441 A JP2012250441 A JP 2012250441A JP 2014098802 A JP2014098802 A JP 2014098802A
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- information
- synthesis
- speech
- control information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】合成対象の歌唱音声の音韻列を示す音韻列情報と当該音韻列情報の示す音韻列の一部の音韻を変化させることを示す音韻制御情報とを含む複数種類の合成情報を取得する手段であって、前記複数種類の合成情報の少なくとも一部の合成情報を操作子の操作により取得する取得手段と、前記取得手段により取得された複数種類の合成情報に含まれる音韻列情報の示す音韻列の子音の継続長を音韻制御情報にしたがって変化させて音声合成を行う音声合成手段とを有する音声合成装置を提供する。
【選択図】図3
Description
(A:第1実施形態)
図1は、本発明の音声合成装置の一実施形態の歌唱合成装置1の構成例を示すブロック図である。この歌唱合成装置1は、音韻列情報および韻律情報などの複数種類の合成情報をユーザに入力させ、それら合成情報を用いてリアルタイム方式の歌唱合成を行う装置である。図1に示すように、歌唱合成装置1は、制御部110、操作部120、表示部130、音声出力部140、外部機器インタフェース(以下、「I/F」と略記)部150、記憶部160、および、これら構成要素間のデータ授受を仲介するバス170を含んでいる。
146を含んでいる。D/A変換器142は、制御部110から与えられるデジタル形式の音声データ(合成歌唱音声の音波形を表す音声データ)にD/A変換を施し、変換結果のアナログ音声信号を増幅器144に与える。増幅器144は、D/A変換器142から与えられる音声信号の信号レベル(すなわち、音量)をスピーカ駆動に適したレベルまで増幅してスピーカ146に与える。スピーカ146は、増幅器144から与えられる音声信号を音として出力する。
音韻列情報の示す音韻列の一部の音韻を、子音の継続長の短縮により変化させる態様の具体例としては、図3に示すように、無音から子音への過渡的な遷移(図3に示す例では、[#−m])および子音から母音への過渡的な遷移(図3に示す例では、[m−a])の各々の継続長をベロシティの値vに応じた調整量(ベロシティの値vが大きいほど大きい値)だけ短縮し、母音の継続長を当該短縮した分だけ延長する態様が挙げられる。無音から子音への過渡的な遷移および子音から母音への過渡的な遷移が短縮されると、早口で発音された場合のように、子音の聴き取り易さが低下する。このように、子音の聴き取り易さを低下させる調整を施すのは、従来の歌唱合成技術によれば十分に子音を聴き取り易い歌唱音声が合成されるため、敢えて聴き取り易さが低下するように(すなわち、聴き取り難くなるように)調整することで、早口で発音されたかのような歌唱音声を合成することができるからである。
子音の欠落を発生させることで音韻列の一部の音韻を変化させる態様の具体例としては、ベロシティの値vに応じた頻度で子音の欠落を発生させる態様が挙げられる。具体的には、図4に示すように、音韻列情報の示す音韻列から、無音から子音への過渡的な遷移および子音から母音への過渡的な遷移の各々に対応するダイフォンを欠落させ、代わりに無音から母音への遷移に対応するダイフォンを補う処理をベロシティの値vに応じた頻度で制御部110に実行させるのである。無音から母音への過渡的な遷移に対応するダイフォンを補うのは、歌唱音声が滑らかに立ち上がるようにするためである。このような態様によれば、子音は最早発音されなくなる。なお、ベロシティの値vに応じた頻度で子音の欠落を発生させるのではなく、ベロシティの値vが所定の閾値th1を上回っている場合には常に子音の欠落を発生させるようにしても良い。また、子音部分が複数の音韻で構成されている場合(例えば、図5における[#−m]を[#−m]+[m]と置き換えた場合など)には、子音部分を構成する複数の音韻のうちのベロシティの値vに応じた個数の音韻を欠落させる(或いは、当該個数の音韻を当該ベロシティの値vに応じた頻度で欠落させる)ことで子音の欠落を発生させても良い。
子音の差し替えにより音韻列の一部の音韻を変化させる態様の具体例としては、子音の差し替えをベロシティの値vに応じた頻度で発生させる態様が挙げられる。具体的には、図5に示すように、音韻列情報の示す音韻列における子音を、音の近似した他の子音に差し替える処理をベロシティの値vに応じた頻度で制御部110に実行させるのである。図5には、子音「m」を子音「n」に差し替える場合について例示されている。このような子音の差し替えを可能にするには、子音毎に差し替え候補となる子音を示す差し替え制御情報を不揮発性記憶部162に予め記憶させておき、この差し替え制御情報にしたがって制御部110に子音の差し替えを行わせるようにすれば良い。なお、ベロシティの値vに応じた頻度で子音の差し替えを発生させるのではなく、ベロシティの値vが所定の閾値th1を上回っている場合には常に子音の差し替えを発生させても良い。また、子音部分が複数の音韻で構成されている場合には、子音部分を構成する複数の音韻のうちのベロシティの値vに応じた個数の音韻を音の近似した他の音韻に差し替える(或いは、当該個数の音韻を当該ベロシティの値vに応じた頻度で差し替える)ようにしても良い。
子音の挿入により音韻列の一部の音韻を変化させる態様の具体例としては、図6に示すように、音韻列情報の示す音韻列に含まれる子音に関連するダイフォン(図6に示す例では、子音から無音への過渡的な変化に対応するダイフォンD1と無音から子音への過渡的な変化に対応するダイフォンD2)を当該子音と母音の間に挿入する処理をベロシティvの値に応じた頻度で制御部110に実行させる態様が挙げられる。このような子音の挿入を行うことによって、あたかも噛みながら発音しているかのような歌唱音声を合成し、子音の聴き取り易さを低下させることができる。なお、挿入するダイフォンの数については予め定めた固定値としても良く、ベロシティの値vに応じた可変値(ベロシティの値vが大きいほど、大きくなる値)としても良い。また、ベロシティの値vに応じた頻度で子音の挿入を発生させるのではなく、ベロシティの値vが所定の閾値th1を上回っている場合には予め定めた数(或いはベロシティの値vに応じて定まる数)の子音を挿入する処理を常に制御部110に実行させるようにしても良く、また、ベロシティの値vに応じて定まる数の子音を挿入する処理を制御部110に実行させても良い。
上記第1実施形態の明瞭度調整処理では、音韻列情報に示す音韻列の一部の音韻(子音)を変化させて歌唱音声を合成することで子音の聴き取り易さを低下させた。これに対して本実施形態の明瞭度調整処理では、図2(c)に示す理想的な韻律変化からのズレが生じるように歌唱音声を合成することで子音の聴き取り易さを低下させる点に特徴がある。ここで、理想的な韻律変化からのズレを生じさせる方法の具体例としては、理想的な韻律変化におけるものから、アタックの深さや継続長を変更する態様、アタックの欠落を発生させる態様、オーバーシュートの高さおよびアンダーシュートの深さや継続長を変更する態様、オーバーシュートおよびアンダーシュートの欠落を発生させる態様が挙げられる。なお、本実施形態の歌唱合成装置の構成は第1実施形態におけるものと特段に変わるところはないため詳細な説明を省略し、以下では韻律変化の具体的な調整態様について説明する。
図7には、アタックの深さの調整により理想的な韻律変化からのズレを生じさせる態様が例示されている。図7では、理想的な韻律変化におけるピッチカーブが破線で描画されており、本態様にて用いるピッチカーブが実線で描画されている。なお、図7では、両ピッチカーブのオーバーシュート以降は重なっている(図8〜図12においても両ピッチカーブの一部は重なっている)。本態様では、制御部110は、ピッチカーブデータ(より正確には、アタックの勾配αを表すデータ)に対して、発音開始を指示する音符情報に含まれているベロシティの値vに応じた調整量だけアタックの深さを変化させる(例えば、浅くする)調整を施し、当該調整後のピッチカーブデータと当該音符情報の示す音高とに基づいてピッチカーブを生成する。アタックの深さを理想的なピッチカーブにおける深さよりも浅くすることによって子音の聴き取り易さは低下するからである。本実施形態では、アタックの深さを理想的なピッチカーブにおける深さよりも浅くすることで子音の聴き取り易さを低下させるが、アタックの深さを理想的なピッチカーブにおける深さよりも深くすることでも子音の聴き取り易さは低下する。したがって、発音開始を指示する音符情報に含まれているベロシティの値vに応じてアタックの深さを深くする態様であっても良い。アタックの深さを変化させる態様として、理想的なピッチカーブにおける深さよりも浅くする態様と、理想的なピッチカーブにおける深さよりも深くする態様の何れを採用するのかについては予め定めておいても良いし、ユーザに選択させるようにしても良い。
図10には、アンダーシュートの深さDおよびオーバーシュートの高さHの調整により、理想的な韻律変化からのズレを生じさせる態様が例示されている。図10では、理想的な韻律変化におけるピッチカーブが破線で描画されており、本態様にて用いるピッチカーブが実線で描画されている。本態様では、制御部110は、発音開始を指示する音符情報に含まれているベロシティの値vに応じた調整量だけアンダーシュートの深さDを理想的な韻律変化における深さから変化させ(例えば、浅くし)、かつオーバーシュートの高さHを当該ベロシティの値vに応じた調整量だけ理想的な韻律変化における高さから変化させて(例えば、低くして)ピッチカーブを生成する。このような態様によっても、子音の聴き取り易さが低下する。なお、アタックの深さの調整と同様に、発音開始を指示する音符情報に含まれているベロシティの値vに応じた調整量だけアンダーシュートの深さDを深くし、かつオーバーシュートの高さHを当該ベロシティの値vに応じた調整量だけ高くする態様であっても良い。また、発音開始を指示する音符情報に含まれているベロシティの値vに応じた頻度でアンダーシュートの深さDおよびオーバーシュートの高さHを所定量(或いは当該ベロシティの値vに応じた量)だけ変化させる処理を制御部110に実行させても良い。また、当該ベロシティの値vが所定の閾値th2を上回っている場合に、アンダーシュートの深さDおよびオーバーシュートの高さHを所定量(或いは当該ベロシティの値vに応じた量)だけ変化させる処理を制御部110に実行させても良い。
以上本発明の各実施形態について説明したが、これら実施形態に以下の変形を加えても勿論良い。
(1)上記第1実施形態では音韻列情報の示す音韻列の一部の音韻を変化させることで子音の聴き取り易さを調整する態様について説明し、上記第2実施形態では理想的な韻律変化からのズレを発生させることで子音の聴き取り易さを調整する態様について説明した。しかし、複数種類の合成情報として、音韻列情報、韻律情報、音韻制御情報および韻律制御情報を歌唱合成装置へ入力し、音韻列の一部の音韻を音韻制御情報に応じて変化させる処理と、理想的な韻律変化からのズレを韻律制御情報に応じて発生させる処理とを併用して子音の聴き取り易さを調整するようにしても勿論良い。両者を併用することで、何れか一方のみを行う場合に比較して、より多様な歌唱音声を合成することが可能になると期待されるからである。なお、音韻制御情報と韻律制御情報は互いに別個の情報であっても良いし、1つの情報に音韻制御情報と韻律制御情報の役割を兼ねさせても良い。例えば、後者の態様の一例としては、発音開始を指示する音符情報(ノートオンイベント)に含まれているベロシティに音韻制御情報の役割と韻律制御情報の役割の両方を担わせる態様が考えられる。
Claims (5)
- 合成対象の音声の音韻列を示す音韻列情報と前記音声の韻律変化を示す韻律情報と前記音韻列情報の示す音韻列の一部の音韻を変化させることを示す音韻制御情報とを含む複数種類の合成情報を取得する手段であって、前記音韻列情報と前記韻律情報と前記音韻制御情報のうちの少なくとも1つについては操作子の操作により取得する取得手段と、
前記取得手段により取得された複数種類の合成情報に含まれる音韻列情報の示す音韻列の一部の音韻を当該複数種類の合成情報に含まれる音韻制御情報にしたがって変化させて音声合成を行う音声合成手段と
を有することを特徴とする音声合成装置。 - 前記音声合成手段は、音韻列情報が示す音韻列の一部の音韻の継続長を変化させる処理、当該音韻列の一部の音韻を欠落させる処理、当該音韻列の一部の音韻を差し替える処理、および当該音韻列に音韻を挿入する処理のうちの予め定められた1または複数を、前記取得手段により取得された複数種類の合成情報に含まれる音韻列情報の示す音韻列の一部の音韻を変化させる処理として実行することを特徴とする請求項1に記載の音声合成装置。
- 前記音声合成手段は、音韻列情報が示す音韻列の一部の音韻の変化を前記取得手段により取得された複数種類の合成情報に含まれる音韻制御情報に応じた頻度で発生させることを特徴とする請求項2に記載の音声合成装置。
- 前記音声合成手段は、音韻列情報が示す音韻列の一部の音韻の継続長を変化させる処理においては前記取得手段により取得された複数種類の合成情報に含まれる音韻制御情報に応じて当該継続長を制御し、音韻列情報が示す音韻列に音韻を挿入する処理においては挿入する音韻の数を当該音韻制御情報に応じて制御し、音韻列情報が示す音韻列の一部の音韻を欠落させる処理においては欠落させる音韻の数を当該音韻制御情報に応じて制御し、音韻列情報が示す音韻列の一部の音韻を差し替える処理においては差し替える音韻の数を当該音韻制御情報に応じて制御することを特徴とする請求項2または請求項3に記載の音声合成装置。
- 前記取得手段により取得される複数種類の合成情報には、理想的な韻律変化からズレを生じさせて音声合成することを指示する韻律制御情報が含まれており、前記音声合成手段は、当該ズレが生じるように当該韻律制御情報にしたがって韻律変化を調整しつつ音声合成を行うことを特徴とする請求項1〜4の何れか1項に記載の音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012250441A JP6167503B2 (ja) | 2012-11-14 | 2012-11-14 | 音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012250441A JP6167503B2 (ja) | 2012-11-14 | 2012-11-14 | 音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014098802A true JP2014098802A (ja) | 2014-05-29 |
JP6167503B2 JP6167503B2 (ja) | 2017-07-26 |
Family
ID=50940854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012250441A Expired - Fee Related JP6167503B2 (ja) | 2012-11-14 | 2012-11-14 | 音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6167503B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016090916A (ja) * | 2014-11-10 | 2016-05-23 | ヤマハ株式会社 | 音声合成装置 |
EP3065130A1 (en) * | 2015-03-05 | 2016-09-07 | Yamaha Corporation | Voice synthesis |
JP2019015761A (ja) * | 2017-07-03 | 2019-01-31 | 株式会社第一興商 | カラオケ装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58208793A (ja) * | 1982-05-29 | 1983-12-05 | ヤマハ株式会社 | 電子楽器 |
JPH08123459A (ja) * | 1994-10-26 | 1996-05-17 | Sony Corp | 自然言語処理方法および音声合成装置 |
JPH11184490A (ja) * | 1997-12-25 | 1999-07-09 | Nippon Telegr & Teleph Corp <Ntt> | 規則音声合成による歌声合成方法 |
-
2012
- 2012-11-14 JP JP2012250441A patent/JP6167503B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58208793A (ja) * | 1982-05-29 | 1983-12-05 | ヤマハ株式会社 | 電子楽器 |
JPH08123459A (ja) * | 1994-10-26 | 1996-05-17 | Sony Corp | 自然言語処理方法および音声合成装置 |
JPH11184490A (ja) * | 1997-12-25 | 1999-07-09 | Nippon Telegr & Teleph Corp <Ntt> | 規則音声合成による歌声合成方法 |
Non-Patent Citations (1)
Title |
---|
平沢 英司: "IA−ARIA ON THE PLANETES−総力特集", DTM MAGAZINE, vol. 第19巻 第4号, JPN6016039677, 8 March 2012 (2012-03-08), JP, pages 007 - 009, ISSN: 0003420563 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016090916A (ja) * | 2014-11-10 | 2016-05-23 | ヤマハ株式会社 | 音声合成装置 |
EP3065130A1 (en) * | 2015-03-05 | 2016-09-07 | Yamaha Corporation | Voice synthesis |
US10176797B2 (en) | 2015-03-05 | 2019-01-08 | Yamaha Corporation | Voice synthesis method, voice synthesis device, medium for storing voice synthesis program |
JP2019015761A (ja) * | 2017-07-03 | 2019-01-31 | 株式会社第一興商 | カラオケ装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6167503B2 (ja) | 2017-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5821824B2 (ja) | 音声合成装置 | |
US10354629B2 (en) | Sound control device, sound control method, and sound control program | |
US20210193114A1 (en) | Electronic musical instruments, method and storage media | |
JP6784022B2 (ja) | 音声合成方法、音声合成制御方法、音声合成装置、音声合成制御装置およびプログラム | |
US20210295819A1 (en) | Electronic musical instrument and control method for electronic musical instrument | |
US20230034572A1 (en) | Voice synthesis method, voice synthesis apparatus, and recording medium | |
US11854521B2 (en) | Electronic musical instruments, method and storage media | |
JP2013045082A (ja) | 楽曲生成装置 | |
JP6167503B2 (ja) | 音声合成装置 | |
JP4929604B2 (ja) | 歌データ入力プログラム | |
JP6044284B2 (ja) | 音声合成装置 | |
US20220044662A1 (en) | Audio Information Playback Method, Audio Information Playback Device, Audio Information Generation Method and Audio Information Generation Device | |
JP4277697B2 (ja) | 歌声生成装置、そのプログラム並びに歌声生成機能を有する携帯通信端末 | |
JP5157922B2 (ja) | 音声合成装置、およびプログラム | |
JP5360489B2 (ja) | 音素符号変換装置および音声合成装置 | |
JP5106437B2 (ja) | カラオケ装置及びその制御方法並びにその制御プログラム | |
JP7186476B1 (ja) | 音声合成装置 | |
WO2016152708A1 (ja) | 音制御装置、音制御方法、および音制御プログラム | |
JPWO2019003350A1 (ja) | 歌唱音生成装置及び方法、プログラム | |
WO2023171522A1 (ja) | 音響生成方法、音響生成システムおよびプログラム | |
JP2018151548A (ja) | 発音装置及びループ区間設定方法 | |
KR100994340B1 (ko) | 문자음성합성을 이용한 음악 컨텐츠 제작장치 | |
JP2022065566A (ja) | 音声合成方法およびプログラム | |
CN117043846A (zh) | 歌唱音输出系统及方法 | |
JP2015079065A (ja) | 合成情報管理装置および音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150917 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170612 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6167503 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |