JP2010160406A - 音声合成装置、およびプログラム - Google Patents
音声合成装置、およびプログラム Download PDFInfo
- Publication number
- JP2010160406A JP2010160406A JP2009003576A JP2009003576A JP2010160406A JP 2010160406 A JP2010160406 A JP 2010160406A JP 2009003576 A JP2009003576 A JP 2009003576A JP 2009003576 A JP2009003576 A JP 2009003576A JP 2010160406 A JP2010160406 A JP 2010160406A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- unit
- data
- segment
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【課題】素片接続方式の音声合成において、データベース化する素片の数が従来よりも少なくしても自然な音声を合成できるようにする。
【解決手段】曲を構成する音符とその歌詞を示す歌詞データとを示す曲データに基づき、その曲の歌唱音声を合成するのに用いる複数の音声素片、それらの発生時刻、その歌唱音声のピッチを指定する歌唱合成スコア(音声合成指示)を生成する。そして、データベース化された音声素片のうちから歌唱合成スコアにより指定されるものを選択する際に、無声摩擦音から無音への遷移部分を示す音声素片については、無音から当該無声摩擦音への遷移部分の音声素片を選択し、その音声素片の波形に時間反転を施して歌唱音声の合成に使用する。
【選択図】図4
Description
本発明は上記課題に鑑みて為されたものであり、素片接続方式の音声合成において、データベース化する音声素片を従来よりも少なくしても自然な音声を合成できるようにする技術を提供することを目的とする。
図1は、本発明に係る音声合成装置の一実施形態である歌唱合成装置の構成を示すブロック図である。この歌唱合成装置は、例えば携帯電話機や携帯型ゲーム機など音声を出力する機能を備えた携帯端末に音声合成プログラムをインストールしたものであり、前述した素片接続方式で歌唱音声の合成を行う。図1において、CPU(Central Processing Unit)1は、この歌唱合成装置の各部を制御する制御中枢である。ROM(Read Only Memory)2は、ローダなど、この歌唱合成装置の基本的な動作を制御するための制御プログラムを記憶した読み出し専用メモリである。表示部3は、例えば液晶ディスプレイとその駆動回路であり、装置の動作状態や入力データ、利用者に対するメッセージなどを表示する。操作部4は、利用者に各種情報を入力させるための手段であり、複数の操作子(例えば、携帯型ゲーム機であればスタートボタンやカーソルキー、携帯電話であればテンキーなど)やタッチパネルなどで構成されている。インタフェース群5は、ネットワークを介して他の装置との間でデータ通信を行うためのネットワークインタフェースや、UMD(Universal Media Disc)やCD−ROM(Compact Disk-Read Only Memory)などの外部記録媒体との間でデータの授受を行うためのドライバなどである。フラッシュメモリ6は、データの書き込みおよび読み出しが可能な不揮発性メモリであり、各種のプログラムやデータベースなどの情報を記憶するためのものである。RAM(Random Access Memory)7は、CPU1によってワークエリアとして利用される揮発性メモリである。CPU1は、操作部4を介して与えられる指令にしたがいフラッシュメモリ6内のプログラムをRAM7に読み出し実行する。サウンドシステム8は、この歌唱合成装置において合成される音声を出力する手段である。このサウンドシステム8は、合成音声の波形を示すデジタル音声信号(例えば、合成音声の波形を示すサンプリングデータ)をアナログ音声信号に変換するD/A変換器と、このアナログ音声信号を増幅するアンプと、このアンプの出力信号を音として出力するスピーカ等を含んでいる。
図4は、音声合成プログラム64の構成を説明するための図である。この音声合成プログラム64は、所謂素片接続方式の音声合成(本実施形態では、歌唱合成)処理をCPU1に実行させるプログラムであり、図4に示すように、音声合成指示生成手段641、素片選択手段642、ピッチ変換手段643、および素片連結手段644を含んでいる。なお、本実施形態では、CPU1が音声合成指示生成手段641等に相等するプログラムを実行することにより歌唱音声の合成を行うが、これらの各プログラムを複数のプロセッサが分担して並列実行するように構成しても良い。また、音声合成指示生成手段641等の各プログラムの一部を電子回路により構成しても良い。
(1)上述した実施形態では、無音接続合成処理、および子音接続合成処理を素片選択手段642に実行させるようにすることで、無声摩擦音から無音への遷移部分、および無声摩擦音から他の子音への遷移部分を示す音声素片のデータベース化を不要にし、音声素片データベース63に格納する音声素片の数を削減した。しかし、本実施形態の特徴を顕著に示す上記2つの処理のうち、何れか一方のみを素片選択手段642に実行させるようにしても良い。例えば、無音接続合成処理のみを実行させる態様においては、無声摩擦音から無音への遷移部分をデータベース化しておく必要はないものの、無声摩擦音から他の子音への遷移部分については従来と同様にデータベース化しておく必要がある。ただし、このような態様においても、無声摩擦音から無音への遷移部分をデータベース化しない分だけ、従来の素片接続方式の音声合成技術に比較して音声素片データベースに格納しておくべき音声素片の数を削減することができる。同様に、素片選択手段642に子音接続合成処理のみを実行させ、無声摩擦音から無音への遷移部分については予めデータベース化しておく態様であっても勿論良い。
Claims (4)
- 各種の音声素片の波形を示す波形データを含む音声素片データを記憶する音声素片データベースと、
音声の合成に用いる複数の音声素片を指定する情報を時系列化した音声合成指示にしたがって音声素片データを前記音声素片データベースから選択し出力する手段であって、無音から無声摩擦音への第1の遷移部分と前記無声摩擦音から無音への第2の遷移部分とが連続して前記音声合成指示により指定されている場合には、前記第1および第2の遷移部分のうちの何れか一方については前記音声素片データベースから該当する音声素片データを選択して出力し、他方については当該音声素片データに含まれる波形データに時間反転を施したものを出力する素片選択手段と、
前記素片選択手段から出力される各音声素片データに含まれる波形データを調整しつつ連結して出力する素片連結手段と
を有することを特徴とする音声合成装置。 - 各種の音声素片の波形を示す波形データを含む音声素片データを記憶する音声素片データベースと、
音声の合成に用いる複数の音声素片を指定する情報を時系列化した音声合成指示にしたがって音声素片データを前記音声素片データベースから選択し出力する手段であって、無声摩擦音から他の子音への遷移部分の音声素片が前記音声合成指示により指定されている場合には、前記無声摩擦音から無音への第1の遷移部分と無音から前記他の子音への第2の遷移部分の連結で当該音声素片を置き換え、前記第1の遷移部分については、無音から前記無声摩擦音への遷移部分に対応する音声素片データを前記音声素片データベースから選択し当該音声素片データに含まれる波形データに時間反転を施したものを出力する一方、前記第2の遷移部分については該当する音声素片データを前記素片データベースから選択して出力する素片選択手段と、
前記素片選択手段から出力される各音声素片データに含まれる波形データを調整しつつ連結して出力する素片連結手段と
を有することを特徴とする音声合成装置。 - コンピュータ装置を、
各種の音声素片の波形を示す波形データを含む音声素片データを記憶する音声素片データベースから、音声の合成に用いる複数の音声素片を指定する情報を時系列化した音声合成指示にしたがって音声素片データを選択し出力する手段であって、無音から無声摩擦音への第1の遷移部分と前記無声摩擦音から無音への第2の遷移部分とが連続して前記音声合成指示により指定されている場合には、前記第1および第2の遷移部分のうちの何れか一方については前記音声素片データベースから該当する音声素片データを選択して出力し、他方については当該音声素片データに含まれる波形データに時間反転を施したものを出力する素片選択手段と、
前記素片選択手段から出力される各音声素片データに含まれる波形データを調整しつつ連結して出力する素片連結手段
として機能させることを特徴とするプログラム。 - コンピュータ装置を、
各種の音声素片の波形を示す波形データを含む音声素片データを記憶する音声素片データベースから、音声の合成に用いる複数の音声素片を指定する情報を時系列化した音声合成指示にしたがって音声素片データを選択し出力する手段であって、無声摩擦音から他の子音への遷移部分の音声素片が前記音声合成指示により指定されている場合には、前記無声摩擦音から無音への第1の遷移部分と無音から前記他の子音への第2の遷移部分の連結で当該音声素片を置き換え、前記第1の遷移部分については、無音から前記無声摩擦音への遷移部分に対応する音声素片データを前記音声素片データベースから選択し当該音声素片データに含まれる波形データに時間反転を施したものを出力する一方、前記第2の遷移部分については該当する音声素片データを前記素片データベースから選択して出力する素片選択手段と、
前記素片選択手段から出力される各音声素片データに含まれる波形データを調整しつつ連結して出力する素片連結手段
として機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009003576A JP5157922B2 (ja) | 2009-01-09 | 2009-01-09 | 音声合成装置、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009003576A JP5157922B2 (ja) | 2009-01-09 | 2009-01-09 | 音声合成装置、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010160406A true JP2010160406A (ja) | 2010-07-22 |
JP5157922B2 JP5157922B2 (ja) | 2013-03-06 |
Family
ID=42577594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009003576A Expired - Fee Related JP5157922B2 (ja) | 2009-01-09 | 2009-01-09 | 音声合成装置、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5157922B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012208479A (ja) * | 2011-03-11 | 2012-10-25 | Yamaha Corp | 音声合成装置 |
TWI471853B (zh) * | 2011-08-26 | 2015-02-01 | Yamaha Corp | Music generating device |
CN107025902A (zh) * | 2017-05-08 | 2017-08-08 | 腾讯音乐娱乐(深圳)有限公司 | 数据处理方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6295600A (ja) * | 1985-10-23 | 1987-05-02 | 株式会社リコー | 残差駆動型音声合成方式 |
JPS6490500A (en) * | 1987-09-30 | 1989-04-06 | Sharp Kk | Voice synthesizer |
JPH03149600A (ja) * | 1989-11-06 | 1991-06-26 | Canon Inc | 音声合成方法及び装置 |
JP2006243473A (ja) * | 2005-03-04 | 2006-09-14 | Sharp Corp | 音声素片生成装置 |
-
2009
- 2009-01-09 JP JP2009003576A patent/JP5157922B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6295600A (ja) * | 1985-10-23 | 1987-05-02 | 株式会社リコー | 残差駆動型音声合成方式 |
JPS6490500A (en) * | 1987-09-30 | 1989-04-06 | Sharp Kk | Voice synthesizer |
JPH03149600A (ja) * | 1989-11-06 | 1991-06-26 | Canon Inc | 音声合成方法及び装置 |
JP2006243473A (ja) * | 2005-03-04 | 2006-09-14 | Sharp Corp | 音声素片生成装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012208479A (ja) * | 2011-03-11 | 2012-10-25 | Yamaha Corp | 音声合成装置 |
TWI471853B (zh) * | 2011-08-26 | 2015-02-01 | Yamaha Corp | Music generating device |
CN107025902A (zh) * | 2017-05-08 | 2017-08-08 | 腾讯音乐娱乐(深圳)有限公司 | 数据处理方法及装置 |
CN107025902B (zh) * | 2017-05-08 | 2020-10-09 | 腾讯音乐娱乐(深圳)有限公司 | 数据处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5157922B2 (ja) | 2013-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10354629B2 (en) | Sound control device, sound control method, and sound control program | |
JP2008170592A (ja) | 歌唱合成のための装置およびプログラム | |
JP6729539B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
JP6784022B2 (ja) | 音声合成方法、音声合成制御方法、音声合成装置、音声合成制御装置およびプログラム | |
JP2013137520A (ja) | 音楽データ編集装置 | |
JP6127371B2 (ja) | 音声合成装置および音声合成方法 | |
JP6507579B2 (ja) | 音声合成方法 | |
JP2011048335A (ja) | 歌声合成システム、歌声合成方法及び歌声合成装置 | |
JP5423375B2 (ja) | 音声合成装置 | |
JP5157922B2 (ja) | 音声合成装置、およびプログラム | |
JP5176981B2 (ja) | 音声合成装置、およびプログラム | |
JP6255744B2 (ja) | 楽曲表示装置および楽曲表示方法 | |
JP6179221B2 (ja) | 音響処理装置および音響処理方法 | |
JP6044284B2 (ja) | 音声合成装置 | |
JP6167503B2 (ja) | 音声合成装置 | |
US20220044662A1 (en) | Audio Information Playback Method, Audio Information Playback Device, Audio Information Generation Method and Audio Information Generation Device | |
JP5106437B2 (ja) | カラオケ装置及びその制御方法並びにその制御プログラム | |
JP3843953B2 (ja) | 歌唱合成用データ入力プログラムおよび歌唱合成用データ入力装置 | |
JP5552797B2 (ja) | 音声合成装置および音声合成方法 | |
JP6372066B2 (ja) | 合成情報管理装置および音声合成装置 | |
JP2020166298A (ja) | 音声合成方法 | |
JPH0227397A (ja) | 音声合成歌唱装置 | |
JP2019168620A (ja) | 合成音生成装置、方法、及びプログラム | |
JP2005107028A (ja) | 音色パラメータ編集装置、方法及びそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5157922 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151221 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |