JP5953743B2 - 音声合成装置及びプログラム - Google Patents
音声合成装置及びプログラム Download PDFInfo
- Publication number
- JP5953743B2 JP5953743B2 JP2011286728A JP2011286728A JP5953743B2 JP 5953743 B2 JP5953743 B2 JP 5953743B2 JP 2011286728 A JP2011286728 A JP 2011286728A JP 2011286728 A JP2011286728 A JP 2011286728A JP 5953743 B2 JP5953743 B2 JP 5953743B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- pitch
- unit
- speech
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 24
- 238000003786 synthesis reaction Methods 0.000 title claims description 24
- 230000005236 sound signal Effects 0.000 claims description 46
- 238000012545 processing Methods 0.000 claims description 30
- 230000002194 synthesizing effect Effects 0.000 claims description 7
- 239000011295 pitch Substances 0.000 description 75
- 238000012790 confirmation Methods 0.000 description 33
- 238000000034 method Methods 0.000 description 27
- 230000008569 process Effects 0.000 description 21
- 238000013500 data storage Methods 0.000 description 17
- 238000012937 correction Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 10
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 238000001228 spectrum Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000005284 excitation Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000000695 excitation spectrum Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Landscapes
- Auxiliary Devices For Music (AREA)
Description
本発明は上述の背景に鑑みてなされたものであり、音声から抽出される特徴(属性)を用いて合成音声を生成する装置において、生成される合成音声の確認を容易に行うことのできる技術を提供することを目的とする。
<構成>
図1は、本発明の実施形態に係る音声合成装置100のハードウェア構成の一例を示すブロック図である。音声合成装置100は、文字列及び音素列を含む楽譜データに基づいて音声を合成し、合成した音声を出力する装置である。音声合成装置100は、制御部10、記憶部20、操作部30、表示部40、音声処理部60、マイクロホン61、及びスピーカ62を有し、これら各部がバス70を介して接続されている。制御部10は、CPU(Central Processing Unit)、RAM(Random Access Memory)、及びROM(Read Only Memory)等を有している。制御部10において、CPUが、ROMや記憶部20に記憶されているコンピュータプログラムを読み出しRAMにロードして実行することにより、音声合成装置100の各部を制御する。操作部30は、各種の操作子を備え、ユーザによる操作内容を表す操作信号を制御部10に出力する。表示部40は、例えば液晶パネルを備え、制御部10による制御の下、各種の画像を表示する。
[数1]
Template = [P(t),Pitch(t),T] …(A)
図3は、制御部10が歌唱スコアデータ生成処理を行う場合において、表示部40に表示される画面の一例を示す図である。制御部10は、図3に例示するような画面を表示して、ユーザに歌唱スコアデータの入力を促す。図において、歌唱スコアデータ編集画面600は、ノートデータをピアノロール形式で表示するイベント表示領域601を備えている。イベント表示領域601の右側には、イベント表示領域601の表示画面を上下にスクロールするためのスクロールバー606が設けられている。イベント表示領域601の下側には、イベント表示領域601の表示画面を左右にスクロールするためのスクロールバー607が設けられている。
図5は、音声合成装置100が行う合成音声の修正処理の流れを示すフロー図である。操作部30を介してユーザにより合成音声の編集指示がされると(ステップS100;Yes)、制御部10は、まず、歌唱音声が入力されるのを待機する(ステップS102;No)。ユーザによって歌唱音声が入力されると(ステップS102;Yes)、入力された歌唱音声を解析し、解析結果を示す解析結果データを生成する(ステップS104)。
以上の実施形態は次のように変形可能である。尚、以下の変形例は適宜組み合わせて実施しても良い。
上述の実施形態では、制御部10は、確認音として、解析結果データの示すピッチに応じた周波数の正弦波を生成したが、制御部10が生成する確認音信号はこれに限らず、例えば、解析結果データの示すピッチに対応する周波数及び解析結果データの示す音量(パワー)に対応する振幅の正弦波を生成するようにしてもよい。また、例えば、制御部10が、解析結果データの示すピッチに対応する周波数の正弦波に対して予め定められた変調処理を施して波形を歪ませてもよい。また、例えば、制御部10が、解析結果データの示すピッチに対応する周波数成分と、その周波数成分の2倍音、3倍音といった特定の倍音の成分とを合成した音信号を、確認音信号として用いてもよい。また、例えば、制御部10が、以下の式(B)を用いて、解析結果の示すピッチに対応する周波数成分のn倍音までの倍音成分F0を合成して確認音信号を生成してもよい。なお、以下の式(B)において、POWはパワー、aは定数又は歌唱音声データの解析結果であるスペクトルのピーク情報からフォルマントを模した値を示す。aが定数である場合には鼻歌のような確認音信号が生成され、aとしてフォルマントを模した値を用いる場合には、ユーザの歌唱音声に似た確認音信号が生成される。
[数2]
Σsin(n・F0)*(a・POW) …(B)
上述の実施形態では、制御部10が、歌唱スコアデータに含まれるピッチデータと発音タイミングデータとを修正するようにしたが、修正する属性データはこれに限らない。例えば、制御部10が、音質・声質の差分を検出し、音質・声質を修正するようにしてもよい。この場合は、歌唱スコアデータに、音質や声質を示す音質データや声質データを含める構成とし、制御部10が、歌唱音声データと合成音声データとからフォルマントを検出し、検出したフォルマントの差分が小さくなるように、音質データや声質データを修正するようにしてもよい。
上述の実施形態では、制御部10は、歌唱スコアデータを歌唱スコアデータ記憶領域23から読み出すようにしたが、音声合成部11が歌唱スコアデータを取得する態様はこれに限らず、例えば、インターネット等の通信ネットワークを介して歌唱スコアデータを受信するようにしてもよく、また、例えば、ユーザが操作部30を用いて歌唱スコアデータを入力するための操作を行い、制御部10が操作部30から出力される信号に応じて歌唱スコアデータを生成するようにしてもよく、制御部10が歌唱スコアデータを取得するものであればどのようなものであってもよい。
また、上述の実施形態では、制御部10は、歌唱者の歌唱音声を解析したが、歌唱者の歌唱音声に代えて、演奏者による楽器の演奏音を評価してもよい。本実施形態にいう「音声」には、人間が発生した音声や楽器の演奏音といった種々の音響が含まれる。
上述の実施形態では、制御部10が、歌唱音声データを解析し、解析結果を示す解析結果データを生成したが、制御部10が解析結果データを生成するに限らず、他の装置(例えば、通信ネットワークで接続されたサーバ装置、等)から解析結果を取得する構成であってもよい。なお、この場合、制御部10が取得する解析結果データは、ピッチを含む複数の属性を示すデータであってもよく、また、ピッチのみを示すデータであってもよい。
音声合成装置100のハードウェア構成は、図1で説明したものに限定されない。図4に示される機能を実装できるものであれば、音声合成装置100はどのようなハードウェア構成を有していてもよい。例えば、音声合成装置100は、図4に示される機能要素の各々に対応する専用のハードウェア(回路)を有していてもよい。
上述の実施形態において、通信ネットワークで接続された2以上の装置が、上記実施形態の音声合成装置100に係る機能を分担するようにし、それら複数の装置を備えるシステムが同実施形態の音声合成装置100を実現するようにしてもよい。例えば、マイクロホンやスピーカ、表示装置及び操作部等を備えるコンピュータ装置と、音声の解析処理を行うサーバ装置とが通信ネットワークで接続されたシステムとして構成されていてもよい。この場合は、例えば、コンピュータ装置が、マイクロホンで収音された音声をオーディオ信号に変換してサーバ装置に送信し、サーバ装置が、受信したオーディオ信号を解析し、解析結果をコンピュータ装置に送信してもよい。
本発明は、音声合成装置以外にも、これらを実現するための方法や、コンピュータに音声合成機能を実現させるためのプログラムとしても把握される。かかるプログラムは、これを記憶させた光ディスク等の記録媒体の形態で提供されたり、インターネット等を介して、コンピュータにダウンロードさせ、これをインストールして利用させるなどの形態でも提供されたりする。
Claims (4)
- 音声データのピッチ及び音量を含む属性を示す属性データを受け取る受取部と、
前記受取部が受け取った属性データに基づいて合成音声を生成する音声合成部と、
前記音声合成部が合成音声を生成する前に、前記受取部が受け取った属性データの示すピッチ及び音量に基づいて周期性を有する音信号を生成する音信号生成部であって、前記音声合成部が合成音声を生成する処理よりも短時間の処理によって周期性を有する音信号を生成する音信号生成部と
を具備することを特徴とする音声合成装置。 - 歌詞を示す歌詞データと、該歌詞との対応付けがなされた楽譜データとを受け取る第2の受取部と、
前記受取部が受け取った属性データの示すピッチと前記第2の受取部が受け取った楽譜データとの対応付けを行い、該対応付け結果に基づいて前記歌詞データと前記ピッチを表すピッチデータとの対応付けを行う対応付け部と
を具備し、
前記音声合成部は、前記受取部が受け取った属性データ並びに前記対応付け部により対応付けがなされた歌詞データ及びピッチデータに基づいて、合成音声を生成する
ことを特徴とする請求項1に記載の音声合成装置。 - 前記音声データを、ピッチ及び音量を含む属性について解析し、解析結果を示す属性データを前記受取部に供給する音声解析部
を具備することを特徴とする請求項1又は2に記載の音声合成装置。 - コンピュータに、
音声データのピッチ及び音量を含む属性を示す属性データを受け取る受取機能と、
前記受け取った属性データに基づいて合成音声を生成する音声合成機能と、
前記音声合成機能が合成音声を生成する前に、前記受け取った属性データの示すピッチ及び音量に基づいて周期性を有する音信号を生成する音信号生成機能であって、前記音声合成機能が合成音声を生成する処理よりも短時間の処理によって周期性を有する音信号を生成する音信号生成機能と
を実現させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011286728A JP5953743B2 (ja) | 2011-12-27 | 2011-12-27 | 音声合成装置及びプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011286728A JP5953743B2 (ja) | 2011-12-27 | 2011-12-27 | 音声合成装置及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2013134476A JP2013134476A (ja) | 2013-07-08 |
| JP5953743B2 true JP5953743B2 (ja) | 2016-07-20 |
Family
ID=48911167
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2011286728A Active JP5953743B2 (ja) | 2011-12-27 | 2011-12-27 | 音声合成装置及びプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5953743B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6184296B2 (ja) * | 2013-10-31 | 2017-08-23 | 株式会社第一興商 | カラオケのガイドボーカル生成装置及びガイドボーカル生成方法 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH07210186A (ja) * | 1994-01-11 | 1995-08-11 | Fujitsu Ltd | 音声登録装置 |
| JP2007256349A (ja) * | 2006-03-20 | 2007-10-04 | Oki Electric Ind Co Ltd | 音声データ収録システムおよび音声データ収録方法 |
| JP2009053522A (ja) * | 2007-08-28 | 2009-03-12 | Panasonic Electric Works Co Ltd | 音声出力装置 |
| JP5136128B2 (ja) * | 2008-03-12 | 2013-02-06 | ヤマハ株式会社 | 音声合成装置 |
-
2011
- 2011-12-27 JP JP2011286728A patent/JP5953743B2/ja active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2013134476A (ja) | 2013-07-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100949872B1 (ko) | 악곡 연습 지원 장치, 악곡 연습 지원 장치의 제어 방법, 악곡 연습 지원 장치를 제어하는 제어 방법을 컴퓨터로 실행시키는 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체 | |
| JP5605066B2 (ja) | 音合成用データ生成装置およびプログラム | |
| TWI394142B (zh) | 歌聲合成系統、方法、以及裝置 | |
| JP5949607B2 (ja) | 音声合成装置 | |
| CN111418006B (zh) | 声音合成方法、声音合成装置及记录介质 | |
| JP6728754B2 (ja) | 発音装置、発音方法および発音プログラム | |
| CN111418005B (zh) | 声音合成方法、声音合成装置及存储介质 | |
| CN103187046A (zh) | 显示控制装置及方法 | |
| JP5136128B2 (ja) | 音声合成装置 | |
| JP4844623B2 (ja) | 合唱合成装置、合唱合成方法およびプログラム | |
| US20210350783A1 (en) | Sound signal synthesis method, neural network training method, and sound synthesizer | |
| JP5292702B2 (ja) | 楽音信号生成装置及びカラオケ装置 | |
| KR101020557B1 (ko) | 사용자 창조형 음악 콘텐츠 제작을 위한 악보 생성 장치 및그 방법 | |
| JP5953743B2 (ja) | 音声合成装置及びプログラム | |
| JP2013210501A (ja) | 素片登録装置,音声合成装置,及びプログラム | |
| JP6044284B2 (ja) | 音声合成装置 | |
| JP5106437B2 (ja) | カラオケ装置及びその制御方法並びにその制御プログラム | |
| TWI377557B (en) | Apparatus and method for correcting a singing voice | |
| JP5810947B2 (ja) | 発声区間特定装置、音声パラメータ生成装置、及びプログラム | |
| JP6992894B2 (ja) | 表示制御方法、表示制御装置およびプログラム | |
| JP7124870B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
| JP7127682B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
| JP2022065554A (ja) | 音声合成方法およびプログラム | |
| JP2007225916A (ja) | オーサリング装置、オーサリング方法およびプログラム | |
| CN116324965A (zh) | 信息处理方法、信息处理系统及程序 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141023 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151013 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151020 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151201 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160517 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160530 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 5953743 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |