JP6616435B2 - 音声生成装置、音声生成プログラム - Google Patents
音声生成装置、音声生成プログラム Download PDFInfo
- Publication number
- JP6616435B2 JP6616435B2 JP2018010748A JP2018010748A JP6616435B2 JP 6616435 B2 JP6616435 B2 JP 6616435B2 JP 2018010748 A JP2018010748 A JP 2018010748A JP 2018010748 A JP2018010748 A JP 2018010748A JP 6616435 B2 JP6616435 B2 JP 6616435B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- loop
- audio data
- data
- length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000000463 material Substances 0.000 claims description 81
- 238000003860 storage Methods 0.000 claims description 28
- 230000002194 synthesizing effect Effects 0.000 claims description 23
- 238000005520 cutting process Methods 0.000 claims description 4
- 238000005562 fading Methods 0.000 claims description 2
- 238000000034 method Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 15
- 230000015572 biosynthetic process Effects 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- 238000004519 manufacturing process Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 244000025254 Cannabis sativa Species 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
音声素材が記憶された記憶部から前記音声素材を取得する情報取得手段と、
前記音声素材の先頭から所定のループ開始時刻までの波形データである第1音声データを切り取り、前記第1音声データを前記音声素材の後に移動させ、前記音声素材の末尾と前記第1音声データの先頭とを所定のクロスフェード期間でクロスフェードにより結合してループ音声データを生成する合成手段と、して機能させ、
前記合成手段は、前記ループ音声データの長さが所定のサンプル数の倍数になっているかを判定し、当該所定のサンプル数の倍数になっていない場合に、前記ループ音声データの長さが前記所定のサンプル数の倍数になるように、前記音声素材の末尾を削ってから前記音声素材の末尾と前記第1音声データの先頭とを結合する
ことを特徴とする音声生成プログラムである。
音声素材が記憶された記憶部から前記音声素材を取得する情報取得手段と、
前記音声素材のうち、所定の始点時刻と所定のループ開始時刻との間の波形データである第1音声データを読み出し、前記音声素材の末尾と前記第1音声データの先頭とを所定のクロスフェード期間でクロスフェードにより結合してループ音声データを生成する合成手段と、
前記ループ音声データにおいて、前記ループ開始時刻から前記第1音声データの末尾までの間をループリージョンに設定するループ設定手段と、して機能させ、
前記合成手段は、前記ループ音声データの長さが所定のサンプル数の倍数になっているかを判定し、当該所定のサンプル数の倍数になっていない場合に、前記ループ音声データの長さが前記所定のサンプル数の倍数になるように、前記音声素材の末尾を削ってから前記音声素材の末尾と前記第1音声データの先頭とを結合する
ことを特徴とする音声生成プログラム。
である。
本実施形態で説明する音声生成装置では、例えば、ゲームに使用されるループ音声を生成することができる。このようなゲームは、例えば、パーソナルコンピュータ、プレイステーション(登録商標)、XBox(登録商標)、PlayStation Vita(登録商標)などのゲーム装置において実行される。
図1は、本実施形態に係る音声生成装置1の構成を示すブロック図である。図1では、後述するループ音声の生成に関する構成を主として示しており、その他の構成については適宜省略する。
情報取得手段121は、記憶部13からループ音声データの基となる音声素材を読み出す。さらに、情報取得手段121は、受信部11を介して、ユーザが入力操作部21に設定したループリージョン情報およびクロスフェード期間を取得する。本実施形態において、ループリージョン情報は、音声素材の先頭から切り取る波形の長さ(時間Ta:図3参照)を含んでいる。
合成手段122は、ループリージョン情報に基づいて、音声素材の先頭から所定のループ開始時刻までの間の波形データを抽出する音声抽出工程と、抽出した波形データの先頭を音声素材の末尾にクロスフェードにより結合してループ音声データを生成する音声結合工程とを実行する。
推定演算手段123は、音声素材の長さおよびクロスフェード期間Txに基づいて、ループ音声データの長さLRを演算する。具体的に、ループ音声データの長さLRは、
LR=(Ta+Tb)−Tx ・・・(1)
により求めることができる(図3参照)。
図2は、本実施形態に係る音声生成装置1の動作、すなわち、音声生成プログラムによる音声生成処理の流れを示すフローチャートである。図3は、図2の音声生成処理過程の波形データ例を示している。
本実施形態の音声生成プログラムによれば、音声素材からループ音声データを生成する作業量を少なくすることができる。具体的に、本実施形態の音声生成プログラムにより生成されたループ音声データは、先頭が第2音声データRbの先頭であり、末尾が第1音声データRaの末尾である。そして、第1音声データRaの末尾と第2音声データRbの先頭との間は、音声素材では繋がっている連続波形である。すなわち、従来技術のように、音声素材の波形のゼロクロスポイントを見つけなくても、自動的に、先頭と末尾が連続するループ音声データを生成することができる。ここで、ループ音声データにおいて、第2音声データRbの末尾と第1音声データRaの先頭との間は、クロスフェードにより結合されているので、両者間の境界でノイズが発生することもない。本実施形態の音声生成プログラムは、特に、始点と終点にこだわらないようなループ音声データの生成に適している。
図4は、音声生成装置の動作、すなわち、音声生成プログラムによる音声生成処理の他の例の流れを示すフローチャートである。図4では、図2と共通の処理に同じ符号を付している。以下の説明では、図2との相違点を中心に説明する。
図5は、本実施形態に係る音声生成装置1の構成を示すブロック図である。図5において、図1と共通の構成要素に同じ符号を付している。以下の説明では、図1との相違点を中心に説明する。
情報取得手段121は、第1実施形態と同様に、記憶部13から音声素材を読み出すとともに、ユーザが入力操作部21に設定したループリージョン情報およびクロスフェード期間を取得する。本実施形態において、ループリージョン情報は、音声素材の波形データの読み出し期間の情報を含む。具体的に、ループリージョン情報は、波形データの読み出しの始点となる始点時刻T21および始点時刻T21から読み出す長さ(時間Tc)の情報を含む(図7参照)。
合成手段122は、ループリージョン情報に基づいて、音声抽出工程と、音声結合工程とを実行する。音声抽出工程では、合成手段122は、音声素材のうち、情報取得手段121で読み出された始点時刻T21からループ開始時刻T22までの間の波形データを抽出する(図7参照)。音声結合工程では、合成手段122は、抽出した波形データの先頭を音声素材の末尾にクロスフェードにより結合してループ音声データを生成する。
ループ設定手段124は、合成手段122で生成したループ音声データのうち、上記始点時刻T21とループ音声データの末尾までの間をループリージョンに設定する(図7参照)。
図6は、本実施形態に係る音声生成プログラムによる音声生成処理の流れを示すフローチャートである。図7は、図6の音声生成処理過程の波形データ例を示している。なお、ここでは、前述の第1実施形態との違いを中心に説明するものとし、共通する内容について、説明を省略する場合がある。
本実施形態においても、第1実施形態と同様に、音声素材からループ音声データを生成する作業量を少なくすることができる。具体的に、ループ音声データのループリージョンLRに設定された範囲では、先頭が第2音声データRbの先頭であり、末尾が第1音声データRaの末尾である。そして、第1音声データRaの末尾と第2音声データRbの先頭との間は、音声素材では繋がっている連続波形である。したがって、従来技術のように、音声素材のゼロクロスポイントを見つけなくても、自動的に、ループリージョンLRの先頭と末尾が連続するループ音声データを生成することができる。
[他の実施形態]
上記実施形態において説明した各種制御手段および処理手順は一例であって、本発明、その適用物、或いはその用途の範囲を制限することを意図するものではない。各種制御手段および処理手順は、本発明の要旨を変更しない範囲で適宜設計変更が可能である。また、各実施形態を組み合わせて、新たな実施形態としてもよい。
図8のゲーム装置5には、ディスプレイ61、スピーカ62およびコントローラ63が外部接続または内蔵される。ゲーム装置5では、例えば、図示しない外部のサーバ装置から受信したゲームプログラムおよびゲームデータに基づいてゲームが進行する。
ゲーム装置5の制御部56は、ゲームの進行中に、ループ音声を再生するイベントが発生すると、そのイベントに対応する音声素材を記憶部55から読み出して、ループ音声データを生成する。そして、制御部56は、オーディオ処理部53を制御して、スピーカ62からループ音声データを出力させる。なお、ループ音声データの生成において、ループリージョン情報およびクロスフェード期間が、ユーザの入力によるか、あらかじめ記憶部に格納されているかの違いがあるが、実質的な動作は、前述の第1および第2実施形態の「音声生成装置の動作」と同様であり、ここではその詳細説明を省略する。
121 情報取得手段
122 合成手段
123 推定演算手段
124 ループ設定手段
5 ゲーム装置(コンピュータ)
Claims (4)
- コンピュータを、
音声素材が記憶された記憶部から前記音声素材を取得する情報取得手段と、
前記音声素材の先頭から所定のループ開始時刻までの波形データである第1音声データを切り取り、前記第1音声データを前記音声素材の後に移動させ、前記音声素材の末尾と前記第1音声データの先頭とを所定のクロスフェード期間でクロスフェードにより結合してループ音声データを生成する合成手段と、して機能させ、
前記合成手段は、前記ループ音声データの長さが所定のサンプル数の倍数になっているかを判定し、当該所定のサンプル数の倍数になっていない場合に、前記ループ音声データの長さが前記所定のサンプル数の倍数になるように、前記音声素材の末尾を削ってから前記音声素材の末尾と前記第1音声データの先頭とを結合する
ことを特徴とする音声生成プログラム。 - コンピュータを、
音声素材が記憶された記憶部から前記音声素材を取得する情報取得手段と、
前記音声素材のうち、所定の始点時刻と所定のループ開始時刻との間の波形データである第1音声データを読み出し、前記音声素材の末尾と前記第1音声データの先頭とを所定のクロスフェード期間でクロスフェードにより結合してループ音声データを生成する合成手段と、
前記ループ音声データにおいて、前記ループ開始時刻から前記第1音声データの末尾までの間をループリージョンに設定するループ設定手段と、して機能させ、
前記合成手段は、前記ループ音声データの長さが所定のサンプル数の倍数になっているかを判定し、当該所定のサンプル数の倍数になっていない場合に、前記ループ音声データの長さが前記所定のサンプル数の倍数になるように、前記音声素材の末尾を削ってから前記音声素材の末尾と前記第1音声データの先頭とを結合する
ることを特徴とする音声生成プログラム。 - コンピュータを、
前記音声素材の長さおよび前記クロスフェード期間に基づいて、前記ループ音声データの長さを推定演算する推定演算手段としてさらに機能させ、
前記合成手段は、前記推定演算手段で演算されたループ音声データの長さと、所定の規定長とを比較し、その差分に応じた長さの波形データを前記音声素材の末尾から削除し、残った前記音声素材の末尾と前記第1音声データの先頭とを前記クロスフェード期間でクロスフェードにより結合してループ音声データを生成する
ことを特徴とする請求項1または2に記載の音声生成プログラム。 - 請求項1〜3のいずれか一つに記載の音声生成プログラムを記憶した記憶部と、前記音声生成プログラムを実行するコンピュータと、を備える音声生成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018010748A JP6616435B2 (ja) | 2018-01-25 | 2018-01-25 | 音声生成装置、音声生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018010748A JP6616435B2 (ja) | 2018-01-25 | 2018-01-25 | 音声生成装置、音声生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019128492A JP2019128492A (ja) | 2019-08-01 |
JP6616435B2 true JP6616435B2 (ja) | 2019-12-04 |
Family
ID=67472099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018010748A Active JP6616435B2 (ja) | 2018-01-25 | 2018-01-25 | 音声生成装置、音声生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6616435B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7381856B2 (ja) * | 2019-11-12 | 2023-11-16 | 株式会社カプコン | 音声再生プログラム、音声再生装置、および音声生成方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59188697A (ja) * | 1983-04-11 | 1984-10-26 | ヤマハ株式会社 | 楽音発生装置 |
JP3644263B2 (ja) * | 1998-07-31 | 2005-04-27 | ヤマハ株式会社 | 波形形成装置及び方法 |
JP3674526B2 (ja) * | 2001-03-23 | 2005-07-20 | ヤマハ株式会社 | 波形合成方法、音データ転送装置およびプログラム |
JP3780857B2 (ja) * | 2001-03-26 | 2006-05-31 | ヤマハ株式会社 | 波形編集方法および波形編集装置 |
JP3829732B2 (ja) * | 2002-02-20 | 2006-10-04 | ヤマハ株式会社 | 波形生成装置及び方法 |
JP3829134B2 (ja) * | 2003-11-12 | 2006-10-04 | 株式会社コナミデジタルエンタテインメント | 生成装置、再生装置、生成方法、再生方法、および、プログラム |
-
2018
- 2018-01-25 JP JP2018010748A patent/JP6616435B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019128492A (ja) | 2019-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017154894A1 (ja) | 装置、プログラム及び情報処理方法 | |
JP4274152B2 (ja) | 楽音合成装置 | |
JPWO2014003072A1 (ja) | オーディオ波形データを使用する自動演奏技術 | |
TW201230009A (en) | Speech synthesis information editing apparatus | |
JP2017040867A (ja) | 情報処理装置 | |
JP6616435B2 (ja) | 音声生成装置、音声生成プログラム | |
JP2003122358A (ja) | 音響信号出力方法、音響信号生成装置及びプログラム | |
JP4757704B2 (ja) | 音楽再生プログラム、音楽再生装置、音楽再生方法及び音楽再生システム | |
JP7339512B2 (ja) | 音声再生プログラム、および音声再生装置 | |
JP2006189471A (ja) | プログラム、歌唱力判定方法、ならびに、判定装置 | |
JP2007183442A (ja) | 楽音合成装置及びプログラム | |
JP2007025570A (ja) | 歌詞文字に基づいて切り貼り編集を行うカラオケ録音編集装置 | |
JP2010113278A (ja) | 楽曲処理装置およびプログラム | |
EP1650747B1 (en) | Audio playback program, audio playback method, and audio playback device | |
JP7381856B2 (ja) | 音声再生プログラム、音声再生装置、および音声生成方法 | |
JP2013046661A (ja) | ゲーム機における楽曲切り替え装置 | |
JP3829134B2 (ja) | 生成装置、再生装置、生成方法、再生方法、および、プログラム | |
JP4607210B2 (ja) | 再生装置、再生方法、ならびに、プログラム | |
JP2019198416A (ja) | ゲームプログラム、およびゲーム装置 | |
JP7492104B2 (ja) | 音声再生プログラム、音声再生装置、および音声生成方法 | |
JP2020091438A (ja) | 音声生成プログラム、および音声生成装置 | |
JP5359203B2 (ja) | 楽曲処理装置およびプログラム | |
JP6322907B2 (ja) | 楽譜表示装置、楽譜表示方法、及びプログラム | |
JP6185136B1 (ja) | 音声生成プログラムおよびゲーム装置 | |
JP4714230B2 (ja) | 音声処理装置、音声処理方法、ならびに、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180322 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190529 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191023 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6616435 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |