JP3829134B2 - 生成装置、再生装置、生成方法、再生方法、および、プログラム - Google Patents
生成装置、再生装置、生成方法、再生方法、および、プログラム Download PDFInfo
- Publication number
- JP3829134B2 JP3829134B2 JP2003382379A JP2003382379A JP3829134B2 JP 3829134 B2 JP3829134 B2 JP 3829134B2 JP 2003382379 A JP2003382379 A JP 2003382379A JP 2003382379 A JP2003382379 A JP 2003382379A JP 3829134 B2 JP3829134 B2 JP 3829134B2
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- data
- hereinafter referred
- time length
- reproduced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は、このような課題を解決するためになされたもので、音声データの繰り返し再生を自然に行うのに好適な、音声データの生成装置、再生装置、生成方法、再生方法、および、これらをコンピュータによって実現するプログラムを提供することを目的とする。
本発明の第1の観点に係る生成装置は、連続して再生されるべき2つの音声データ(以下、先行して再生されるべきものを「先行音声データ」、他方を「後行音声データ」という。)から、最初に再生すべき音声データ(以下「冒頭音声データ」という。)とその後に繰り返して再生すべき音声データ(以下「繰返音声データ」という。)とを、生成して出力する生成装置し、生成部、および、出力部を備え、以下のように構成する。
一方、出力部は、当該先行音声データを冒頭音声データとし、当該合成音声データを繰返音声データとして出力する。
移行時間長を先行音声データと後行音声データの時間長よりも短くすることによって、後行音声データの頭部近傍と一致する合成音声データの頭部近傍の時間長、ならびに、先行音声データの尾部近傍と一致する合成音声データの尾部近傍の時間長、のそれぞれの時間長が0よりも大きくなる。
したがって、本発明によれば、自然に繰り返しの移行を行うことができる。
したがって、本発明によれば、合成音声データ中における後行音声データから先行音声データへの移行を滑らかに行うことができ、聴取者は自然な移行が行われたように感じることができるようになる。
本発明によれば、普通の楽曲を適切に分割して、冒頭音声データと繰返音声データとを生成することができる。
すなわち、原音声データの尾部のうち移行時間長の部分(もしくはこれに類似する部分)が、当該原音声データにおいて先行して現れているかどうかを調べ、現れている場合は、当該部分の出現場所を指標として、分割を行う。
本発明によれば、普通の楽曲の分割を適切に、自動的に行うことによって、容易に、冒頭音声データと繰返音声データとを生成することができる。
本発明は、類似度を音声データの波形の相関係数から求めることに相当するもので、本発明によれば、楽曲の分割を適切に、自動的に行うことができる。
本発明は、類似度が所定の閾値以上である部分が複数ある場合には、これを音響エンジニア等に提示し、これらのそれぞれに基づいて分割をした場合の繰り返し再生を行うなどの試行を行って、音響エンジニア等にいずれかを選択させる手法である。
本発明によれば、楽曲の分割を適切に、半自動的に行うとともに、人間にとって自然に移行がされるような繰り返し再生を行うための音声データの組み合わせを選択することができる。
すなわち、入力受付部は、音声データの入力を受け付ける。
一方、処理部は、受け付けられた音声データを原音声データとして上記の生成装置に与えて、冒頭音声データと、繰返音声データと、を得る。
さらに、再生部は、得られた冒頭音声データを再生し、その後、得られた繰返音声データを繰り返し再生する。
したがって、本発明によれば、入力を受け付けた音声データを元に、繰り返し再生を行うことができる。
一方、出力工程では、当該先行音声データを冒頭音声データとし、当該合成音声データを繰返音声データとして出力する。
すなわち、入力受付工程では、音声データの入力を受け付ける。
一方、処理工程では、受け付けられた音声データを原音声データとして請求項9に記載の生成方法に与えて、冒頭音声データと、繰返音声データと、を得る。
さらに、再生工程では、得られた冒頭音声データを再生し、その後、得られた繰返音声データを繰り返し再生する。
#D = #A + #B
であるほか、0≦i≦#A-1について
d[i] = a[i]
が成立し、0≦j≦#B-1について
d[#A+j] = b[j]
が成立する。
A[i;k]
と表記することとすると、D = A:Bについて、
D[0;#A] = A
ならびに、
D[#A;#B] = B
が成立する。
A,B,C×B,C×B,C×B,…
図2は、本実施形態に係る生成装置の概要構成図である。図3は、当該生成装置にて実行される生成方法の制御の流れを示すフローチャートである。以下、これらの図を参照して説明する。
以下では音声データBから音声データCへ移行時間Tでクロスフェードする音声データC×Bを合成する手法について説明する。なお、以下では、理解を容易にするため、移行時間Tの単位としてサンプル数(波形データを配列で表現したときの添字に相当する。)を用いることとする。たとえば、コンパクトディスク品質の音声データに対してクロスフェードの移行時間を3秒とした場合、移行時間Tは、44100×3=132300サンプルとなる。クロスフェードの移行時間Tは、定数としても良いし、音響エンジニア等の指示入力に応じて決定されることとしても良い。
(1)0≦i≦#C-T-1である場合、e[i] = c[i]
(2)0≦t≦T-1である場合、e[#C-T + t] = (1-t/T) c[#C-T + t] + t/T b[t]
(3)T≦i≦#B-1である場合、e[#C-T + i] = b[i]
#E = #C + #B - T
が成立する。また、明らかに、
E[0;#C-T] = C[0;#C-T]
ならびに、
E[#C;#B-T] = B[T;#B-T]
である。さらに、E[#C-T;T]は、C[#C-T;T]とB[0;T]とを、先頭からの経過時間tにより、比率(1-t/T):(t/T)でミキシングした結果に相当する。
これらは、図1に示すクロスフェードの様子を計算式にて表現したものである。
このほか、一般的なクロスフェード処理で用いられる各種の技術を、本実施形態において採用することもできる。(E[0;#C-T])(分割の手法)
(1)ベクトルZ[#Z-T;T]とZ[s;T]とがなす角が小さければ類似度が高いとする。たとえば、ベクトルZ[#Z-T;T]とZ[s;T]とがなす角の余弦(cosine;コサイン)を類似度とする。
(2)ベクトルZ[#Z-T;T]とZ[s;T]との差のベクトルの大きさが小さければ類似度が高いとする。たとえば、当該差のベクトルの大きさの符号を反転したものを類似度とする。
Z[#Z-T;T]・Z[s;T]/(|Z[#Z-T;T]| |Z[s;T]|)
f(s) = Z[#Z-T;T]・Z[s;T]/(|Z[#Z-T;T]| |Z[s;T]|)
G[s;t]・H[u;t] = Σi=0 t-1(g[s+i] h[u+i])
を計算することによって求められるし、あるベクトルG[s;t]の長さは、
|G[s;t]| = (G[s;t]・G[s;t])1/2
を計算することによって求められるからである。これらの計算にはΣがあらわれるため、ループによる計算のほか、ベクトル計算機を用いるなど、種々の計算技術を適用することができる。
上記実施例の生成装置201は、これが生成した冒頭楽曲データと繰返楽曲データとをCD−ROMなどの記憶媒体に記憶して配布することを想定している。すなわち、当該記憶媒体を購入等したユーザが、自身のコンピュータやゲーム装置といったハードウェアで当該記憶媒体を用い、まず冒頭楽曲データを再生し、これに引き続いて繰返楽曲データを繰り返し演奏する形態である。
さらに、再生部404は、得られた冒頭音声データを再生し、その後、得られた繰返音声データを繰り返し再生する(ステップS504)。この様子を聞いて、ユーザが結果に満足である場合(ステップS505;Yes)、本処理を終了することとし、再度編集を行いたい場合(ステップS505;No)、ステップS502に戻ることとなる。
11 第1音声データ
12 第2音声データ
13 第3音声データ
14 合成音声データ
15 冒頭音声データ
16 繰返音声データ
201 生成装置
202 分割部
203 生成部
204 出力部
401 再生装置
402 入力受付部
403 処理部
404 再生部
Claims (13)
- 与えられた音声データ(以下「原音声データ」という。)を3つ(以下、再生すべき順に「第1音声データ」「第2音声データ」「第3音声データ」という。)に分割する分割部、
当該第2音声データを先行音声データとし、当該第3音声データを後行音声データとして、当該後行音声データから当該先行音声データへクロスフェードする音声データ(以下「合成音声データ」という。)を生成する生成部、
当該第1音声データと当該第2音声データとを連結した音声データを最初に再生すべき音声データ(以下「冒頭音声データ」という。)とし、当該合成音声データをその後に繰り返して再生すべき音声データ(以下「繰返音声データ」という。)として出力する出力部
を備えることを特徴とする生成装置。 - 請求項1に記載の生成装置であって、
前記分割部は、当該原音声データの尾部移行時間長の部分(以下「移行部分」という。)と、当該原音声データのそれ以外の部分に含まれる当該移行時間長の部分(以下「被対比部分」という。)のそれぞれと、を対比して類似度を求め、当該被対比部分のうち類似度が高い部分(以下「類似部分」という。)を得て、
当該類似部分の先頭で、当該第1音声データと当該第2音声データとを分割し、
当該類似部分の末尾から当該尾部移行時間長の部分の先頭までのいずれかで、当該第2音声データと当該第3音声データとを分割する
ことを特徴とする生成装置。 - 請求項2に記載の生成装置であって、
前記分割部は、当該移行部分の音声データからなるベクトルと当該被対比部分の音声データからなるベクトルとがなす角の余弦を当該類似度として求める
ことを特徴とする生成装置。 - 請求項2または3に記載の生成装置であって、
前記分割部は、当該類似度が所定の閾値以上である被対比部分が複数ある場合、これらからいずれかをユーザに選択させて、選択された被対比部分を当該類似部分とする
ことを特徴とする生成装置。 - 請求項2から4のいずれか1項に記載の生成装置であって、
前記生成部は当該後行音声データの時間長および当該先行音声データの時間長よりも短い時間長(以下「移行時間」という。)を、当該クロスフェードの時間長として、当該合成音声データを生成する
ことを特徴とする生成装置。 - 請求項5に記載の生成装置であって、
前記生成部は、当該移行時間における当該合成音声データ中に含まれる当該後行音声データの成分が一定の割合で減少していくように当該合成音声データを生成する
ことを特徴とする生成装置。 - 音声データの入力を受け付ける入力受付部、
請求項2から請求項6のいずれか1項に記載の生成装置を有し、前記受け付けられた音声データを原音声データとして当該生成装置に与えて、冒頭音声データと、繰返音声データと、を得る処理部、および、
前記得られた冒頭音声データを再生し、その後、前記得られた繰返音声データを繰り返し再生する再生部
を備えることを特徴とする再生装置。 - 与えられた音声データ(以下「原音声データ」という。)を3つ(以下、再生すべき順に「第1音声データ」「第2音声データ」「第3音声データ」という。)に分割する分割工程、
当該第2音声データを先行音声データとし、当該第3音声データを後行音声データとして、当該後行音声データから当該先行音声データへクロスフェードする音声データ(以下「合成音声データ」という。)を生成する生成工程、
当該第1音声データと当該第2音声データとを連結した音声データを最初に再生すべき音声データ(以下「冒頭音声データ」という。)とし、当該合成音声データをその後に繰り返して再生すべき音声データ(以下「繰返音声データ」という。)として出力する出力工程
を備えることを特徴とする生成方法。 - 請求項8に記載の生成方法であって、
前記分割工程では、当該原音声データの尾部移行時間長の部分(以下「移行部分」という。)と、当該原音声データのそれ以外の部分に含まれる当該移行時間長の部分(以下「被対比部分」という。)のそれぞれと、を対比して類似度を求め、当該被対比部分のうち類似度が高い部分(以下「類似部分」という。)を得て、
当該類似部分の先頭で、当該第1音声データと当該第2音声データとを分割し、
当該類似部分の末尾から当該尾部移行時間長の部分の先頭までのいずれかで、当該第2音声データと当該第3音声データとを分割する
ことを特徴とする生成方法。 - 音声データの入力を受け付ける入力受付工程、
前記受け付けられた音声データ(以下「原音声データ」という。)を3つ(以下、再生すべき順に「第1音声データ」「第2音声データ」「第3音声データ」という。)に分割する分割工程、
当該第2音声データを先行音声データとし、当該第3音声データを後行音声データとして、当該後行音声データから当該先行音声データへクロスフェードする音声データ(以下「合成音声データ」という。)を生成する生成工程、
当該第1音声データと当該第2音声データとを連結した音声データを最初に再生すべき音声データ(以下「冒頭音声データ」という。)とし、当該合成音声データをその後に繰り返して再生すべき音声データ(以下「繰返音声データ」という。)として出力する出力工程、
前記出力された冒頭音声データを再生し、その後、前記出力された繰返音声データを繰り返し再生する再生工程
を備え、
前記分割工程では、当該原音声データの尾部移行時間長の部分(以下「移行部分」という。)と、当該原音声データのそれ以外の部分に含まれる当該移行時間長の部分(以下「被対比部分」という。)のそれぞれと、を対比して類似度を求め、当該被対比部分のうち類似度が高い部分(以下「類似部分」という。)を得て、
当該類似部分の先頭で、当該第1音声データと当該第2音声データとを分割し、
当該類似部分の末尾から当該尾部移行時間長の部分の先頭までのいずれかで、当該第2音声データと当該第3音声データとを分割する
ことを特徴とする再生方法。 - コンピュータを、
与えられた音声データ(以下「原音声データ」という。)を3つ(以下、再生すべき順に「第1音声データ」「第2音声データ」「第3音声データ」という。)に分割する分割部、
当該第2音声データを先行音声データとし、当該第3音声データを後行音声データとして、当該後行音声データから当該先行音声データへクロスフェードする音声データ(以下「合成音声データ」という。)を生成する生成部、
当該第1音声データと当該第2音声データとを連結した音声データを最初に再生すべき音声データ(以下「冒頭音声データ」という。)とし、当該合成音声データをその後に繰り返して再生すべき音声データ(以下「繰返音声データ」という。)として出力する出力部
として機能させることを特徴とするプログラム。 - 請求項11に記載のプログラムであって、前記コンピュータにおいて、
前記分割部は、当該原音声データの尾部移行時間長の部分(以下「移行部分」という。)と、当該原音声データのそれ以外の部分に含まれる当該移行時間長の部分(以下「被対比部分」という。)のそれぞれと、を対比して類似度を求め、当該被対比部分のうち類似度が高い部分(以下「類似部分」という。)を得て、
当該類似部分の先頭で、当該第1音声データと当該第2音声データとを分割し、
当該類似部分の末尾から当該尾部移行時間長の部分の先頭までのいずれかで、当該第2音声データと当該第3音声データとを分割する
ように機能させることを特徴とするプログラム。 - 請求項12に記載のプログラムであって、当該プログラムは、当該コンピュータを、
音声データの入力を受け付けてこれを前記生成部に原音声データとして与える入力受付部、および、
前記出力部から出力された冒頭音声データを再生し、その後、前記出力部から出力された繰返音声データを繰り返し再生する再生部
としてさらに機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003382379A JP3829134B2 (ja) | 2003-11-12 | 2003-11-12 | 生成装置、再生装置、生成方法、再生方法、および、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003382379A JP3829134B2 (ja) | 2003-11-12 | 2003-11-12 | 生成装置、再生装置、生成方法、再生方法、および、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005148210A JP2005148210A (ja) | 2005-06-09 |
JP3829134B2 true JP3829134B2 (ja) | 2006-10-04 |
Family
ID=34691478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003382379A Expired - Fee Related JP3829134B2 (ja) | 2003-11-12 | 2003-11-12 | 生成装置、再生装置、生成方法、再生方法、および、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3829134B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4735196B2 (ja) * | 2005-11-04 | 2011-07-27 | ヤマハ株式会社 | オーディオ再生装置 |
JP6056466B2 (ja) * | 2012-12-27 | 2017-01-11 | 大日本印刷株式会社 | 仮想空間中の音声再生装置及び方法、並びにプログラム |
JP6616435B2 (ja) * | 2018-01-25 | 2019-12-04 | 株式会社カプコン | 音声生成装置、音声生成プログラム |
JP7381856B2 (ja) * | 2019-11-12 | 2023-11-16 | 株式会社カプコン | 音声再生プログラム、音声再生装置、および音声生成方法 |
-
2003
- 2003-11-12 JP JP2003382379A patent/JP3829134B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005148210A (ja) | 2005-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11132984B2 (en) | Automatic multi-channel music mix from multiple audio stems | |
CN102227769A (zh) | 解码装置、解码方法、编码装置、编码方法和编辑装置 | |
JP2009093779A (ja) | コンテンツ再生装置及びコンテンツ再生方法 | |
JP4416244B2 (ja) | 音程変換装置 | |
US8670577B2 (en) | Electronically-simulated live music | |
JP3829134B2 (ja) | 生成装置、再生装置、生成方法、再生方法、および、プログラム | |
US8314321B2 (en) | Apparatus and method for transforming an input sound signal | |
CN111445914A (zh) | 可拆解和再编辑音频信号的处理方法及装置 | |
JP3617603B2 (ja) | 音声情報の符号化方法及びその生成方法 | |
JP2000311445A (ja) | ディジタルデータプレーヤー、そのデータ処理方法及び記録媒体 | |
JP3859200B2 (ja) | ポータブルミキシング記録装置及びその制御方法並びにプログラム | |
JP2006153908A (ja) | 音声データエンコード装置および音声データデコード装置 | |
JP3859201B2 (ja) | ポータブルミキシング記録装置及びその制御方法並びにプログラム | |
JP2003058192A (ja) | 音楽データ再生装置 | |
JP4595827B2 (ja) | 楽曲再生装置およびデータファイル制作ツール | |
JP2005033826A (ja) | ポータブルミキシング記録装置及びプログラム | |
US6314403B1 (en) | Apparatus and method for generating a special effect on a digital signal | |
JP2005107285A (ja) | 楽曲再生装置 | |
JP3412209B2 (ja) | 音響信号処理装置 | |
JP4714230B2 (ja) | 音声処理装置、音声処理方法、ならびに、プログラム | |
JP2003271198A (ja) | 圧縮データ処理装置、方法および圧縮データ処理プログラム | |
KR100826659B1 (ko) | 음악파일의 특정 연주부분을 소거 또는 선택하여 청취하는방법 | |
JP2003257125A (ja) | 音再生方法および音再生装置 | |
JP2006201655A (ja) | 楽曲再生装置及び楽曲再生プログラム | |
JPH07287576A (ja) | 音楽再生方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20050428 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060427 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20060427 |
|
TRDD | Decision of grant or rejection written | ||
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060525 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060710 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090714 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090714 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090714 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100714 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110714 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |