JP5273080B2 - 歌声分離装置、及びプログラム - Google Patents
歌声分離装置、及びプログラム Download PDFInfo
- Publication number
- JP5273080B2 JP5273080B2 JP2010078666A JP2010078666A JP5273080B2 JP 5273080 B2 JP5273080 B2 JP 5273080B2 JP 2010078666 A JP2010078666 A JP 2010078666A JP 2010078666 A JP2010078666 A JP 2010078666A JP 5273080 B2 JP5273080 B2 JP 5273080B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- singing
- transition
- frequency
- musical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Auxiliary Devices For Music (AREA)
Description
この特許文献1に記載の装置において、歌声は、時間軸に沿った軌跡が連続し、かつ混合音の中音域及び高音域にて最もパワーが大きい調波構造を有すると仮定されている。
本発明が、このようなプログラムとしてなされている場合、本発明のプログラムは、請求項6に記載されたように、音響データから楽音推移を取得する楽音取得手順と、その取得された楽音推移から楽音スペクトログラムを導出する楽音解析手順と、歌声データから歌唱音推移を取得する歌唱音取得手順と、その取得した歌唱音推移から歌唱音スペクトログラムを、分析区間毎に導出する歌唱音解析手順と、その導出された各分析区間での歌唱音スペクトログラム、及び当該分析区間に対応する区間における楽音スペクトログラムに基づいて、振幅比率を導出する振幅導出手順と、その導出された振幅比率それぞれを、当該分析区間に対応する楽音スペクトログラムを構成する周波数スペクトルの各周波数の強さに乗じた結果である分離スペクトルを、時間軸に沿った音圧の推移に変換した区間推移を導出する区間推移導出手順と、その導出した区間推移を時間軸に沿って配することで、歌声推移を生成する歌声分離手順とをコンピュータに実行させる必要がある。
本発明が適用された歌声分離装置は、楽曲を歌唱した歌声を含む楽音の音圧が時間軸に沿って推移した波形を表す音響データから、歌声の音圧が時間軸に沿って推移した波形である歌声推移を分離・抽出する装置であり、図1に示す情報処理装置10によって構成されている。
〈歌声分離装置の構成について〉
図1に示すように、情報処理装置10は、音響データ読取部12と、入力受付部13と、表示部14と、音声入力部15と、音声出力部16と、記憶部17と、制御部20とを備えている。
このうち、ROM21は、電源が切断されても記憶内容を保持する必要がある処理プログラムやデータを格納するものである。また、RAM22は、処理プログラムやデータを一時的に格納するものである。そして、CPU23は、ROM21やRAM22に記憶された処理プログラムに従って各処理(各種演算)を実行する。
〈歌声分離処理の処理内容について〉
次に、制御部20が実行する歌声分離処理について説明する。
そして、図3に示すように、歌声分離処理は、起動されると、音響データに基づいて、楽音の音圧が時間軸に沿って推移した波形である楽音推移tuwf(ti)を取得する(S110)。具体的に、本実施形態では、音響データ読取部12にて読み取った当該楽曲を再生して、その再生した音声(即ち、楽音)を音声出力部16から出力する。そして、音声入力部15を介して入力された音声をサンプリングすることで楽音推移tuwf(ti)を取得する。なお、符合tiは、時間軸に沿って楽音をサンプリングした順番である。
[実施形態の効果]
以上説明したように、本実施形態の歌声分離装置10にて導出される分離スペクトルのスペクトル振幅値vscpsp(twi,fi)は、楽音推移tuwfに含まれる歌声の周波数毎に、その周波数の強さを表す。このスペクトル振幅値vscpsp(twi,fi)を逆フーリエ変換することで、区間推移vscpwfを導出する歌声分離装置10によれば、歌声の周波数構造に関わらず、歌声推移vowfを生成することができる。つまり、歌声分離装置10によれば、調波構造を有していない歌声成分が含まれる楽音推移tuwfであっても、その楽音推移tuwfから歌声推移vowfを抽出することができる。
[その他の実施形態]
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において、様々な態様にて実施することが可能である。
[実施形態と特許請求の範囲との対応関係]
最後に、上記実施形態の記載と、特許請求の範囲の記載との関係を説明する。
Claims (6)
- 楽曲を歌唱した際の歌声に加えて、当該楽曲にて演奏された楽器の楽器音が含まれる楽音の音圧が時間軸に沿って推移した波形を表すデータとして予め用意された音響データから、前記楽音の音圧が時間軸に沿って推移した波形である楽音推移を取得する楽音取得手段と、
前記楽音取得手段で取得された楽音推移に含まれる周波数と各周波数の強さとを表す周波数スペクトルを時間軸に沿って配した楽音スペクトログラムを導出する楽音解析手段と、
前記楽音取得手段で取得した楽音推移に対応する音響データによって表される楽曲を、前記音響データに含まれる歌声とは少なくとも異なるタイミングで歌唱した際の歌声である歌唱音を録音した歌声データから、当該歌唱音の音圧が時間軸に沿って推移した歌唱音推移を取得する歌唱音取得手段と、
前記歌唱音取得手段にて取得した歌唱音推移に含まれる周波数と各周波数の強さとを表す周波数スペクトルを時間軸に沿って配した歌唱音スペクトログラムを、前記歌唱音推移における発声の開始タイミングから終了タイミングまでの期間である分析区間毎に導出する歌唱音解析手段と、
前記歌唱音解析手段にて導出された各分析区間での前記歌唱音スペクトログラムを構成する周波数スペクトルの各周波数の強さと、当該分析区間に対応する前記楽音スペクトログラムを構成する周波数スペクトルの各周波数の強さとの比を表す振幅比率を導出する振幅導出手段と、
前記振幅導出手段で導出された振幅比率それぞれを、当該分析区間に対応する前記楽音スペクトログラムを構成する周波数スペクトルの各周波数の強さに乗じた結果である分離スペクトルから、時間軸に沿った音圧の推移である区間推移を導出する区間推移導出手段と、
前記区間推移導出手段にて導出した区間推移を前記楽曲の時間軸に沿って配することで、前記楽音推移における歌声の音圧が時間軸に沿って推移した歌声推移を生成する歌声分離手段と
を備えることを特徴とする歌声分離装置。 - 前記歌唱音解析手段にて導出された各分析区間の歌唱音スペクトログラムを前記楽音解析手段にて導出された楽音スペクトログラムに照合して、当該歌唱音スペクトログラムが時間軸に沿って最も一致する前記楽音スペクトログラムでの範囲を特定する範囲特定手段を備え、
前記振幅導出手段は、
前記範囲特定手段にて特定された楽音スペクトログラムでの範囲を、各分析区間に対応する前記楽音スペクトログラムとすることを特徴とする請求項1に記載の歌声分離装置。 - 前記楽音取得手段にて取得した楽音推移に含まれる歌声の基本周波数が時間軸に沿って推移した周波数推移を推定する周波数推定手段と、
前記歌唱音取得手段にて取得した歌唱音推移の各分析区間における基本周波数が、前記周波数推定手段にて推定された周波数推移のうち、当該分析区間に対応する区間での基本周波数に一致するように、当該分析区間での歌唱音スペクトログラムを周波数軸に沿って補正した補正スペクトログラムを生成する周波数補正手段と
を備え、
前記振幅導出手段は、
前記周波数補正手段にて生成された補正スペクトログラムそれぞれを、各分析区間での歌唱音スペクトログラムとすることを特徴とする請求項1または請求項2に記載の歌声分離装置。 - 前記区間推移導出手段にて導出された区間推移を前記楽音推移から減算した残留楽音推移を導出して、その導出した残留楽音推移を記憶装置に記憶する記憶制御手段と、
前記区間推移導出手段にて区間推移が導出される毎に、その導出された区間推移を前記記憶装置に記憶された残留楽音推移から減算して、当該記憶装置に記憶された残留楽音推移を更新する更新手段と
を備えることを特徴とする請求項1から請求項3のいずれか一項に記載の歌声分離装置。 - 前記楽音解析手段は、
前記楽音取得手段にて取得した楽音推移に含まれる歌声の基本周波数が時間軸に沿って推移した周波数推移を推定し、
前記歌唱音解析手段は、
前記歌唱音取得手段にて取得した歌唱音推移における基本周波数が時間軸に沿って推移する歌唱周波数推移を推定し、その推定された歌唱周波数推移が、前記周波数推移に連動して予め規定された規定値以上変化するタイミングである始端、及びその始端に対応する終端を特定して、前記始端と前記終端との間の区間を前記分析区間とすることを特徴とする請求項1から請求項4のいずれか一項に記載の歌声分離装置。 - 楽曲を歌唱した際の歌声に加えて、当該楽曲にて演奏された楽器の楽器音が含まれる楽音の音圧が時間軸に沿って推移した波形を表すデータとして予め用意された音響データから、前記楽音の音圧が時間軸に沿って推移した波形である楽音推移を取得する楽音取得手順と、
前記楽音取得手順で取得された楽音推移に含まれる周波数と各周波数の強さとを表す周波数スペクトルを時間軸に沿って配した楽音スペクトログラムを導出する楽音解析手順と、
前記楽音取得手順で取得した楽音推移に対応する音響データによって表される楽曲を、前記音響データに含まれる歌声とは少なくとも異なるタイミングで歌唱した際の歌声である歌唱音を録音した歌声データから、当該歌唱音の音圧が時間軸に沿って推移した歌唱音推移を取得する歌唱音取得手順と、
前記歌唱音取得手順にて取得した歌唱音推移に含まれる周波数と各周波数の強さとを表す周波数スペクトルを時間軸に沿って配した歌唱音スペクトログラムを、前記歌唱音推移における発声の開始タイミングから終了タイミングまでの期間である分析区間毎に導出する歌唱音解析手順と、
前記歌唱音解析手順にて導出された各分析区間での前記歌唱音スペクトログラムを構成する周波数スペクトルの各周波数の強さと、当該分析区間に対応する前記楽音スペクトログラムを構成する周波数スペクトルの各周波数の強さとの比を表す振幅比率を導出する振幅導出手順と、
前記振幅導出手順で導出された振幅比率それぞれを、当該分析区間に対応する前記楽音スペクトログラムを構成する周波数スペクトルの各周波数の強さに乗じた結果である分離スペクトルを、時間軸に沿った音圧の推移に変換した区間推移を導出する区間推移導出手順と、
前記区間推移導出手順にて導出した区間推移を時間軸に沿って配することで、前記楽音推移における歌声の音圧が時間軸に沿って推移した歌声推移を生成する歌声分離手順と
をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010078666A JP5273080B2 (ja) | 2010-03-30 | 2010-03-30 | 歌声分離装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010078666A JP5273080B2 (ja) | 2010-03-30 | 2010-03-30 | 歌声分離装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011209593A JP2011209593A (ja) | 2011-10-20 |
JP5273080B2 true JP5273080B2 (ja) | 2013-08-28 |
Family
ID=44940706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010078666A Active JP5273080B2 (ja) | 2010-03-30 | 2010-03-30 | 歌声分離装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5273080B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105511833A (zh) * | 2015-11-25 | 2016-04-20 | 广州周立功单片机科技有限公司 | 音频频谱、动画显示方法和系统 |
CN107017005A (zh) * | 2017-04-27 | 2017-08-04 | 同济大学 | 一种基于dft的双通道语声分离方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014178641A (ja) * | 2013-03-15 | 2014-09-25 | Yamaha Corp | 分離用データ処理装置およびプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3511360B2 (ja) * | 1998-03-09 | 2004-03-29 | 日本電信電話株式会社 | 音楽音響信号分離方法、その装置およびそのプログラム記録媒体 |
JP3950667B2 (ja) * | 2001-10-24 | 2007-08-01 | 隆義 山本 | 信号源毎の信号を求める方法及び装置 |
DE602005018776D1 (de) * | 2004-07-01 | 2010-02-25 | Nippon Telegraph & Telephone | System für detektionssektion mit einem bestimmten akustischen signal, verfahren und programm dafür |
JP4613923B2 (ja) * | 2007-03-30 | 2011-01-19 | ヤマハ株式会社 | 楽音処理装置およびプログラム |
-
2010
- 2010-03-30 JP JP2010078666A patent/JP5273080B2/ja active Active
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105511833A (zh) * | 2015-11-25 | 2016-04-20 | 广州周立功单片机科技有限公司 | 音频频谱、动画显示方法和系统 |
CN105511833B (zh) * | 2015-11-25 | 2018-08-28 | 广州周立功单片机科技有限公司 | 音频频谱、动画显示方法和系统 |
CN107017005A (zh) * | 2017-04-27 | 2017-08-04 | 同济大学 | 一种基于dft的双通道语声分离方法 |
CN107017005B (zh) * | 2017-04-27 | 2020-03-24 | 同济大学 | 一种基于dft的双通道语声分离方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2011209593A (ja) | 2011-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111418005B (zh) | 声音合成方法、声音合成装置及存储介质 | |
MX2012009787A (es) | Aparato y metodo para modificar una señal de audio usando modelado de envolvente. | |
US20210366454A1 (en) | Sound signal synthesis method, neural network training method, and sound synthesizer | |
JP6347536B2 (ja) | 音合成方法及び音合成装置 | |
JP5273080B2 (ja) | 歌声分離装置、及びプログラム | |
US20210350783A1 (en) | Sound signal synthesis method, neural network training method, and sound synthesizer | |
JP5267495B2 (ja) | 楽器音分離装置、及びプログラム | |
JP2006178334A (ja) | 語学学習システム | |
KR20230006629A (ko) | 이미지를 통한 학습을 이용하여 합성 음원을 생성하는 장치, 방법 및 컴퓨터 프로그램 | |
CN109215625A (zh) | 一种音准评定方法和装置 | |
JP5310677B2 (ja) | 音源分離装置、及びプログラム | |
JP6075314B2 (ja) | プログラム,情報処理装置,及び評価方法 | |
JP6260565B2 (ja) | 音声合成装置、及びプログラム | |
JP5879813B2 (ja) | 複数音源の識別装置および複数音源に連動する情報処理装置 | |
JP2016071122A (ja) | カラオケ装置、及びプログラム | |
JP2015184447A (ja) | プログラム,情報処理装置,及び評価データ生成方法 | |
JP5983670B2 (ja) | プログラム、情報処理装置、及びデータ生成方法 | |
JP6390130B2 (ja) | 楽曲演奏装置、楽曲演奏方法及びプログラム | |
JP7088403B2 (ja) | 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム | |
JP2012063501A (ja) | 音声処理装置 | |
JPH11143460A (ja) | 音楽演奏に含まれる旋律の分離方法、分離抽出方法および分離除去方法 | |
JP6281447B2 (ja) | 音声合成装置,及び音声合成システム | |
JP2011186054A (ja) | タイミング特定装置、及びプログラム | |
JP2001265400A (ja) | ピッチ変換装置及びピッチ変換方法 | |
JP6304092B2 (ja) | 表示制御装置、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120302 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130327 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130429 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5273080 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |