JP7160264B2 - 音データ処理装置、音データ処理方法及び音データ処理プログラム - Google Patents
音データ処理装置、音データ処理方法及び音データ処理プログラム Download PDFInfo
- Publication number
- JP7160264B2 JP7160264B2 JP2021531432A JP2021531432A JP7160264B2 JP 7160264 B2 JP7160264 B2 JP 7160264B2 JP 2021531432 A JP2021531432 A JP 2021531432A JP 2021531432 A JP2021531432 A JP 2021531432A JP 7160264 B2 JP7160264 B2 JP 7160264B2
- Authority
- JP
- Japan
- Prior art keywords
- sound data
- sound
- unit
- noise
- adjustment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 11
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 230000006870 function Effects 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 15
- 230000000694 effects Effects 0.000 claims description 13
- 230000006835 compression Effects 0.000 claims description 12
- 238000007906 compression Methods 0.000 claims description 12
- 238000004891 communication Methods 0.000 description 16
- 230000001755 vocal effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000004091 panning Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 210000003127 knee Anatomy 0.000 description 2
- 238000009527 percussion Methods 0.000 description 2
- WURBVZBTWMNKQT-UHFFFAOYSA-N 1-(4-chlorophenoxy)-3,3-dimethyl-1-(1,2,4-triazol-1-yl)butan-2-one Chemical compound C1=NC=NN1C(C(=O)C(C)(C)C)OC1=CC=C(Cl)C=C1 WURBVZBTWMNKQT-UHFFFAOYSA-N 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
また、一態様の音データ処理方法及び音データ処理プログラムは、一態様の音データ処理装置と同様の効果を奏することができる。
本明細書では、「情報」の文言を使用しているが、「情報」の文言は「データ」と言い換えることができ、「データ」の文言は「情報」と言い換えることができる。
本実施形態の音データ処理装置1は、より簡単に楽曲を制作したいとの要望に基づき発明されたものである。音データ処理装置1、例えば、コンピュータ及びサーバ等の情報処理装置であってよい。
図2は、一実施形態に係る音データ処理装置1について説明するためのブロック図である。
取得部12は、マイク部16で集音されることにより生成された音データを取得することとしてもよい。又は、取得部12は、通信部17を介して、サーバ100に蓄積される音データを取得することとしてもよい。
取得部12は、例えば、複数の楽器及びボーカルを利用して1つの楽曲を制作するために、複数の音データ(トラックデータ)を取得する。音データは、異なる場所で生成されてもよい。取得部12は、例えば、同一の楽曲について、部屋Aにおいてユーザが楽器Aを利用して演奏すること基づいて生成された音データAと、部屋Aとは異なる部屋Bにおいてユーザが楽器Bを利用して演奏することに基づいて生成された音データBとを取得することとしてもよい。
なお、取得部12は、例えば、1つの音データ(トラックデータ)のみを取得することとしてもよい。取得部12は、1つの音データのみ取得する場合には、後述する第2調整部142は、ミキシングの処理を行わなくともよい。
制御部11は、パート毎(例えば、楽器及びボーカル毎)に少なくともノイズが含まれる音を学習することにより学習モデルを生成することとしてもよい。
例えば、除去部13は、結合する分割パート(分割トラック)間にトライアングルフィルタ(Triangle Filter)を適用して、時間的に隣接する分割パート(分割トラック)同士を結合する。すなわち、例えば、除去部13は、隣接する分割パートのオーバーラップする部分を、トライアングルフィルタを利用してユーザが違和感を生じないように結合する。より具体的には、図3に例示するように、除去部13は、時間的に隣接する分割パート(一方の分割パート201及び他方の分割パート202)を結合する際に、結合位置203における結合の重み204を最も重くし、その結合位置203から離れるに従って連続的に又は段階的に結合の重み204を軽くする。これによい、除去部13は、重みの重さに応じて音を重畳させる割合が変えることができ、分割パート間での音の繋がりがユーザにとって不自然に感じることを抑制することが可能になる。
各パート(楽曲)のジャンルに関するジャンル情報は、上述した種類情報に含まれていてもよく、種類情報とは別に音データ(トラックデータ)に含まれていてもよい。また、ジャンル情報は、ユーザが入力装置(図示せず)を操作することに基づいて、ミキシング部14に入力されてもよい。
ここで、制御部11は、例えば、残響を有する音を複数学習することに基づいて、学習モデルを生成することとしてもよい。又は、制御部11は、例えば、残響を有する音と、残響を有しない音とを学習することに基づいて、学習モデルを生成することとしてもよい。
又は、音データ処理装置1の外部にあるサーバ100が、上述した制御部11の場合と同様にして、学習モデルを生成することとしてもよい。この場合、第1調整部141は、通信部17を介してサーバ100から学習モデルを取得する。
すなわち、上述した第1調整部141はマルチトラックで各調整を行う。第2調整部142は、第1調整部141によって各調整が行われたマルチトラックをミキシングしてシングルトラックにする。第2調整部142は、シングルトラックにする際、左右の出力バランスの調整(パニング調整)を行う。第2調整部142は、パニング調整を行う場合、例えば、各トラックが明確に聴こえるように、及び、ステレオチャンネルとして聴こえるように、各トラックの周波数帯を調整する。一例として、第2調整部142は、各トラックの音をマスキングする値及び各トラックの音を増幅する値を計算した後、その値に基づいて各トラックの音を調整してミキシングを行う。
なお、第2調整部142は、2チャンネルの出力(ステレオ出力)を行うデータを生成するばかりでなく、他のチャンネル数(一例として、5.1チャンネル等)の出力を行うデータを生成することとしてもよい。
図4は、一実施形態に係る音データ処理方法について説明するためのフローチャートである。
ここで、例えば、制御部11は、ノイズが含まれる音を学習することにより、学習モデルを生成することとしてもよい。又は、例えば、制御部11は、ノイズが含まれる音と、ノイズが含まれない音とを学習することにより、学習モデルを生成してもよい。
又は、制御部11の代わりに、音データ処理装置1の外部にあるサーバ100、学習モデルを生成することとしてもよい。この場合、除去部13は、通信部17を介して、サーバ100から学習モデルを取得する。
すなわち、第2調整部142は、各パートをミキシングすると共に、左右の出力バランス調整(パニング調整)を行う。第2調整部142は、ステップST103で各調整が行われたマルチトラックをミキシングしてシングルトラックにする。
音データ処理装置1は、音のパートを記録した音データを取得する取得部12と、予め複数の音を学習して生成されたパート毎の学習モデルと、取得部12によって取得されたパート毎の音データとに基づいて、パートそれぞれについてノイズを除去する処理を行う除去部13と、除去部13によってノイズが除去された各パートをミキシングするミキシング部14と、を備える。この場合、除去部13は、各パートの音データを複数に分割し、学習モデルと、分割後の音とに基づいて、その音からノイズを除去する処理を繰り返し、ノイズが除去されたトラックを時間的に連続するように結合する。
これにより、音データ処理装置1は、音に含まれる雑音を除去することができる。
これにより、音データ処理装置1は、除去部13によるノイズ除去の処理能力を超えるサイズの音データが入力される可能性があっても、音データを分割することによりノイズを除去することができる。
これにより、音データ処理装置1は、例えば、深層学習等を利用して、音データからノイズを除去することができる。
これにより、音データ処理装置1は、ノイズが除去された音に対して音に関する所定の調整を行うことにより、容易に楽曲を作成することができる。
これにより、音データ処理装置1は、楽曲の制作に必要な音に関する調整を行うことができるので、楽曲制作に関するユーザの利便性を向上できる。
これにより、音データ処理方法は、音に含まれる雑音を除去することができる。
これにより、音データ処理プログラムは、音に含まれる雑音を除去することができる。
音データ処理プログラムは、上述した各機能をコンピュータに実現させることができる。音データ処理プログラムは、外部メモリ又は光ディスク等の、コンピュータで読み取り可能な非一時的な記録媒体に記録されていてもよい。
また、上述したように、音データ処理装置1の各部は、コンピュータの演算処理装置等で実現されてもよい。その演算処理装置等は、例えば、集積回路等によって構成される。このため、音データ処理装置1の各部は、演算処理装置等を構成する回路として実現されてもよい。すなわち、音データ処理装置1の取得部12、除去部13、ミキシング部14(第1調整部141及び第調整部)並びに出力制御部15は、コンピュータの演算処理装置等を構成する取得回路、除去回路、ミキシング回路(第1調整回路及び第調整回路)並びに出力制御回路として実現されてもよい。
また、音データ処理装置1のマイク部16、通信部17、記憶部18及びスピーカ部19は、例えば、演算処理装置等の機能を含むマイク機能、通信機能、記憶機能及びスピーカ機能として実現されもよい。また、音データ処理装置1のマイク部16、通信部17、記憶部18及びスピーカ部19は、例えば、集積回路等によって構成されることによりマイク回路、通信回路、記憶回路及びスピーカ回路として実現されてもよい。また、音データ処理装置1のマイク部16、通信部17、記憶部18及びスピーカ部19は、例えば、複数のデバイスによって構成されることによりマイク装置、通信装置、記憶装置及びスピーカ装置として構成されてもよい。
11 制御部
12 取得部
13 除去部
14 ミキシング部
141 第1調整部
142 第2調整部
15 出力制御部
Claims (6)
- 音のパートを記録した音データを取得する取得部と、
予め複数の音を学習して生成されたパート毎の学習モデルと、前記取得部によって取得されたパート毎の音データとに基づいて、パートそれぞれについてノイズを除去する処理を行う除去部と、
前記除去部によってノイズが除去された各パートをミキシングするミキシング部と、を備え、
前記除去部は、各パートの音データを複数に分割し、学習モデルと、分割後の音とに基づいて、その音からノイズを除去する処理を繰り返し、ノイズが除去された分割された音データを時間的に連続するように結合する
音データ処理装置。 - 前記除去部は、ノイズのある異なる複数の場所で取得された音を学習することに基づいて生成された学習モデルを取得する
請求項1に記載の音データ処理装置。 - 前記ミキシング部は、
各パートの音データに対して音に関する所定の調整を施す第1調整部と、
第1調整部によって調整が施された各パートをミキシングするよう調整する第2調整部と、
を備える請求項1又は2に記載の音データ処理装置。 - 前記第1調整部は、音データに対する音に関する所定の調整として、レベル調整、イコライザ調整、残響効果調整及び圧縮調整のうち少なくとも1つの調整を行い、
第2調整部は、左右の出力バランス調整を行う
請求項3に記載の音データ処理装置。 - コンピュータが、
音のパートを記録した音データを取得する取得ステップと、
予め複数の音を学習して生成されたパート毎の学習モデルと、前記取得ステップによって取得されたパート毎の音データとに基づいて、パートそれぞれについてノイズを除去する処理を行う除去ステップと、
前記除去ステップによってノイズが除去された各パートをミキシングするミキシングステップと、を実行し、
前記除去ステップは、各パートの音データを複数に分割し、学習モデルと、分割後の音とに基づいて、その音からノイズを除去する処理を繰り返し、ノイズが除去された分割された音データを時間的に連続するように結合する
音データ処理方法。 - コンピュータに、
音のパートを記録した音データを取得する取得機能と、
予め複数の音を学習して生成されたパート毎の学習モデルと、前記取得機能によって取得されたパート毎の音データとに基づいて、パートそれぞれについてノイズを除去する処理を行う除去機能と、
前記除去機能によってノイズが除去された各パートをミキシングするミキシング機能と、を実現させ、
前記除去機能は、各パートの音データを複数に分割し、学習モデルと、分割後の音とに基づいて、その音からノイズを除去する処理を繰り返し、ノイズが除去された分割された音データを時間的に連続するように結合する
音データ処理プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/028476 WO2022018864A1 (ja) | 2020-07-22 | 2020-07-22 | 音データ処理装置、音データ処理方法及び音データ処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2022018864A1 JPWO2022018864A1 (ja) | 2022-01-27 |
JP7160264B2 true JP7160264B2 (ja) | 2022-10-25 |
Family
ID=79729354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021531432A Active JP7160264B2 (ja) | 2020-07-22 | 2020-07-22 | 音データ処理装置、音データ処理方法及び音データ処理プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7160264B2 (ja) |
WO (1) | WO2022018864A1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010249940A (ja) | 2009-04-13 | 2010-11-04 | Sony Corp | ノイズ低減装置、ノイズ低減方法 |
WO2013051084A1 (ja) | 2011-10-03 | 2013-04-11 | パイオニア株式会社 | 記録装置、記録方法、及び記録制御用のコンピュータプログラム、並びに再生装置、再生方法、及び再生制御用のコンピュータプログラム |
US20180247662A1 (en) | 2016-04-22 | 2018-08-30 | Tencent Technology (Shenzhen) Company Limited | Voice detection method and apparatus, and storage medium |
CN108615535A (zh) | 2018-05-07 | 2018-10-02 | 腾讯科技(深圳)有限公司 | 语音增强方法、装置、智能语音设备和计算机设备 |
JP2020034624A (ja) | 2018-08-27 | 2020-03-05 | 株式会社東芝 | 信号生成装置、信号生成システム、信号生成方法およびプログラム |
CN111354367A (zh) | 2018-12-24 | 2020-06-30 | 中国移动通信有限公司研究院 | 一种语音处理方法、装置及计算机存储介质 |
-
2020
- 2020-07-22 JP JP2021531432A patent/JP7160264B2/ja active Active
- 2020-07-22 WO PCT/JP2020/028476 patent/WO2022018864A1/ja active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010249940A (ja) | 2009-04-13 | 2010-11-04 | Sony Corp | ノイズ低減装置、ノイズ低減方法 |
WO2013051084A1 (ja) | 2011-10-03 | 2013-04-11 | パイオニア株式会社 | 記録装置、記録方法、及び記録制御用のコンピュータプログラム、並びに再生装置、再生方法、及び再生制御用のコンピュータプログラム |
US20180247662A1 (en) | 2016-04-22 | 2018-08-30 | Tencent Technology (Shenzhen) Company Limited | Voice detection method and apparatus, and storage medium |
CN108615535A (zh) | 2018-05-07 | 2018-10-02 | 腾讯科技(深圳)有限公司 | 语音增强方法、装置、智能语音设备和计算机设备 |
JP2020034624A (ja) | 2018-08-27 | 2020-03-05 | 株式会社東芝 | 信号生成装置、信号生成システム、信号生成方法およびプログラム |
CN111354367A (zh) | 2018-12-24 | 2020-06-30 | 中国移动通信有限公司研究院 | 一种语音处理方法、装置及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2022018864A1 (ja) | 2022-01-27 |
JPWO2022018864A1 (ja) | 2022-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102268933B1 (ko) | 다수의 오디오 스템들로부터의 자동 다-채널 뮤직 믹스 | |
JP6377249B2 (ja) | オーディオ信号の強化のための装置と方法及び音響強化システム | |
WO2008065731A1 (fr) | Processeur audio et procédé de traitement audio | |
US20220386062A1 (en) | Stereophonic audio rearrangement based on decomposed tracks | |
CN114067827A (zh) | 一种音频处理方法、装置及存储介质 | |
CN103262573B (zh) | 声音再生装置、再生音调整方法、音响特性调整装置、音响特性调整方法及计算机程序 | |
JP7028613B2 (ja) | オーディオプロセッサおよびオーディオ再生装置 | |
JP7160264B2 (ja) | 音データ処理装置、音データ処理方法及び音データ処理プログラム | |
JP4392040B2 (ja) | 音響信号処理装置、音響信号処理方法、音響信号処理プログラムおよびコンピュータに読み取り可能な記録媒体 | |
CA3235626A1 (en) | Generating tonally compatible, synchronized neural beats for digital audio files | |
US20090293706A1 (en) | Music Composition Reproducing Device and Music Compositoin Reproducing Method | |
JP2009031357A (ja) | 楽曲配信システム、楽曲編集装置、楽曲再生装置、楽曲記憶装置およびプログラム | |
JP5598722B2 (ja) | 音声再生装置、音声再生装置における再生音調整方法 | |
JP7487060B2 (ja) | 音響装置および音響制御方法 | |
JP4415775B2 (ja) | 音声信号処理装置およびその方法、音声信号記録再生装置ならびにプログラム | |
Matsakis | Mastering Object-Based Music with an Emphasis on Philosophy and Proper Techniques for Streaming Platforms | |
JP5588129B2 (ja) | 同期再生装置、同期再生方法および同期再生プログラム | |
JP6819236B2 (ja) | 音処理装置、音処理方法、及びプログラム | |
JP6834398B2 (ja) | 音処理装置、音処理方法、及びプログラム | |
Pietilä | Producing a skate punk record | |
Lindström | Modelling how sound engineers counter global gain rise in live mixes to evaluate possible implementations of automatic gain adjustments | |
JP5440677B2 (ja) | 楽曲配信システム、楽曲編集装置およびプログラム | |
Geluso | Mixing and Mastering | |
Brandberg | Is there a correlation between the natural reverberation in a critical listening environment and adjustments of an artificial reverb? | |
Clarke | I LOVE IT LOUD! |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210601 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220913 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221003 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7160264 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |