JPWO2013038459A1 - 音声処理装置、再生装置、音声処理方法およびプログラム - Google Patents

音声処理装置、再生装置、音声処理方法およびプログラム Download PDF

Info

Publication number
JPWO2013038459A1
JPWO2013038459A1 JP2013533349A JP2013533349A JPWO2013038459A1 JP WO2013038459 A1 JPWO2013038459 A1 JP WO2013038459A1 JP 2013533349 A JP2013533349 A JP 2013533349A JP 2013533349 A JP2013533349 A JP 2013533349A JP WO2013038459 A1 JPWO2013038459 A1 JP WO2013038459A1
Authority
JP
Japan
Prior art keywords
sound
processing
unit
specific
bass drum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013533349A
Other languages
English (en)
Other versions
JP5617042B2 (ja
Inventor
松本 崇
崇 松本
章 服部
章 服部
一郎 菅井
一郎 菅井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Corp filed Critical Pioneer Corp
Application granted granted Critical
Publication of JP5617042B2 publication Critical patent/JP5617042B2/ja
Publication of JPWO2013038459A1 publication Critical patent/JPWO2013038459A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H5/00Instruments in which the tones are generated by means of electronic generators
    • G10H5/005Voice controlled instruments
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10DSTRINGED MUSICAL INSTRUMENTS; WIND MUSICAL INSTRUMENTS; ACCORDIONS OR CONCERTINAS; PERCUSSION MUSICAL INSTRUMENTS; AEOLIAN HARPS; SINGING-FLAME MUSICAL INSTRUMENTS; MUSICAL INSTRUMENTS NOT OTHERWISE PROVIDED FOR
    • G10D13/00Percussion musical instruments; Details or accessories therefor
    • G10D13/01General design of percussion musical instruments
    • G10D13/02Drums; Tambourines with drumheads
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G10H1/06Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
    • G10H1/12Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
    • G10H1/125Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms using a digital filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H3/00Instruments in which the tones are generated by electromechanical means
    • G10H3/12Instruments in which the tones are generated by electromechanical means using mechanical resonant generators, e.g. strings or percussive instruments, the tones of which are picked up by electromechanical transducers, the electrical signals being further manipulated or amplified and subsequently converted to sound by a loudspeaker or equivalent instrument
    • G10H3/14Instruments in which the tones are generated by electromechanical means using mechanical resonant generators, e.g. strings or percussive instruments, the tones of which are picked up by electromechanical transducers, the electrical signals being further manipulated or amplified and subsequently converted to sound by a loudspeaker or equivalent instrument using mechanically actuated vibrators with pick-up means
    • G10H3/146Instruments in which the tones are generated by electromechanical means using mechanical resonant generators, e.g. strings or percussive instruments, the tones of which are picked up by electromechanical transducers, the electrical signals being further manipulated or amplified and subsequently converted to sound by a loudspeaker or equivalent instrument using mechanically actuated vibrators with pick-up means using a membrane, e.g. a drum; Pick-up means for vibrating surfaces, e.g. housing of an instrument
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/051Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction or detection of onsets of musical sounds or notes, i.e. note attack timings
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/056Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction or identification of individual instrumental parts, e.g. melody, chords, bass; Identification or separation of instrumental parts by their characteristic voices or timbres
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/155Musical effects
    • G10H2210/321Missing fundamental, i.e. creating the psychoacoustic impression of a missing fundamental tone through synthesis of higher harmonics, e.g. to play bass notes pitched below the frequency range of reproducing speakers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2230/00General physical, ergonomic or hardware implementation of electrophonic musical tools or instruments, e.g. shape or architecture
    • G10H2230/045Special instrument [spint], i.e. mimicking the ergonomy, shape, sound or other characteristic of a specific acoustic musical instrument category
    • G10H2230/251Spint percussion, i.e. mimicking percussion instruments; Electrophonic musical instruments with percussion instrument features; Electrophonic aspects of acoustic percussion instruments or MIDI-like control therefor
    • G10H2230/275Spint drum
    • G10H2230/291Spint drum bass, i.e. mimicking bass drums; Pedals or interfaces therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/025Envelope processing of music signals in, e.g. time domain, transform domain or cepstrum domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/315Sound category-dependent sound synthesis processes [Gensound] for musical use; Sound category-specific synthesis-controlling parameters or control means therefor
    • G10H2250/435Gensound percussion, i.e. generating or synthesising the sound of a percussion instrument; Control of specific aspects of percussion sounds, e.g. harmonics, under the influence of hitting force, hitting position, settings or striking instruments such as mallet, drumstick, brush or hand
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/02Manually-operated control

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

楽曲の再生に伴って、当該楽曲に含まれる特定の楽器音をリアルタイムに抽出することを目的とする。本発明の音声処理部12は、音声信号からバスドラム音のアタック位置を判定するアタック判定部42と、音声信号からバスドラムの発音区間を判定するバスドラム音判定部43と、アタック位置に対して時間変化型フィルタを用いると共に、発音区間に対して適応型フィルタを用いることで、バスドラム音を抽出するバスドラム音抽出部44と、を備えたことを特徴とする。

Description

音声信号から、特定の打楽器による特定音を抽出する音声処理装置、再生装置、音声処理方法およびプログラムに関するものである。
従来、楽曲中の各楽器の音を制御する方法として、アイソレータ110(バンド分割フィルタを用いたイコライザの一種)を用いた方法が知られている(図11参照)。ところが、当該アイソレータ110を用いて低域のレベルを下げると、ベース音とバスドラム音が同時に削れてしまう。つまり、ベース音だけの減衰、またはバスドラム音だけの減衰など、楽器別の制御はできない。
そこで、楽器別に音を制御する方法として、例えば特許文献1が知られている。特許文献1では、楽曲解析部により、楽曲データの波形を解析し、その楽曲データに含まれる個々の楽器音を抽出する。具体的には、時系列にラベル付けされたログスペクトルを予め用意し、当該ログスペクトルを所定時間単位で切り出した部分ログスペクトルを用いて楽器音毎に存在確率の時系列分布を求め、当該時系列分布に基づいて音素材を切り出す。
特開2010−134231号公報(段落[0079]、[0216]〜[0218]、図2、73等参照)
ところが、特許文献1の方法では、楽曲データの事前解析が必要であり、楽曲を再生しながらリアルタイムに楽器音を抽出することができない。一方、アイソレータを用いた方法では、リアルタイムに音を制御することができるものの、楽器別の制御ができない。
本発明は、上記の問題点に鑑み、楽曲の再生に伴って、当該楽曲に含まれる特定の楽器音をリアルタイムに抽出可能な音声処理装置、再生装置、音声処理方法およびプログラムを提供することを目的とする。
本発明の音声処理装置は、入力された音声信号から、特定の打楽器による発音区間を判定する発音区間判定部と、発音区間に対し、音声信号の音量変化に連動して抽出率が異なる適応型フィルタを用いることで、特定の打楽器による特定音を抽出する特定音抽出部と、を備えたことを特徴とする。
本発明の音声処理方法は、入力された音声信号から、特定の打楽器による発音区間を判定する発音区間判定工程と、発音区間に対し、音声信号の音量変化に連動して抽出率が異なる適応型フィルタを用いることで、特定の打楽器による特定音を抽出する特定音抽出工程と、を実行することを特徴とする。
これらの構成によれば、特定の打楽器による発音区間を判定し、当該発音区間に対して適応型フィルタを用いるだけの簡易な処理で、特定の打楽器による特定音を抽出できる。これにより、楽曲データの事前解析を必要とすることなく、楽曲を再生しながら特定の楽器音を抽出できる。
なお、打楽器とは、バスドラム、スネア、ティンパニなどの膜鳴楽器だけでなく、カスタネットやシンバルなどの体鳴楽器も含む概念である。
上記の音声処理装置において、音声信号から、特定音のアタック位置を判定するアタック判定部をさらに備え、特定音抽出部は、アタック位置に対し、時間変化型フィルタを用いることで、特定の打楽器による特定音を抽出することを特徴とする。
この構成によれば、アタック位置に対して時間変化型フィルタを用いるだけの簡易な処理で、特定の打楽器による特定音を抽出できる。また、適応型フィルタを用いた処理と組み合わせることで、より正確に特定音を抽出できる。
なお、時間変化型フィルタと適応型フィルタを個別に用いるのではなく、これらを組み合わせた1のフィルタを用いて、同一の打楽器による特定音を抽出しても良い。
上記の音声処理装置において、特定の打楽器はバスドラムであり、音声信号の低域振幅レベルを検出する低域振幅検出部をさらに備え、アタック判定部は、低域振幅レベルに基づいてアタック位置を判定することを特徴とする。
この構成によれば、音声信号から、バスドラム音だけを抽出することができる。また、低域振幅レベルに基づいてアタック位置を判定することで、バスドラムのアタック位置をより正確に判定できる。
上記の音声処理装置において、発音区間判定部は、アタック判定部の判定結果および音声信号のベース音量に基づいて、発音区間を判定することを特徴とする。
この構成によれば、低域帯の楽器であるベースの音量を考慮して発音区間を判定することで、より正確にバスドラム音だけを抽出することができる。
なお、発音区間判定部は、ベース音量が高い場合、ベース音量が低い場合よりも発音区間が短くなるように判定を行うことが好ましい。この構成によれば、音声信号からバスドラム音を減衰させたい場合、ベース音を残しつつ、バスドラム音だけを効率的に抽出することができる。
また、発音区間判定部は、アタック判定部の判定結果および音声信号のベース音量に加え、低域振幅検出部により検出された低域振幅レベルに基づいて、発音区間を判定しても良い。例えば、アタック位置に基づいて抽出ポイントを決定し、ベース音量と低域振幅レベルに基づいて、抽出ポイントを含む発音区間の開始点および終了点を決定しても良い。
上記の音声処理装置において、低域振幅検出部は、高速フーリエ変換により生成された複素データを用いて、音声信号の低域振幅レベルを検出することを特徴とする。
この構成によれば、ローパスフィルタを用いて音声信号の低域振幅レベルを検出する場合と比較して、より正確に低域振幅レベルを検出することができる。
上記の音声処理装置において、特定の打楽器はバスドラムであり、ローパスフィルタを用いて、音声信号の低域振幅レベルを検出する低域振幅検出部をさらに備え、発音区間判定部は、低域振幅レベルに基づいて、発音区間を判定することを特徴とする。
この構成によれば、高速フーリエ変換を用いて音声信号の低域振幅レベルを検出する場合と比較して、より簡易な処理で低域振幅レベルを検出することができる。これにより処理遅延が少なくなり、楽曲を再生しながら特定音を抽出する場合のリアルタイム性を向上できる。
上記の音声処理装置において、特定音として抽出したバスドラム音と、ハイパスフィルタを用いて、ベース音を抽出するベース音抽出部をさらに備えたことを特徴とする。
この構成によれば、音声信号から、ベース音だけを抽出することができる。
上記の音声処理装置において、抽出したバスドラム音およびベース音の少なくとも一方に対し加工処理を行う加工処理部をさらに備えたことを特徴とする。
上記の音声処理装置において、加工処理部は、音の反転、音の増幅、音の減衰、エフェクト付与、のうち少なくとも2以上の加工処理を行うことを特徴とする。
上記の音声処理装置において、2以上の加工処理の中から、いずれかの加工処理を選択的に実行させるための操作部をさらに備えたことを特徴とする。
上記の音声処理装置において、操作部は、各加工処理について、加工処理量を調節可能であることを特徴とする。
これらの構成によれば、抽出したバスドラム音および/またはベース音に対し、複数種類の加工処理の中から、ユーザーの所望する加工処理を行うことができる。また、音の増幅量、音の減衰量、エフェクトのレベルなど、ユーザーの好みに応じて調節することができる。
なお、「音の減衰」とは、「音の除去(減衰率を最大にする)」を含む概念である。
また、「エフェクト付与」としては、ディレイをかける、リバーブをかける、などDJ機器等で用いられる各種エフェクト処理を適用可能である。
本発明の再生装置は、上記の音声処理装置における各部と、音声信号を入力する音声入力部と、音声処理装置による音声処理後の音声信号を出力する音声出力部と、を備えたことを特徴とする。
この構成によれば、楽曲を再生しながら、当該楽曲に含まれる特定の楽器音をリアルタイムに抽出可能な再生装置を実現できる。
本発明のプログラムは、コンピューターを、上記の音声処理装置における各部として機能させることを特徴とする。
このプログラムを用いることにより、楽曲の再生に伴って、当該楽曲に含まれる特定の楽器音をリアルタイムに抽出可能な音声処理装置を実現できる。
本発明の一実施形態に係る再生装置の全体ブロック図である。 操作部の説明図である。 第1実施形態に係る音声処理部の詳細ブロック図である。 音声処理部内におけるアタック判定部の詳細ブロック図である。 アタック検出処理を示すフローチャートである。 音声処理部内におけるバスドラム音判定部の詳細ブロック図である。 時変フィルタの一例を示す図である。 第1実施形態に係るバスドラム音除去処理(a)およびベース音除去処理(b)を示す工程図である。 第2実施形態に係る音声処理部の詳細ブロック図である。 第2実施形態に係るバスドラム音除去処理(a)およびベース音除去処理(b)を示す工程図である。 従来のアイソレータの機能を示す説明図である。
以下、添付の図面を参照し、本発明の一実施形態に係る音声処理装置、再生装置、音声処理方法およびプログラムについて説明する。本発明は、楽曲の再生に伴って、楽曲中の特定の打楽器による特定音を抽出することを特徴とする。そこで、特定の打楽器として「バスドラム」を例に挙げ、特定音として「バスドラム音」を抽出する場合について説明する。
[第1実施形態]
図1は、再生装置1の全体ブロック図である。再生装置1は、音声信号(オーディオ信号)を入力する音声入力部11と、音声信号に対して各種音声処理を行う音声処理部12と、音声処理後の音声信号を出力する音声出力部13と、ユーザーが各種操作を行う操作部14と、を備えている。なお、再生装置1としては、DJ機器(DJプレーヤー、DJミキサーなど)、オーディオ機器(CDプレーヤー、DVDプレーヤーなど)、携帯型オーディオプレーヤー、スマートフォン、録音機器、放送機器、などを採用可能である。また、請求項における「音声処理装置」は、音声処理部12および操作部14から成る。
音声入力部11は、再生装置1が光ディスクを再生する装置である場合、光ディスクドライブから出力された音声信号を入力する。また、USBメモリ等の記憶媒体から音声信号の読み出しが可能である場合、当該記憶媒体から音声信号を入力する。さらに、ネットワークを介して音声信号を入力しても良い。また、音声出力部13は、再生装置1がスピーカー内蔵の場合、アンプおよびスピーカーを指し、スピーカー内蔵ではない場合は、音声信号の出力インターフェースを指す。
音声処理部12は、A/Dコンバーター21、DSP22(Digital Signal Processor)およびD/Aコンバーター23を含む。但し、音声入力部11がデジタル信号を取得する場合、A/Dコンバーター21およびD/Aコンバーター23は不要である。
操作部14は、図2に示すように、ロータリー型操作子31,32,33と、スライドスイッチ36を含む。スライドスイッチ36は、ロータリー型操作子31,32,33を、「アイソレータ機能」として用いるか、「バスドラム音分離機能」として用いるかを切り替えるための操作子である。例えば、移動操作子36aを左側(「アイソレータ機能」側)に移動させた場合、ロータリー型操作子31,32,33は、アイソレータとして機能する。つまり、低域調整用つまみ31、中域調整用つまみ32および高域調整用つまみ33として機能する。
一方、移動操作子36aを右側(「バスドラム音分離機能」側)に移動させた場合、ロータリー型操作子31,32は、バスドラム音調整用つまみ31およびベース音調整用つまみ32として機能する。例えば、バスドラム音調整用つまみ31を左側に回転させると、その回転量に伴って、再生されている楽曲の中からバスドラム音だけを徐々に減衰させる。図示の状態では、減衰率0%であり、左側限界位置まで回転させると減衰率100%、すなわちバスドラム音が除去された状態となる。逆に、バスドラム音調整用つまみ31を右側に回転させると、バスドラムの音の数を徐々に増加させる(ディレイをかけて足していく)。同様に、ベース音調整用つまみ32を左側に回転させると、再生されている楽曲の中からベース音だけを徐々に減衰させ、右側に回転させると、ベースの音の数を徐々に増加させる。
なお、操作子の形態は、図2に示したものに限らず、例えばロータリー型操作子31,32,33に代えてフェーダー型操作子を用いても良い。また、スライドスイッチ36に代えて、トグルスイッチや押下ごとに機能が切り替わるボタン型スイッチを用いても良い。
次に、図3ないし図7を参照し、音声処理部12の詳細な機能について説明する。図3は、第1実施形態に係る音声処理部12の詳細ブロック図である。音声処理部12は、低域振幅検出部41、アタック判定部42、バスドラム音判定部43(発音区間判定部)、バスドラム音抽出部44(特定音抽出部)、ベース音抽出部45および加工処理部46を有している。なお、これら音声処理部12内の各部は、DSP22(図1参照)を主要部とする。
低域振幅検出部41は、入力された音声信号の低域振幅レベルを検出する。つまり、図4(a)に示すように、時間軸に対する振幅値の変化を示す波形を検出する。なお、本実施形態の場合、バスドラム音の抽出を目的としているため、「低域」とは、数百Hz以下を指す。
アタック判定部42は、入力された音声信号から、バスドラム音のアタック位置を判定する。バスドラム音判定部43は、バスドラムによる低域ピーク区間(発音区間)を判定する。バスドラム音抽出部44は、時変フィルタ50を用いて、入力された音声信号からバスドラム音を抽出する。時変フィルタ50は、バスドラムのスペクトル時間変化に対応したフィルタである(図7参照)。なお、以下の説明では、アタック判定部42の判定結果と時変フィルタ50を用いてバスドラム音を抽出する制御を「アタック音制御」、バスドラム音判定部43の判定結果と時変フィルタ50を用いてバスドラム音を抽出する制御を「低域レベル制御」と称する。
ベース音抽出部45は、抽出されたバスドラム音と、ハイパスフィルタを用いて、入力された音声信号からベース音を抽出する(図8(b)参照)。加工処理部46は、抽出されたバスドラム音および/またはベース音に対し、各種加工処理(エフェクト処理を含む)を行う。例えば、操作部14(バスドラム音調整用つまみ31,ベース音調整用つまみ32)の操作にしたがって、音の減衰やエフェクト付与を行う。
図4は、アタック判定部42の詳細ブロック図である。アタック判定部42は、振幅値変化量算出部42a、判定レベル算出部42bおよび判定部42cを有している。振幅値変化量算出部42aは、バスドラム音の帯域(解析対象周波数帯域)における振幅値の変化量を算出する(図4(b)参照)。つまり、低域振幅値の立ち上がりを検出することで、バスドラム音と他のアタック音(例えば、スネア音やハイハット音)を識別している。
図5は、バスドラム音のアタック位置を検出するアタック検出処理を示すフローチャートである。振幅値変化量算出部42aは、同図に示すように、バスドラム音アタック検出フラグが「0」であるか否かを判別し(S11)、バスドラム音アタック検出フラグが「0」でない場合は(S11:No)、アタック検出処理を終了する。
また、バスドラム音アタック検出フラグが「0」である場合は(S11:Yes)、時刻Tにおける解析対象周波数帯域の振幅値がアタック判定用しきい値より大きいか否かを判別する(S12)。アタック判定用しきい値より大きい場合は(S12:Yes)、時刻Tにおける解析対象周波数帯域の振幅値が時刻(T−1)のときよりも大きいか否かを判別し(S13)、時刻(T−1)のときよりも大きい場合は(S13:Yes)、バスドラム音アタック検出フラグを「1」にする(S14)。
一方、S12において、時刻Tにおける解析対象周波数帯域の振幅値がアタック判定用しきい値よりも大きくない場合、並びにS13において、時刻Tにおける解析対象周波数帯域の振幅値が時刻(T−1)のときよりも大きくない場合は、バスドラム音アタック検出フラグを「0」にする(S15)。以上の処理により、バスドラム音アタック検出フラグが「1」の場合(S14)、アタック位置を検出したものと看做し、時変フィルタ50(時間変化型フィルタ52,図7参照)を適用する。なお、時変フィルタ50を用いたバスドラム音の抽出処理を終えると、バスドラム音アタック検出フラグを「0」にする。
図4の説明に戻る。判定レベル算出部42bは、再生中の楽曲の低域振幅レベル(低域の音量)に応じて、判定レベルを算出する。低域振幅レベルが高い場合、低い場合と比較して、判定レベルは高くなる。判定部42cは、振幅値変化量算出部42aにより算出された振幅値の変化量と、判定レベル算出部42bにより算出された判定レベルに基づいて、バスドラム音のアタック位置を判定する。具体的には、図4(c)に示すように、振幅値の立ち上がり部分の判定レベルを超えた位置をアタック位置として判定する。
図6は、バスドラム音判定部43の詳細ブロック図である。バスドラム音判定部43は、ベース音量検出部43aおよび判定部43bを有している。ベース音量検出部43aは、楽曲に含まれるベース音量(図6(a)の領域E1)を、移動平均値を用いて検出する。なお、移動平均値に代えて、ローパスフィルタを用いても良い。ベース音量は、図6(a)の点線で示す判定しきい値を算出するために検出される。判定しきい値は、検出されたベース音量の大きさに応じて高くなる。つまり、ベース音が存在する場合、存在しない場合よりも高くなる。
判定部43bは、低域振幅検出部41により検出された振幅値が、ベース音量検出部43aにより検出されたベース音量に基づく判定しきい値を超え、且つアタック判定部42により判定されたバスドラム音のアタック位置を含む範囲を、低域ピーク区間として判定する。図6(b)に示す例の場合、2本の点線間に挟まれた2つの範囲が、低域ピーク区間である。このように、ベース音量が含まれる部分は、含まれない場合と比較して判定しきい値が高くなるため、結果的に低域ピーク区間が短くなる。これにより、判定部43bは、楽曲中にベース音とバスドラム音の両方が含まれる場合でも、バスドラム音の発音区間だけを正確に判定することができる。
図7は、時変フィルタ50の一例を示す図である。時変フィルタ50は、バスドラムの発音区間中、特性が変化していくフィルタであり、低域レベル制御の処理範囲となる適応型フィルタ51と、アタック音制御の処理範囲となる時間変化型フィルタ52と、を組み合わせたものである。つまり、バスドラム音判定部43で判定した低域ピーク区間(図6(b)参照)に対して適応型フィルタ51を適用し、アタック判定部42で判定したアタック位置に対して時間変化型フィルタ52を適用する。
このうち、適応型フィルタ51は、低域振幅レベルの変化に連動して減衰率を可変する制御を行う。つまり、適応型フィルタ51は、入力された音声信号に応じて特性を変えるフィルタである。これに対し、時間変化型フィルタ52は、入力された音声信号に関わらずアタック位置から固定の特性変化をするフィルタである。また、時間変化型フィルタ52は、中域および高域に対応した第1の時間変化型フィルタ52aと、中低域に対応した第2の時間変化型フィルタ52bから成る。例えば、入力された音声信号からバスドラム音を除去したい場合、第1の時間変化型フィルタ52aではマイナス10dBし、第2の時間変化型フィルタ52bではマイナス15dBする、といった使い分けを行う。なお、時間変化型フィルタ52についても、適応型フィルタ51と同様に、振幅レベルの変化に連動して減衰率を可変する制御を行っても良い。
次に、図8を参照し、バスドラム音除去処理およびベース音除去処理について説明する。図8(a)は、バスドラム音除去処理を示す工程図である。音声処理部12は、入力された音声信号に対して高速フーリエ変換を行うことで解析用の複素データを生成し(S21)、当該複素データを用いて解析を行う(S22)。解析後、時変フィルタ50によるフィルタリングを行い(S23)、逆高速フーリエ変換を行って時間波形に変換する(S24)。以上、S21〜S24によりバスドラム音抽出処理が行われる。
その後、反転処理を行うことで(S25)、バスドラム音が除去される。一方、バスドラム音抽出処理と並行し、入力された音声信号に対してディレイ処理を行う(S26)。当該ディレイ処理は、バスドラム音抽出処理による処理遅延を補うための処理である。また、ディレイ処理後の音声信号と、S25による反転処理後の信号との合成処理を行うことで(S27)、入力された音声信号からバスドラム音のみを除去した音声信号を出力する。
なお、S22の解析は、図3のブロック図における低域振幅検出部41、アタック判定部42およびバスドラム音判定部43に相当する。また、S23のフィルタリングは、バスドラム音抽出部44に相当する。さらに、S25の反転処理は、加工処理部46に相当する。
図8(b)は、ベース音除去処理を示す工程図である。音声処理部12は、入力された音声信号に対して、図8(a)に示したバスドラム音抽出処理(S21〜S24)と同様の処理を行う(S31〜S34)。一方、バスドラム音抽出処理と並行し、入力された音声信号に対してディレイ処理を行い(S35)、さらにハイパスフィルタによるフィルタリングを行う(S36)。その後、バスドラム音(バスドラム音抽出処理後の音声信号)と、フィルタリングした音声信号の合成処理を行うことで(S37)、入力された音声信号からベース音のみを除去した音声信号を出力する。
なお、S36のハイパスフィルタによるフィルタリングは、図3のブロック図におけるベース音抽出部45の一部に相当する。つまり、ハイパスフィルタを通すことで低域が削れ、バスドラム音とベース音が除去された状態となるが、そこにバスドラム音抽出処理で抽出したバスドラム音を足し込むことにより、結果的にベース音だけを除去できる。
以上説明したとおり、第1実施形態によれば、時変フィルタ50を用いた単純なフィルタリング処理により、既成楽曲からリアルタイムにバスドラム音を抽出することができる。これにより、事前解析情報を必要とすることなく、バスドラム音のみの制御および加工処理を実現できる。また、バスドラム音抽出処理とハイパスフィルタの組み合わせにより、既成楽曲からリアルタイムにベース音を抽出することができる。つまり、バスドラム音抽出処理の応用により、ベース音のみの制御および加工処理も実現できる。
また、バスドラム音判定部43で判定した定域ピーク区間に対して適応型フィルタ51を適用し、アタック判定部42で判定したアタック位置に対して時間変化型フィルタ52を適用するため(2種類のフィルタの組み合わせた時変フィルタ50を用いるため)、より正確にバスドラム音を抽出することができる。
また、高速フーリエ変換により生成された複素データを用いて、音声信号の低域振幅レベルを検出するため、より正確にアタック位置や低域ピーク区間を判定でき、ひいてはより正確にバスドラム音を抽出することができる。
[第2実施形態]
次に、図9および図10を参照し、本発明の第2実施形態について説明する。本実施形態は、ローパスフィルタ60を用いて、音声信号の低域振幅レベルを検出することを特徴とする。以下、第1実施形態と異なる点のみ説明する。なお、本実施形態において、第1実施形態と同様の構成部分については同様の符号を付し、詳細な説明を省略する。また、第1実施形態と同様の構成、部分について適用される変形例は、本実施形態についても同様に適用される。
図9は、第2実施形態に係る音声処理部12の詳細ブロック図である。本実施形態の音声処理部12は、第1実施形態(図3参照)と比較して、アタック判定部42を省略した構成となっている。したがって、第2実施形態のバスドラム音抽出部44で用いるフィルタは、第1実施形態(図7参照)の時変フィルタ50から時間変化型フィルタ52を省略した適応型フィルタ51である。また、低域振幅検出部41´は、ローパスフィルタ60を用いて、音声信号の低域振幅レベルを検出する。
図10は、第2実施形態に係るバスドラム音除去処理およびベース音除去処理を示す工程図である。図10(a)は、バスドラム音除去処理を示す工程図である。音声処理部12は、入力された音声信号に対し、ローパスフィルタ60(例えば、Fc=200Hz)によるフィルタリングを行うことで、低域振幅レベルを検出し(S41)、その後、解析およびレベル制御を行う(S42,S43)。以上、S42,S43によりバスドラム音除去処理が行われる。
一方、バスドラム音除去処理と並行し、入力された音声信号に対してハイパスフィルタ(例えば、Fc=200Hz)によるフィルタリングを行い、フィルタリング後の音声信号と、バスドラム音除去処理後の音声信号との合成処理を行うことで(S45)、入力された音声信号からバスドラム音のみを除去した音声信号を出力する。
なお、S41のローパスフィルタ60によるフィルタリングは、図9のブロック図における低域振幅検出部41´の一部に相当する。また、S42の解析は、低域振幅検出部41´およびバスドラム音判定部43に相当する。また、S43のレベル制御は、バスドラム音抽出部44に相当する。
図10(b)は、ベース音除去処理を示す工程図である。音声処理部12は、入力された音声信号に対して、ローパスフィルタ60(例えば、Fc=200Hz)によるフィルタリングを行うことで、低域振幅レベルを検出し(S51)、その後、解析およびレベル制御を行う(S52,S53)。なお、S53のレベル制御は、図10(a)におけるレベル制御(S43)とは異なり、バスドラム音をプラスにする制御である。つまり、S52,S53によりバスドラム音抽出処理が行われる。
一方、バスドラム音抽出処理と並行し、入力された音声信号に対し、ハイパスフィルタ(例えば、Fc=400Hz)によるフィルタリングを行う(S54)。但し、S54のカットオフ周波数は、図10(a)のS44とは異なる。その後、抽出されたバスドラム音と、フィルタリングした音声信号の合成処理を行うことで(S55)、入力された音声信号からベース音のみを除去した音声信号が出力される。
なお、S54のハイパスフィルタによるフィルタリングは、図9のブロック図におけるベース音抽出部45の一部に相当する。つまり、図10(b)のベース音除去処理では、ローパスフィルタ60とS54のハイパスフィルタにより帯域を分け、ローパスフィルタ60のレベル制御をバスドラム音抽出処理にて行っている。このため、ローパスフィルタ60の出力を常に「0」にすることで、ベース音とバスドラム音の低音部の両方が除去された状態となるが、そこにバスドラム音抽出処理で抽出したバスドラム音があるところだけ音を出すことで、結果的にベース音を除去できる。
以上説明したとおり、第2実施形態によれば、ローパスフィルタ60を用いることで、より簡易な処理で低域振幅レベルを検出することができる。これにより処理遅延が少なくなり、楽曲を再生しながら特定音を抽出する場合のリアルタイム性を向上できる。
以上、2つの実施形態を示したが、各実施形態において以下の変形例を採用可能である。例えば、上記の実施形態では、特定の打楽器として「バスドラム」を例示したが、その他、「スネア」、「ティンパニ」、「カスタネット」、「シンバル」など、種々の打楽器による特定音の抽出に本発明を適用可能である。但し、打楽器の種類によって、音の成分が集中する帯域が異なるため、抽出したい打楽器に応じて、振幅を検出する帯域を使い分ける必要がある。
また、上記の実施形態において、アタック判定部42は、低域振幅値の立ち上がりを検出することで、バスドラムのアタック音と他のアタック音とを識別したが(図5参照)、解析対象の周波数ビンについて、それぞれ振幅値が増加した場合はその差分を積み立てし、減少した場合はクリアにする処理を行い、当該処理後のデータ同士を乗算することで、各周波数ビンが揃って立ち上がる場所のみ、低域振幅値の立ち上がりを検出したものと看做しても良い。この構成によれば、より精度良くバスドラムのアタック位置を判定することができる。
また、上記の実施形態では、バスドラム音調整用つまみ31を右側に回転させると、バスドラム音にディレイをかけて、バスドラム音の数を徐々に増加させるものとしたが(図2参照)、他のエフェクトを付与しても良い。例えば、DJエフェクトとして一般的に用いられる各種エフェクト(リバーブ、エコー、オートパンなど)のパラメーター(加工処理量)を調整可能としても良い。ベース音調整用つまみ32についても同様である。
また、上記の実施形態では、バスドラム音調整用つまみ31を左側に回転させると、バスドラム音を徐々に減衰させるものとしたが、逆に右側に回転させると、バスドラム音を徐々に増幅(強調)させても良い。また、加工処理として、音を反転させても良い。さらに、ロータリー型操作子31,32,33に割り当てる加工処理の種類や、ロータリー型操作子31,32,33の回転量に対する加工処理量の割合など、ユーザーが任意に設定可能としても良い。
また、上記の各実施形態に示した再生装置1における各部および各機能をプログラムとして提供することが可能である。また、そのプログラムを各種記録媒体(CD−ROM、フラッシュメモリ等)に格納して提供することも可能である。すなわち、コンピューターを、再生装置1の各部として機能させるためのプログラム、およびそれを記録した記録媒体も、本発明の権利範囲に含まれるものである。
また、上記の実施形態では、本発明の音声処理装置(音声処理部12)を再生装置1に適用した場合を例示したが、ネットワーク上のサーバーで本発明の音声処理装置を実現しても良い。この場合、サーバーと、当該サーバーとネットワークを介して接続されたユーザー端末と、によって、本発明を実現するための通信システムが構築され、サーバーが、上記の実施形態における音声処理部12を実現し、ユーザー端末が、操作部14を実現する。また、クラウドコンピューティングにも、本発明を適用可能である。つまり、サーバー上のアプリケーションを利用した仮想端末により、本発明の再生装置1または音声処理部12を実現しても良い。
また、PCアプリケーションやスマートフォンアプリケーションで本発明の音声処理装置を実現しても良い。この場合、当該PCアプリケーションをインストールしたコンピューター、またはスマートフォンアプリケーションをインストールしたスマートフォンだけで再生装置1を実現可能である。その他、再生装置1の装置構成や処理工程など、本発明の要旨を逸脱しない範囲で適宜変更が可能である。
1…再生装置 11…音声入力部 12…音声処理部 13…音声出力部 14…操作部 31…ロータリー型操作子 36…スライドスイッチ 36a…移動操作子 41…低域振幅検出部 42…アタック判定部 43…バスドラム音判定部 44…バスドラム音抽出部 45…ベース音抽出部 46…加工処理部 50…時変フィルタ 51…適応型フィルタ 52…時間変化型フィルタ 52a…第1の時間変化型フィルタ 52b…第2の時間変化型フィルタ 60…ローパスフィルタ
【0002】
、アイソレータを用いた方法では、リアルタイムに音を制御することができるものの、楽器別の制御ができない。
[0006]
本発明は、上記の問題点に鑑み、楽曲の再生に伴って、当該楽曲に含まれる特定の楽器音をリアルタイムに抽出可能な音声処理装置、再生装置、音声処理方法およびプログラムを提供することを目的とする。
課題を解決するための手段
[0007]
本発明の音声処理装置は、入力された音声信号から、特定の打楽器による特定音をリアルタイムに抽出する音声処理装置であって、特定の打楽器による発音区間を判定する発音区間判定部と、音声信号から、特定音のアタック位置を判定するアタック判定部と、音声信号の音量変化に連動して抽出率が異なる適応型フィルタと、音声信号の音量変化に関わらずアタック位置から固定の特性変化をする時間変化型フィルタとを組み合わせた時変フィルタを用いて、特定音を抽出する特定音抽出部と、を備え、特定音抽出部は、発音区間に対して適応型フィルタを適用し、アタック位置に対して時間変化型フィルタを適用することを特徴とする。
上記の音声処理装置において、特定の打楽器はバスドラムであり、発音区間判定部は、音声信号の低域振幅レベルが判定しきい値を超え、且つアタック判定部により判定されたバスドラム音のアタック位置を含む範囲を、発音区間として判定し、判定しきい値は、音声信号のベース音量の大きさに応じて高くなるように設定されることを特徴とする。
上記の音声処理装置において、時間変化型フィルタは、中域および高域に対応した第1の時間変化型フィルタと、中低域に対応し、第1の時間変化型フィルタよりも適応区間が長い第2の時間変化型フィルタと、から成ることを特徴とする。
上記の音声処理装置において、発音区間判定部は、アタック判定部の判定結果および音声信号のベース音量に基づいて、発音区間を判定することを特徴とする。
上記の音声処理装置において、高速フーリエ変換により生成された複素データを用いて、音声信号の低域振幅レベルを検出する低域振幅検出部をさらに備え、アタック判定部は低域振幅レベルに基づいてアタック位置を判定することを特徴とする。
上記の音声処理装置において、特定の打楽器はバスドラムであり、ローパスフィルタを用いて、音声信号の低域振幅レベルを検出する低域振幅検出部をさらに備え、発音区間判定部は、低域振幅レベルに基づいて、発音区間を判定することを特徴とする。
上記の音声処理装置において、特定音として抽出したバスドラム音と、ハイパスフィルタを用いて、ベース音を抽出するベース音抽出部をさらに備えたことを特徴とする。
上記の音声処理装置において、抽出したバスドラム音およびベース音の少なくとも一方に対し加工処理を行う加工処理部をさらに備えたことを特徴とする。
上記の音声処理装置において、加工処理部は、音の反転、音の増幅、音の減衰、エフェクト付与、のうち少なくとも2以上の加工処理を行うことを特徴とする。
上記の音声処理装置において、2以上の加工処理の中から、いずれかの加工処理を選択的に実行させるための操作部をさらに備えたことを特徴とする。
上記の音声処理装置において、操作部は、各加工処理について、加工処理量を調節可能であることを特徴とする。
本発明の再生装置は、上記に記載の音声処理装置における各部と、音声信号を入力する音声入力部と、音声処理装置による音声処理後の音声信号を出力する音声出力部と、を備えたことを特徴とする。
本発明の音声処理方法は、入力された音声信号から、特定の打楽器による特定音をリアルタイムに抽出する音声処理方法であって、特定の打楽器による発音区間を判定する発音区間判定工程と、音声信号から、特定音のアタック位置を判定するアタック判定工程と、音声信号の音量変化に連動して抽出率が異なる適応型フィルタと、音声信号の音量変化に関わらずアタック位置から固定の特性変化をする時間変化型フィルタとを組み合わせた時変フィルタを用いて、特定音を抽出する特定音抽出工程と、を実行し、特定音抽出工程では、発音区間に対して適応型フィルタを適用し、アタック位置に対して時間変化型フィルタを適用することを特徴とする。
本発明のプログラムは、コンピューターを、上記に記載の音声処理装置における各部として機能させるためのものであることを特徴とする。
なお、以下の構成としても良い。
本発明の音声処理装置は、入力された音声信号から、特定の打楽器による発音区間を判定する発音区間判定部と、発音区間に対し、音声信号の音量変化に連動して抽出率が異なる適応型フィルタを用いることで、特定の打楽器による特定音を抽出する特定音抽出部と、を備えたことを特徴とする。
[0008]
本発明の音声処理方法は、入力された音声信号から、特定の打楽器による発音区間を判定する発音区間判定工程と、発音区間に対し、音声信号の音量変化に連動して抽出率が異なる適応型フィルタを用いることで、特定の打楽器による特定音を抽出する特定音抽出工程と、を実行することを特徴とする。
[0009]
これらの構成によれば、特定の打楽器による発音区間を判定し、当該発音区間に対して適応型フィルタを用いるだけの簡易な処理で、特定の打楽器による特定音を抽出できる。これにより、楽曲データの事前解析を必要とすることなく、楽曲を再生しながら特定の楽器音を抽出できる。
なお、打楽器とは、バスドラム、スネア、ティンパニなどの膜鳴楽器だけでなく、カスタネットやシンバルなどの体鳴楽器も含む概念である。
[0010]
上記の音声処理装置において、音声信号から、特定音のアタック位置を判定するアタック判定部をさらに備え、特定音抽出部は、アタック位置に対し、時間変化型フィルタを用いることで、特定の打楽器による特定音を抽出することを特徴とする。
[0011]
この構成によれば、アタック位置に対して時間変化型フィルタを用いるだけの簡易な処理で、特定の打楽器による特定音を抽出できる。また、適応型フィルタを用いた処理と組み合わせることで、より正確に特定音を抽出でき

Claims (14)

  1. 入力された音声信号から、特定の打楽器による発音区間を判定する発音区間判定部と、
    前記発音区間に対し、前記音声信号の音量変化に連動して抽出率が異なる適応型フィルタを用いることで、前記特定の打楽器による特定音を抽出する特定音抽出部と、を備えたことを特徴とする音声処理装置。
  2. 前記音声信号から、前記特定音のアタック位置を判定するアタック判定部をさらに備え、
    前記特定音抽出部は、前記アタック位置に対し、時間変化型フィルタを用いることで、前記特定の打楽器による特定音を抽出することを特徴とする請求項1に記載の音声処理装置。
  3. 前記特定の打楽器はバスドラムであり、
    前記音声信号の低域振幅レベルを検出する低域振幅検出部をさらに備え、
    前記アタック判定部は、前記低域振幅レベルに基づいて前記アタック位置を判定することを特徴とする請求項2に記載の音声処理装置。
  4. 前記発音区間判定部は、前記アタック判定部の判定結果および前記音声信号のベース音量に基づいて、前記発音区間を判定することを特徴とする請求項3に記載の音声処理装置。
  5. 前記低域振幅検出部は、高速フーリエ変換により生成された複素データを用いて、前記音声信号の低域振幅レベルを検出することを特徴とする請求項3に記載の音声処理装置。
  6. 前記特定の打楽器はバスドラムであり、
    ローパスフィルタを用いて、前記音声信号の低域振幅レベルを検出する低域振幅検出部をさらに備え、
    前記発音区間判定部は、前記低域振幅レベルに基づいて、前記発音区間を判定することを特徴とする請求項1に記載の音声処理装置。
  7. 前記特定音として抽出したバスドラム音と、ハイパスフィルタを用いて、ベース音を抽出するベース音抽出部をさらに備えたことを特徴とする請求項3または6に記載の音声処理装置。
  8. 抽出した前記バスドラム音および前記ベース音の少なくとも一方に対し加工処理を行う加工処理部をさらに備えたことを特徴とする請求項7に記載の音声処理装置。
  9. 前記加工処理部は、音の反転、音の増幅、音の減衰、エフェクト付与、のうち少なくとも2以上の加工処理を行うことを特徴とする請求項8に記載の音声処理装置。
  10. 前記2以上の加工処理の中から、いずれかの加工処理を選択的に実行させるための操作部をさらに備えたことを特徴とする請求項9に記載の音声処理装置。
  11. 前記操作部は、各加工処理について、加工処理量を調節可能であることを特徴とする請求項10に記載の音声処理装置。
  12. 請求項1ないし11のいずれか1項に記載の音声処理装置における各部と、
    前記音声信号を入力する音声入力部と、
    前記音声処理装置による音声処理後の音声信号を出力する音声出力部と、を備えたことを特徴とする再生装置。
  13. 入力された音声信号から、特定の打楽器による発音区間を判定する発音区間判定工程と、
    前記発音区間に対し、前記音声信号の音量変化に連動して抽出率が異なる適応型フィルタを用いることで、前記特定の打楽器による特定音を抽出する特定音抽出工程と、を実行することを特徴とする音声処理方法。
  14. コンピューターを、請求項1ないし11のいずれか1項に記載の音声処理装置における各部として機能させるためのプログラム。
JP2013533349A 2011-09-16 2011-09-16 音声処理装置、再生装置、音声処理方法およびプログラム Active JP5617042B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/005237 WO2013038459A1 (ja) 2011-09-16 2011-09-16 音声処理装置、再生装置、音声処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP5617042B2 JP5617042B2 (ja) 2014-10-29
JPWO2013038459A1 true JPWO2013038459A1 (ja) 2015-03-23

Family

ID=47882731

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013533349A Active JP5617042B2 (ja) 2011-09-16 2011-09-16 音声処理装置、再生装置、音声処理方法およびプログラム

Country Status (3)

Country Link
US (1) US9496839B2 (ja)
JP (1) JP5617042B2 (ja)
WO (1) WO2013038459A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3220386A1 (en) 2016-03-18 2017-09-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for harmonic-percussive-residual sound separation using a structure tensor on spectrograms
WO2019021405A1 (ja) * 2017-07-26 2019-01-31 ローランド株式会社 発音制御システム
WO2019043797A1 (ja) * 2017-08-29 2019-03-07 Pioneer DJ株式会社 楽曲解析装置および楽曲解析プログラム
US11978473B1 (en) * 2021-01-18 2024-05-07 Bace Technologies LLC Audio classification system
WO2023162894A1 (ja) * 2022-02-22 2023-08-31 フォスター電機株式会社 振動装置
CN117061584B (zh) * 2023-10-09 2024-02-09 广东保伦电子股份有限公司 一种基于双通道链路的音频传输方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS638698A (ja) * 1986-06-27 1988-01-14 松下電器産業株式会社 リズム表示装置
JP2000137485A (ja) * 1998-10-30 2000-05-16 Korg Inc 楽音信号のアタック位置検出装置
JP2002215161A (ja) * 2001-01-17 2002-07-31 Yamaha Corp 波形データ解析方法、波形データ解析装置および記録媒体
JP2008065039A (ja) * 2006-09-07 2008-03-21 Yamaha Corp オーディオ再生装置
WO2009110118A1 (ja) * 2008-03-05 2009-09-11 国立大学法人 東京大学 音信号の分離方法
JP2010054802A (ja) * 2008-08-28 2010-03-11 Univ Of Tokyo 音楽音響信号からの単位リズムパターン抽出法、該方法を用いた楽曲構造の推定法、及び、音楽音響信号中の打楽器パターンの置換法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1244093B1 (en) * 2001-03-22 2010-10-06 Panasonic Corporation Sound features extracting apparatus, sound data registering apparatus, sound data retrieving apparatus and methods and programs for implementing the same
GB2378626B (en) * 2001-04-28 2003-11-19 Hewlett Packard Co Automated compilation of music
ATE415010T1 (de) * 2006-11-17 2008-12-15 Akg Acoustics Gmbh Audiokompressor
CN101960516B (zh) * 2007-09-12 2014-07-02 杜比实验室特许公司 语音增强
WO2010005034A1 (ja) * 2008-07-11 2010-01-14 クラリオン株式会社 音響処理装置
JP5282548B2 (ja) 2008-12-05 2013-09-04 ソニー株式会社 情報処理装置、音素材の切り出し方法、及びプログラム
US8855334B1 (en) * 2009-05-21 2014-10-07 Funmobility, Inc. Mixed content for a communications device
JP5287546B2 (ja) * 2009-06-29 2013-09-11 富士通株式会社 情報処理装置およびプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS638698A (ja) * 1986-06-27 1988-01-14 松下電器産業株式会社 リズム表示装置
JP2000137485A (ja) * 1998-10-30 2000-05-16 Korg Inc 楽音信号のアタック位置検出装置
JP2002215161A (ja) * 2001-01-17 2002-07-31 Yamaha Corp 波形データ解析方法、波形データ解析装置および記録媒体
JP2008065039A (ja) * 2006-09-07 2008-03-21 Yamaha Corp オーディオ再生装置
WO2009110118A1 (ja) * 2008-03-05 2009-09-11 国立大学法人 東京大学 音信号の分離方法
JP2010054802A (ja) * 2008-08-28 2010-03-11 Univ Of Tokyo 音楽音響信号からの単位リズムパターン抽出法、該方法を用いた楽曲構造の推定法、及び、音楽音響信号中の打楽器パターンの置換法

Also Published As

Publication number Publication date
US9496839B2 (en) 2016-11-15
US20140341395A1 (en) 2014-11-20
JP5617042B2 (ja) 2014-10-29
WO2013038459A1 (ja) 2013-03-21

Similar Documents

Publication Publication Date Title
JP5617042B2 (ja) 音声処理装置、再生装置、音声処理方法およびプログラム
JP5898534B2 (ja) 音響信号処理装置および音響信号処理方法
KR100677622B1 (ko) 오디오 파일의 이퀄라이저 설정 방법 및 이를 이용한오디오 파일 재생 방법
US20110170710A1 (en) Method and apparatus for adjusting volume
TW201836369A (zh) 低音增強
JP6751810B2 (ja) 音声処理装置および音声処理方法
US9047876B2 (en) Audio device
JP6235198B2 (ja) 音声信号処理方法、音声信号処理装置およびプログラム
US9666196B2 (en) Recording apparatus with mastering function
WO2019050646A1 (en) TRANSIENT DETECTION FOR LOUDSPEAKER DISTORTION REDUCTION
WO2017135350A1 (ja) 記録媒体、音響処理装置および音響処理方法
JP5958378B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法およびプログラム
TW202133629A (zh) 用以藉由設備進行音訊呈現之方法
JP6089651B2 (ja) 音処理装置、音処理装置の制御方法、プログラム
US8195317B2 (en) Data reproduction apparatus and data reproduction method
JP5598722B2 (ja) 音声再生装置、音声再生装置における再生音調整方法
CN113348508A (zh) 电子设备、方法和计算机程序
JP6616099B2 (ja) 音声処理装置
JP4269892B2 (ja) オーディオデータ処理方法及び装置
JP6803494B2 (ja) 音声処理装置および音声処理方法
JP2004317622A (ja) 音響再生装置
JP2007181135A (ja) 特定楽器信号分離方法ならびに装置、およびこれらを備えた楽器スピーカシステムならびに音楽再生システム
JP2012216924A (ja) 信号処理装置及び信号処理方法
JP6314803B2 (ja) 信号処理装置、信号処理方法及びプログラム
JP5899865B2 (ja) 音響信号加工装置及びプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140902

R150 Certificate of patent or registration of utility model

Ref document number: 5617042

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250