JP6587742B2 - サウンド混合処理方法および装置、装置、並びに記憶媒体 - Google Patents

サウンド混合処理方法および装置、装置、並びに記憶媒体 Download PDF

Info

Publication number
JP6587742B2
JP6587742B2 JP2018515556A JP2018515556A JP6587742B2 JP 6587742 B2 JP6587742 B2 JP 6587742B2 JP 2018515556 A JP2018515556 A JP 2018515556A JP 2018515556 A JP2018515556 A JP 2018515556A JP 6587742 B2 JP6587742 B2 JP 6587742B2
Authority
JP
Japan
Prior art keywords
signal
mixed
channel
ymax
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018515556A
Other languages
English (en)
Other versions
JP2018533294A (ja
Inventor
ウエイフォン ジャオ
ウエイフォン ジャオ
Original Assignee
グァンジョウ クゥゴゥ コンピューター テクノロジー カンパニー リミテッド
グァンジョウ クゥゴゥ コンピューター テクノロジー カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グァンジョウ クゥゴゥ コンピューター テクノロジー カンパニー リミテッド, グァンジョウ クゥゴゥ コンピューター テクノロジー カンパニー リミテッド filed Critical グァンジョウ クゥゴゥ コンピューター テクノロジー カンパニー リミテッド
Publication of JP2018533294A publication Critical patent/JP2018533294A/ja
Application granted granted Critical
Publication of JP6587742B2 publication Critical patent/JP6587742B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/46Volume control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3089Control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/34Muting amplifier when no signal is present or when only weak signals are present, or caused by the presence of noise signals, e.g. squelch systems
    • H03G3/342Muting when some special characteristic of the signal is sensed which distinguishes it from noise, e.g. using speech detector
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/02Arrangements for generating broadcast information; Arrangements for generating broadcast-related information with a direct linking to broadcast information or to broadcast space-time; Arrangements for simultaneous generation of broadcast information and broadcast-related information
    • H04H60/04Studio equipment; Interconnection of studios
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本願は、2015年09月29日付で中華人民共和国国家知識産権局に提出された中国特許出願201510631912.3(発明の名称“サウンド混合処理方法および装置、装置、並びに記憶媒体”)に基づく優先権を主張しており、ここでこの出願に言及することで、この出願の全内容が本明細書に組み込まれているとみなされる。
本発明は、混合処理の分野、特にオーディオ混合処理方法、オーディオ混合処理装置、装置、および記憶媒体に関する。
カラオケシステムにおいてオーディオ混合処理のアルゴリズムは最も基本的な技術であるが、最も難しい技術でもある。現在、インターネットやオープンソースコードには、下記のオーディオ混合アルゴリズムが存在する。
すなわち一つのオーディオ混合アルゴリズムでは、信号を加え、平均化しているが、この技術には音量が低いという欠点がある一方で、オーバーフローが起きにくいという利点がある。しかし信号を増幅因数で直接乗算した場合には、オーバーフローが起きる。
別のオーディオ混合アルゴリズムでは、信号を直接加えているが、これには音量が十分に保持されるという利点があるが、オーバーフローした場合音割れが発生し、その結果周波数ひずみが生じ、音質の低下につながるという欠点がある。
別のオーディオ混合アルゴリズムでは、式Y=A+B-(A*B/(-(2pow(n-1)-1)))が用いられる。式中、AとBは混合すべき2つのチャンネルの信号、nはサンプル点の数、powは指数を表す。このアルゴリズムではオーバーフローは生じないが、中ピッチ(middle pitch)が弱くなる。さらにこのアルゴリズムでは、AとBを増幅因数で乗算するとオーバーフローする可能性があるため、このような用途にはこのアルゴリズムは適していない。
このように上記のアルゴリズムのいずれにも欠点があり、いずれも多チャンネルの信号を所定の比率で混合することはできない。
従来のオーディオ混合技術では比率に応じて多チャンネルの信号を混合することができないという問題と他の問題を解消するために、本発明は、実施形態に係るオーディオ混合処理方法、オーディオ混合処理装置、コンピュータ装置、および記憶媒体を提供する。
本発明の第1実施形態に係るオーディオ混合処理方法は、第1チャンネルの信号におけるフレーム内の信号sm(n)と、第2チャンネルの信号におけるフレーム内の信号vm(n)を抽出するステップを含み、信号vm(n)は信号sm(n)に対応しており、第2チャンネルの信号は第1チャンネルの信号と混合される必要があり、nはサンプル点の数を表しており、
信号sm(n)と信号vm(n)とを重み付けし、重み付けされた信号sm(n)とvm(n)とを加算して混合信号ym(n)を取得するステップと、
混合信号ym(n)の数列の最大値ymaxに基づいて可変減衰因子を計算し、可変減衰因子を用いて混合信号ym(n)を減衰させて、出力信号Zm(n)を形成するステップとを含んでいる。
本発明の第2実施形態に係るオーディオ混合処理装置は、第1チャンネルの信号におけるフレーム内の信号sm(n)と、第2チャンネルの信号におけるフレーム内の信号vm(n)とを抽出するように構成された抽出モジュールを備え、信号vm(n)は信号sm(n)に対応しており、第2チャンネルの信号は第1チャンネルの信号と混合される必要があり、nはサンプル点の数を表しており、
信号sm(n)と信号vm(n)とを重み付けし、重み付けされた信号sm(n)と信号vm(n)とを加算して混合信号ym(n)を取得するように構成された混合モジュールと、
混合信号ym(n)の数列の最大値ymaxに基づいて可変減衰因子を計算し、可変減衰因子を用いて混合信号ym(n)を減衰させて出力信号Zm(n)を形成するように構成された減衰処理モジュールとを備えている。
本発明の第3実施形態に係るコンピュータ装置は、プロセッサ、メモリ、バス、および通信インターフェースを備え、
メモリは、コンピュータで実行可能な指令を格納するように構成されており、
プロセッサとメモリは、バスを介して互いに接続されており、
プロセッサは、コンピュータ装置が作動すると、メモリに格納されたコンピュータで実行可能な指令を実行して、コンピュータ装置が、
第1チャンネルの信号におけるフレーム内の信号sm(n)と、第2チャンネルの信号におけるフレーム内の信号vm(n)を抽出するステップを実行し、
信号vm(n)は信号sm(n)に対応しており、第2チャンネルの信号は第1チャンネルの信号と混合される必要があり、nはサンプル点の数を表しており、
信号sm(n)と信号vm(n)とを重み付けし、重み付けされた信号sm(n)とvm(n)とを加算して混合信号ym(n)を取得するステップと、
混合信号ym(n)の数列の最大値ymaxに基づいて可変減衰因子を計算し、可変減衰因子を用いて混合信号ym(n)を減衰させて、出力信号Zm(n)を形成するステップとを実行するように構成されている。
本発明の第4実施形態に係る不揮発性記憶媒体は、コンピュータによって実行されると、コンピュータが、上記のオーディオ混合処理方法を実行するように構成されたコンピュータで読取可能な指示を格納している。
上記のように、本発明の幾つかの実現可能な実施形態によると、混合すべき各チャンネルの信号がフレーム単位で抽出され、重み付けされて加算され、その混合信号が可変減衰因子を用いて減衰される。したがって、このオーディオ混合によって以下の技術的効果が達成される。
本発明では、多チャンネルの信号を所定の比率に応じて混合することができる。例えば、これは、人間の声と伴奏の少なくとも一方の音量を2倍以上に増幅する必要がある場合に用いることができる。
本発明では、信号の重み付けと追加後に取得された混合信号が、減衰因子を用いて減衰される。これにより、取得された出力信号がオーバーフローするという問題を回避することができる。
また、本発明の実施形態に係る解決策を用いると、ほとんどバーノイズを含まない形で音質が良好に保たれる。
本発明の実施形態に係るオーディオ混合処理方法を示すフローチャート テスト結果を示す概略図 本発明のさらに別の実施形態に係るカラオケ処理方法を示す概略図 本発明の実施形態に係るオーディオ混合処理装置を示す概略構造図 本発明の実施形態に係るコンピュータ装置を示す概略構造図
本発明の実施形態に係る技術的解決策または従来技術をより明確に示すために、以上のように、本発明の実施形態と従来技術の説明のために使用される図面について簡単に説明する。以下で説明する図面は本発明の実施形態の一部にすぎず、当業者であれば、提供された図面に基づいて、創造性を発揮せずに他の図面を取得することが可能である。
当業者が本発明の解決策を十分に理解できるように、本発明の実施形態に係る技術的解決策について、本発明の実施形態を示す図面を参照して明確かつ十分な形で記載する。以下に記載する実施形態は、本発明の実施形態のすべてはなく一部にすぎない。ここで開示されている実施形態に基づいて、当業者が創造性を発揮せずに到達することができる他のすべての実施形態が本発明の保護の範囲に含まれる。
本発明の実施形態に係る技術的解決策は、カラオケシステムに適用される。ここでいうカラオケシステムは、カラオケテレビ(KTV)で使用されるカラオケシステム、ホームカラオケシステム(home karaoke system)、およびカラオケソフトウェアがインストールされたコンピュータ装置を含むが、これらに限定されない。ここでいうコンピュータ装置は、汎用コンピュータ、クライアントカスタマイズ機(client-customized machine)、または、携帯電話端末やタブレット機などの携帯機器であってもよい。一般的に、カラオケシステムは、オーディオシステムとマイクロホンをさらに含む。
以下、具体的な実施形態について詳細に説明する。
本発明は、第1実施形態に係るオーディオ混合処理方法を提供する。この処理方法によると、混合すべき各チャンネルの信号がフレーム単位で抽出され、重み付け(weight)されて加算され、その混合信号が可変減衰因子(variable attenuation factor)を用いて減衰され、減衰された混合信号が出力信号として使用される。
図1に示すように、本発明の実施形態に係るオーディオ混合処理方法は、ステップ110〜130を含んでいる。
ステップ110では、第1チャンネルの信号における一つのフレーム内の信号sm(n)が抽出され、第2チャンネルの信号における一つのフレーム内の信号vm(n)が抽出される。信号vm(n)は信号sm(n)に対応しており、第2チャンネルの信号は第1チャンネルの信号と混合される必要があり、nはサンプル点の数を表している。
本発明の実施形態をするために、2つのチャンネルの信号に対するオーディオ混合を例示したが、多数のチャンネルの信号に対するオーディオ混合は、常に2つのチャンネルの信号に対するオーディオ混合として簡素化が可能なため、本発明の技術的解決策において、信号を含むチャンネルの数は限定されない。
カラオケシステムが作動すると、具体的には、コンピュータ装置にインストールされたカラオケソフトウェアが作動すると、コンピュータ装置のプロセッサが、混合すべき2つのチャンネルの信号を取得する。本発明の実施形態において、s(n)は第1チャンネルの信号、v(n)は第2チャンネルの信号をそれぞれ表しており、nはサンプル点の数を表している。例えば、1秒といった単位時間に1024個のサンプル点が含まれてもよい。
本発明の実施形態では、2つのチャンネルの信号s(n)とv(n)は所定の比率で混合される。この比率がp/qである場合、信号s(n)はp倍に増幅され、信号v(n)はq倍に増幅される。qとpは0(ゼロ)より大きければいずれの値であってもよいが、一般的に、10より小さい値とする。
本発明の実施形態では、2つのチャンネルの信号s(n)とv(n)はフレーム単位で処理される。s(n)とv(n)における現在の信号フレームが混合された後、次の信号フレームが連続して混合される。フレームの長さは任意に設定することができる。例えば、フレームの信号の長さNを1024個のサンプル点からなるように設定することができる。s(n)におけるフレーム内の信号とv(n)におけるフレーム内の信号は、同じ長さであることが望ましい。
例えば、ある時点においてm番目のフレームの信号を混合する場合、第1チャンネルの信号s(n)におけるm番目のフレーム内の信号sm(n)と、第2チャンネルの信号v(n)におけるm番目のフレーム内の信号vm(n)が抽出される。信号vm(n)は信号sm(n)に対応しており、信号s(n)は信号v(n)と混合される必要があり、mは正の整数である。
ステップ120では、信号sm(n)と信号vm(n)とが重み付け(weight)され、2つの重み付けされた信号が加算されて混合信号ym(n)が取得される。
このステップでは、ym(n)=p*sm(n)+q*vm(n)の方程式で示すように、2つのフレームの信号sm(n)とvm(n)とが、重み係数p, qを用いてそれぞれ重み付けされ、2つの重み付けされた信号が加算される。上記方程式において、n=0,1,2、・・・N-1であり、Nは、2つのフレームの信号sm(n)及びvm(n)のフレームの長さである。
上記方程式において、ym(n)は、信号sm(n)とvm(n)とを重み付けして加算することで得られる混合信号である。ym(n)の長さは、1024といったNからなるsm(n)及びvm(n)の長さと同じである。
ステップ130では、混合信号ym(n)の数列(sequence)の最大値ymaxに基づいて可変減衰因子が計算され、可変減衰因子を用いて混合信号ym(n)が減衰され、出力信号Zm(n)が形成される。
混合信号ym(n)の最大値ymaxが大きい場合、混合信号がオーバーフローするリスクがある。したがって、出力信号としてym(n)を直接出力することは好ましくない。オーバーフローの問題に対処するために、本発明の実施形態では、混合信号ym(n)の数列の最大値ymaxに基づいて可変減衰因子detaが計算され、可変減衰因子detaを用いて混合信号ym(n)が減衰されることで、信号ym(n)が臨界値よりも低い値となり、また、スムーズにデータが変化する。可変減衰因子は可変であり、現在のフレームのym(n)の数列の最大値ymaxに基づいて計算される。したがって、異なるフレームの信号に対してオーディオ混合を行う場合、detaの値は異なる。
本発明の実施形態では、次のように、減衰因子が計算され、減衰処理が行われる。
まず、グローバル参考値f(global reference value f)が定義され、グローバル参考値fはその以前の値を保持することができる。初回、すなわち、s(n)における第1フレーム内の信号と、v(n)における第1フレーム内の信号が混合される際、fの値を1.0に設定することができる。他のフレームの信号が次のステップで処理される際、以下に説明するようにfは常に変化する。実施形態では、暫定参考値fnew (temporary reference value fnew)がさらに定義される。
ym(n)の減衰において、まず、最大値ymaxがymax=max(abs(ym))として取得される。absは絶対値の取得を表し、maxは最大値の取得を表している。また、nは0(ゼロ)からN−1までの整数値をとり、nが0(ゼロ)からN-1までの整数の1つと等しい時、ymが最大値となる。
次に、ymaxが所定値Maと比較され、比較結果に基づいて暫定参考値fnewが決定される。最大値ymaxが所定値Ma以下の場合、暫定参考値はfnew=1.0に設定される。最大値ymaxが所定値Maを超える場合、暫定参考値fnewはfnew=Ma/ymaxに設定される。この場合、fnewは1.0より僅かに小さい値であり、係数fnewとymaxの積は、Maを超えず、Maと完全に等しくなる。
一般的に、オーディオ信号は16バイト(ビット)で表され、その最大値は216−1、すなわち32767である。したがって、Maを、Ma=32767と設定することが好ましい。別の用途において、オーディオ信号をpバイトで表す場合、Maを、Ma=2p−1と設定することができ、pは8,16、24,32などとすることができる。
次に、deta=(f−fnew)/Nの方程式を用いて可変減衰因子が計算される。この方程式において、detaは可変減衰因子を表しており、Nはym(n)のフレームの長さであり、実施形態では一例として1024である。
次に、detaを用いてym(n)が減衰され、Zm(n)=(f-n*deta)*ym(n)の方程式を用いて出力信号Zm(n)が形成される。この方程式において、n=0,1,2,・・・N-1であり、Nは、信号sm(n)及びvm(n)のフレームの長さであり、Zm(n)のフレームの長さでもある。Zm(n)=(f-n*deta)*ym(n)の方程式から、信号ym(n)はオーバーフローしない臨界値内に制限され、データが比較的スムーズに変化していることがわかる。
例えば、最初にf=1.0であり、ymaxが所定値Ma以下の場合、オーディオ信号がオーバーフローしないことを意味する。この時、fnew=1.0、deta=0(ゼロ)となるため、Zm(n)=ym(n)となる。すなわち、オーディオ信号はオーバーフローしないため、ym(n)は、減衰されることなくそのまま出力信号として使用される。
最後に、グローバル参考値fが、次のフレームの信号処理のための暫定参考値fnewと等しくなるように更新される。例えば、第1フレームの信号を処理する際、fが初期値1.0と等しく、この時点でfnewが0.95と等しいと仮定する。次に、第1フレームの信号が処理された後、f=fnew=0.95に設定される。したがって、第2フレームの信号を処理する際、fの現在の値は0.95である。
本発明の実施形態では、各フレームの信号が、すべてのフレームの信号が処理されるまで上記の方法に基づいてオーディオ混合処理されることで、比率に応じたオーディオ混合が達成される。
テスト結果を示す概略図である図2を参照されたい。図2において、(a)は、従来のオーディオ技術を用いたオーディオ混合のテスト結果を示す概略図であり、(b)は、本発明の実施形態に係る方法を用いたオーディオ混合のテスト結果を示す概略図である。(a)には、人間の耳では識別が困難なバックグラウンドノイズであるバーインパルス(burr impulses)(図中の縦線参照)が明らかに存在する。一方、(b)にはバーノイズ(burr noise)がほとんど存在せず、非常にクリーンである。図2のアルゴリズムのテスト結果が示すように、本発明の実施形態の技術的解決策に係るオーディオ混合方法を用いると、最終的にほとんどバーノイズを含まない形で音質が良好に保たれる。
上記のように、本発明の幾つかの実現可能な実施形態に係るオーディオ混合処理方法では、混合すべき各チャンネルの信号がフレーム単位で抽出され、重み付けされて加算され、この混合信号が可変減衰因子を用いて減衰される。したがって、このオーディオ混合によって以下の技術的効果が達成される。
本発明では、多チャンネルの信号を所定の比率に応じて混合することができる。例えば、この方法は人間の声と伴奏の少なくとも一方の音量を2倍以上に増幅する必要がある場合に用いることができる。
また本発明では、信号の重み付けと加算後に取得された混合信号が、減衰因子を用いて減衰される。これにより、取得された出力信号がオーバーフローするという問題を回避することができる。
また、本発明の実施形態に係るオーディオ混合の解決策を用いると、ほとんどバーノイズを含まない形で音質が良好に保たれる。
本発明の実施形態に係る技術的解決策を十分に理解できるように、以下、具体的な場面における実施形態を参照して説明する。
s(n)とv(n)とをp/qの比率で混合することを想定する。p及びqは0(ゼロ)より大きく、Mより小さい。Mは、0(ゼロ)より大きければよいが、M=10が好ましい。
混合処理は、以下のステップを含んでいる。
まず、以前の値を保持するパラメータfが設定され、混合処理を開始する際、1.0となるように初期設定される(パラメータfは、以後のフレームでは再度初期設定されず、以前の値を保持する)。
ステップS1では、第1フレームの信号sm(n)とvm(n)とがs(n)とv(n)とからそれぞれ抽出される。フレームの長さは任意に設定できるが、N=1024のサンプル点となるように設定することが好ましい。
ステップS2では、Nの長さを有するym(n)=p*sm(n)+q*vm(n)が形成される。
ステップS3では、ym(n)の数列の最大値ymax=max(ym)が取得される。
ステップS4では、ymaxが≦32767の場合、fnew=1.0に設定される。
ステップS5では、ymax>32767の場合、fnew=32767/ymaxに設定される。
ステップS6では、deta=(f−fnew)/Nが計算される。
ステップS7では、Zm(n)=(f-n*deta)*ym(n)が取得される。式中nは、0(ゼロ)からN-1までの値をとる。
ステップS8では、f=fnewが設定される。
ステップS9では、zmが、処理されたフレームのデータとして出力される。
ステップS10では、fの値が次のフレームのために保持される。
第2フレーム、第3フレーム、第4フレーム・・・・が順に処理され、すべてのフレームが処理される。
最終的に、比率に応じたオーディオ混合が完了する。
本発明の実施形態に係る上記の技術的解決策を十分に理解できるように、上記の技術的解決策を実施するための装置をさらに説明する。
図3に示すように、本発明は、抽出モジュール310、混合モジュール320、および減衰処理モジュール330を備えた第2実施形態に係るオーディオ混合処理装置を提供する。
抽出モジュール310は、第1チャンネルの信号におけるフレーム内の信号sm(n)と、第2チャンネルの信号におけるフレーム内の信号vm(n)とを抽出するように構成されている。信号vm(n)は信号sm(n)に対応しており、第2チャンネルの信号は第1チャンネルの信号と混合される必要があり、nはサンプル点の数を表している。
混合モジュール320は、信号sm(n)と信号vm(n)とを重み付けし、重み付けされた信号sm(n)と信号vm(n)とを加算して混合信号ym(n)を取得するように構成されている。
減衰処理モジュール330は、混合信号ym(n)の数列の最大値ymaxに基づいて可変減衰因子を計算し、可変減衰因子を用いて混合信号ym(n)を減衰させ出力信号Zm(n)を形成するように構成されている。
図4に示すように、本発明の幾つかの実施形態では、減衰処理モジュール330は、取得ユニット3301、割当てユニット3302、および計算ユニット3303を備えている。
取得ユニット3301は、ym(n)の数列の最大値ymaxと、現在のグローバル参考値fを取得するように構成されている。ymax=max(abs(ym))であり、absは絶対値の取得を表し、maxは最大値の取得を表している。
割当てユニット3302は、最大値ymaxが所定値Ma以下の場合、暫定参考値をfnew=1.0に設定し、最大値ymaxが所定値Maを超える場合、暫定参考値をfnew=Ma/ymaxに設定するように構成されている。
計算ユニット3303は、所定の可変減衰因子detaをdeta=(f−fnew)/Nとして計算するように構成されている。
また、減衰処理モジュール330は、減衰処理ユニット3304をさらに備えていてもよい。
減衰処理ユニット3304は、可変減衰因子detaを用いて混合信号ym(n)を減衰させて、Zm(n)=(f-n*deta)*ym(n)を用いて信号Zm(n)を取得するように構成されている。この方程式において、n=0,1,2、・・・N-1であり、Nは、信号sm(n)及びvm(n)のフレームの長さであり、減衰後に取得された信号Zm(n)は出力信号として使用される。
また、減衰処理モジュール330は、更新ユニット3305をさらに備えていてもよい。
更新ユニット3305は、次のフレームの処理のために、グローバル参考値fを、暫定参考値fnewと等しくなるように更新するように構成されている。
グローバル参考値fの初期値を1.0と設定し、所定値Maを32767と等しくなるように設定してもよい。
本発明の実施形態に係るオーディオ混合処理装置の各機能モジュールの機能は、上記の方法の実施形態で説明した方法に基づいて具体的に実施可能である。各モジュールの機能実施の詳細については、上記の方法の実施形態の関連個所を参照することができるため、ここでは繰り返して説明しない。
上記のように、本発明の幾つかの実現可能な実施形態に係るオーディオ混合処理装置は、上記方法に基づいて、混合予定の各チャンネルの信号をフレーム単位で抽出した上で、重み付けして加算し、可変減衰因子を用いて混合信号を減衰させる。したがって、以下の技術的効果と共にオーディオ混合が達成される。
本発明では、多チャンネルの信号を比率に応じて混合することができる。例えばこの装置は、人間の声と伴奏の少なくとも一方の音量を2倍以上に増幅する場合に用いることができる。
本発明では、信号の重み付けと加算後に取得された混合信号が、減衰因子を用いて減衰される。これにより、取得された出力信号がオーバーフローするという問題を回避することができる。
また、本発明の実施形態に係るオーディオ混合の解決策を用いると、ほとんどバーノイズを含まない形で音質が良好に保たれる。
図5に示すように、本発明は、プロセッサ501、メモリ502、バス503、および通信インターフェース504を備えた第3実施形態に係るコンピュータ装置500をさらに提供する。
メモリ502は、コンピュータで実行可能な指令を格納するように構成されている。プロセッサ501とメモリ502は、バス503を介して互いに接続されている。プロセッサ501は、コンピュータ装置500が作動すると、メモリ502に格納されたコンピュータで実行可能な指令を実行して、コンピュータ装置500が以下のステップを実行するように構成されている。
一つのステップでは、第1チャンネルの信号におけるフレーム内の信号sm(n)と、第2チャンネルの信号におけるフレーム内の信号vm(n)とが抽出される。信号vm(n)は信号sm(n)に対応しており、第2チャンネルの信号は第1チャンネルの信号と混合される必要があり、nはサンプル点の数を表している。
別のステップでは、信号sm(n)と信号vm(n)とが重み付けされ、重み付けされた信号sm(n)とvm(n)とが加算されて混合信号ym(n)が取得される。
さらに別のステップでは、混合信号ym(n)の数列の最大値ymaxに基づいて可変減衰因子が計算され、可変減衰因子を用いて混合信号ym(n)が減衰され、出力信号Zm(n)が形成される。
本発明の幾つかの実施形態では、プロセッサ501によって、混合信号ym(n)の数列の最大値ymaxに基づいて可変減衰因子を計算するステップは、混合信号ym(n)の数列の最大値ymaxを取得するステップを含んでおり、ymax=max(abs(ym))であり、absは絶対値の取得を表し、maxは最大値の取得を表しており、現在のグローバル参考値fを取得するステップと、最大値ymaxが所定値Ma以下の場合、暫定参考値をfnew=1.0に設定し、最大値ymaxが所定値Maを超える場合、暫定参考値をfnew=Ma/ymaxに設定するステップとを含んでいる。
本発明の幾つかの実施形態では、プロセッサ501によって、可変減衰因子を用いて混合信号ym(n)を減衰させて、出力信号Zm(n)を形成するステップは、可変減衰因子detaを用いて混合信号ym(n)を減衰させて、Zm(n)=(f-n*deta)*ym(n)として信号Zm(n)を取得するステップを含んでおり、この方程式において、n=0,1,2,・・・N-1であり、Nは、信号sm(n)及びvm(n)のフレームの長さであり、減衰後に取得された信号Zm(n)は出力信号として使用される。
本発明の幾つかの実施形態では、プロセッサ501は、次のフレームの処理のために、グローバル参考値fを、暫定参考値fnewと等しくなるように更新するステップをさらに含んでもよい。
本発明の幾つかの実施形態では、グローバル参考値fの初期値は1.0であり、所定値Maは32767と等しい。
上記のように、本発明の幾つかの実現可能な実施形態に係るオーディオ混合処理装置は、上記方法に基づいて、混合予定の各チャンネルの信号をフレーム単位で抽出した上で、重み付けして加算し、可変減衰因子を用いて混合信号を減衰させる。したがって、このオーディオ混合によって以下の技術的効果が達成される。
本発明では、多チャンネルの信号を所定の比率に応じて混合することができる。例えばこれは、人間の声と伴奏の少なくとも一方の音量を2倍以上に増幅する場合に用いることができる。
本発明では、信号の重み付けと追加後に取得された混合信号が、減衰因子を用いて減衰される。これにより、取得された出力信号がオーバーフローするという問題を回避することができる。
また、本発明の実施形態に係るオーディオ混合の解決策を用いると、ほとんどバーノイズを含まない形で音質が良好に保たれる。
本発明は、第4実施形態に係るコンピュータ記憶媒体をさらに提供する。このコンピュータ記憶媒体はプログラムを格納しており、プログラムが実行されると、上記の方法の実施形態で説明したすべてまたは幾つかのステップが実行される。
上記の各実施形態の説明では、その実施例の重要な点を主に記載している。ある実施形態で詳細に説明されていない部分については、他の実施形態における関連する説明を参照されたい。
説明を簡略化するために、上記の方法の実施形態はそれぞれ、一連の作業を組み合わせたものとして説明されているが、本発明は、上で説明した作業の順番に限定されない。本発明によると、複数のステップのうち、幾つかのステップを、別の順番でまたは同時に実行してもよい。また、本明細書中の実施形態はすべて好ましい実施形態であり、実施形態に含まれる作業やモジュールのすべてが必須ではない。
上記の実施形態に係る種々の方法のすべてまたは幾つかのステップは、関連するハードウエアに指令するプログラムによって実行可能であり、プログラムは、コンピュータで読取可能な記憶媒体に格納可能である。記憶媒体として、ROM、RAM、磁気ディスク、光ディスクなどの媒体を挙げることができる。
上記のように、本発明の実施形態に係るオーディオ混合処理方法、オーディオ混合処理装置、およびコンピュータ装置について詳細に説明した。また、本発明の原理および実施については、具体的な実施形態を挙げて説明した。上記の実施形態を示す図面は、本発明の方法と重要な概念の理解を助けることだけを意図している。当業者は、本発明の概念に基づいて、特定の実施形態と適用範囲において変更を加えてもよい。要約すると、本発明の内容は、本発明を限定するものとして理解されるべきではない。

Claims (12)

  1. 第1チャンネルの信号におけるフレーム内の信号sm(n)と、第2チャンネルの信号におけるフレーム内の信号vm(n)とを抽出するステップを含み、
    前記信号vm(n)は前記信号sm(n)に対応しており、前記第2チャンネルの信号は前記第1チャンネルの信号と混合される必要があり、nはサンプル点の数を表しており、
    前記信号sm(n)と前記信号vm(n)とを重み付けし、重み付けされた信号sm(n)とvm(n)とを加算して混合信号ym(n)を取得するステップと、
    前記混合信号ym(n)の数列の最大値ymaxに基づいて可変減衰因子を計算し、前記可変減衰因子を用いて前記混合信号ym(n)を減衰させて、出力信号Zm(n)を形成するステップとを含むオーディオ混合処理方法。
  2. 前記混合信号ym(n)の数列の最大値ymaxに基づいて可変減衰因子を計算する前記ステップは、
    前記ym(n)の数列の最大値ymaxと、現在のグローバル参考値fを取得するステップを含み、ymax=max(abs(ym))であり、absは絶対値の取得を表し、maxは最大値の取得を表しており、
    前記最大値ymaxが所定値Ma以下の場合、暫定参考値fnewをfnew=1.0に設定し、前記最大値ymaxが前記所定値Maを超える場合、前記暫定参考値をfnew=Ma/ymaxに設定するステップと、
    Nを前記信号sm(n)とvm(n)のフレームの長さとし、可変減衰因子detaをdeta=(f-fnew)/Nとして計算するステップとを含む請求項1に記載の方法。
  3. 前記可変減衰因子を用いて前記混合信号ym(n)を減衰させて、出力信号Zm(n)を形成する前記ステップは、前記可変減衰因子detaを用いて混合信号ym(n)を減衰して、Zm(n)=(f-n*deta)*ym(n)として信号Zm(n)を取得するステップを含み、n=0,1,2,・・・N-1であり、Nは、前記信号sm(n)とvm(n)のフレームの長さであり、減衰後に取得された前記信号Zm(n)は出力信号として使用される請求項2に記載の方法。
  4. 次のフレームの処理のための前記暫定参考値fnewと等しくなるように前記グローバル参考値fを更新するステップをさらに含む請求項3に記載の方法。
  5. 前記グローバル参考値fの初期値は1.0であり、前記所定値Maは32767と等しい請求項2から4のいずれか1つに記載の方法。
  6. 第1チャンネルの信号におけるフレーム内の信号sm(n)と、第2チャンネルの信号におけるフレーム内の信号vm(n)とを抽出するように構成された抽出モジュールを備え、前記信号vm(n)は前記信号sm(n)に対応しており、前記第2チャンネルの信号は前記第1チャンネルの信号と混合される必要があり、nはサンプル点の数を表しており、
    前記信号sm(n)と前記信号vm(n)とを重み付けし、重み付けされた信号sm(n)と信号vm(n)を加算して混合信号ym(n)を取得するように構成された混合モジュールと、
    前記混合信号ym(n)の数列の最大値ymaxに基づいて可変減衰因子を計算し、前記可変減衰因子を用いて前記混合信号ym(n)を減衰させて出力信号Zm(n)を形成するように構成された減衰処理モジュールとを備えたオーディオ混合処理装置。
  7. 前記減衰処理モジュールは、前記ym(n)の数列の最大値ymaxと、現在のグローバル参考値fを取得するように構成された取得ユニットを備え、ymax=max(abs(ym))であり、absは絶対値の取得を表し、maxは最大値の取得を表しており、
    前記最大値ymaxが所定値Ma以下の場合、暫定参考値fnewをfnew=1.0に設定し、前記最大値ymaxが前記所定値Maを超える場合、前記暫定参考値をfnew=Ma/ymaxに設定するように構成された割当てユニットと、
    Nを前記信号sm(n)とvm(n)のフレームの長さとし、所定の可変減衰因子detaをdeta=(f-fnew)/Nとして計算するように構成された計算ユニットとを備えた請求項6に記載の装置。
  8. 前記減衰処理モジュールは、前記可変減衰因子detaを用いて前記混合信号ym(n)を減衰させて、Zm(n)=(f-n*deta)*ym(n)として信号Zm(n)を取得するように構成された減衰処理ユニットをさらに備え、n=0,1,2,・・・N-1であり、Nは、前記信号sm(n)及びvm(n)のフレームの長さであり、減衰後に取得された信号Zm(n)は出力信号として使用される請求項7に記載の装置。
  9. 前記減衰処理モジュールは、次のフレームの処理のために前記グローバル参考値fを前記暫定参考値fnewと等しくなるように更新するように構成された更新ユニットをさらに備えた請求項7に記載の装置。
  10. 前記グローバル参考値fの初期値は1.0であり、前記所定値Maは32767と等しい請求項7又は8に記載の装置。
  11. プロセッサ、メモリ、バス、および通信インターフェースを備えたコンピュータ装置であって、
    前記メモリは、コンピュータで実行可能な指令を格納するように構成されており、
    前記プロセッサと前記メモリは、前記バスを介して互いに接続されており、
    前記プロセッサは、コンピュータ装置が作動すると、前記メモリに格納された前記コンピュータで実行可能な指令を実行して、コンピュータ装置が、
    第1チャンネルの信号におけるフレーム内の信号sm(n)と、第2チャンネルの信号におけるフレーム内の信号vm(n)とを抽出するステップを実行し、
    前記信号vm(n)は前記信号sm(n)に対応しており、前記第2チャンネルの信号は前記第1チャンネルの信号と混合される必要があり、nはサンプル点の数を表しており、
    前記信号sm(n)と前記信号vm(n)とを重み付けし、重み付けされた信号sm(n)及びvm(n)を加算して混合信号ym(n)を取得するステップと、
    前記混合信号ym(n)の数列の最大値ymaxに基づいて可変減衰因子を計算し、前記可変減衰因子を用いて前記混合信号ym(n)を減衰させて、出力信号Zm(n)を形成するステップとを実行するように構成されているコンピュータ装置。
  12. 1つまたは複数のコンピュータプログラムを格納する不揮発性記憶媒体であって、前記1つまたは複数のコンピュータプログラムは、1つまたは複数のメモリを有するプロセッサによって実行可能な指令を含んでおり、
    前記指令は、コンピュータによって実行されると、コンピュータが、
    第1チャンネルの信号におけるフレーム内の信号sm(n)と、第2チャンネルの信号におけるフレーム内の信号vm(n)とを抽出するステップを実行し、
    前記信号vm(n)は前記信号sm(n)に対応しており、前記第2チャンネルの信号は前記第1チャンネルの信号と混合される必要があり、nはサンプル点の数を表しており、
    前記信号sm(n)と前記信号vm(n)とを重み付けし、重み付けされた信号sm(n)及びvm(n)を加算して混合信号ym(n)を取得するステップと、
    前記混合信号ym(n)の数列の最大値ymaxに基づいて可変減衰因子を計算し、前記可変減衰因子を用いて前記混合信号ym(n)を減衰させて、出力信号Zm(n)を形成するステップとを実行するように構成されている不揮発性記憶媒体。
JP2018515556A 2015-09-29 2016-06-03 サウンド混合処理方法および装置、装置、並びに記憶媒体 Active JP6587742B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510631912.3 2015-09-29
CN201510631912.3A CN106558314B (zh) 2015-09-29 2015-09-29 一种混音处理方法和装置及设备
PCT/CN2016/084718 WO2017054494A1 (zh) 2015-09-29 2016-06-03 一种混音处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
JP2018533294A JP2018533294A (ja) 2018-11-08
JP6587742B2 true JP6587742B2 (ja) 2019-10-09

Family

ID=58416857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018515556A Active JP6587742B2 (ja) 2015-09-29 2016-06-03 サウンド混合処理方法および装置、装置、並びに記憶媒体

Country Status (6)

Country Link
US (1) US10283134B2 (ja)
EP (1) EP3358567B1 (ja)
JP (1) JP6587742B2 (ja)
KR (1) KR102084338B1 (ja)
CN (1) CN106558314B (ja)
WO (1) WO2017054494A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109559763B (zh) * 2017-09-26 2021-01-15 华为技术有限公司 一种实时数字音频信号混音的方法及装置
CN108831425B (zh) * 2018-06-22 2022-01-04 广州酷狗计算机科技有限公司 混音方法、装置及存储介质
CN109859729B (zh) * 2019-01-21 2021-03-05 北京小唱科技有限公司 对音频进行波形幅度控制方法及装置
CN111510549A (zh) * 2020-04-26 2020-08-07 厦门亿联网络技术股份有限公司 无线通信设备、语音数据处理方法及装置
CN111770413B (zh) * 2020-06-30 2021-08-27 浙江大华技术股份有限公司 一种多音源混音方法、装置及存储介质
CN113113046B (zh) * 2021-04-14 2024-01-19 杭州网易智企科技有限公司 音频处理的性能检测方法、装置、存储介质及电子设备
CN113257257B (zh) * 2021-07-14 2021-11-09 统信软件技术有限公司 多路语音信号的混音处理方法、装置、设备及存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6404892B1 (en) 1995-09-06 2002-06-11 Apple Computer, Inc. Reduced complexity audio mixing apparatus
US7379961B2 (en) * 1997-04-30 2008-05-27 Computer Associates Think, Inc. Spatialized audio in a three-dimensional computer-based scene
US6728584B1 (en) * 1998-09-02 2004-04-27 Ati Technologies Synchronization and mixing of multiple streams at different sampling rates
JP2002299975A (ja) * 2001-04-02 2002-10-11 Matsushita Electric Ind Co Ltd デジタルagc装置
KR100735368B1 (ko) * 2001-08-23 2007-07-04 삼성전자주식회사 오디오 출력 이득 조정장치 및 그 방법
US7145883B2 (en) * 2002-02-25 2006-12-05 Sonexis, Inc. System and method for gain control of audio sample packets
ES2399295T3 (es) * 2006-08-09 2013-03-27 Dolby Laboratories Licensing Corporation Limitación de picos de audio en etapas lentas y rápidas
US8218460B2 (en) * 2006-12-27 2012-07-10 Laura Laaksonen Network entity, method and computer program product for mixing signals during a conference session
US20080228470A1 (en) * 2007-02-21 2008-09-18 Atsuo Hiroe Signal separating device, signal separating method, and computer program
JP2008219549A (ja) * 2007-03-06 2008-09-18 Nec Corp 信号処理の方法、装置、及びプログラム
KR20090022551A (ko) * 2007-08-31 2009-03-04 삼성전자주식회사 무선 오디오 믹싱 장치 및 방법
US9113240B2 (en) * 2008-03-18 2015-08-18 Qualcomm Incorporated Speech enhancement using multiple microphones on multiple devices
US8208659B2 (en) * 2008-03-27 2012-06-26 Analog Devices Bv Method and apparatus for scaling signals to prevent amplitude clipping
CN101674450A (zh) * 2008-09-10 2010-03-17 深圳市邦彦信息技术有限公司 视频指挥调度系统中的混音方法
CN101989430B (zh) * 2009-07-30 2012-07-04 比亚迪股份有限公司 一种混音处理系统及混音处理方法
CN102226944B (zh) * 2011-05-25 2014-11-12 贵阳朗玛信息技术股份有限公司 混音方法及设备
CN102610235B (zh) * 2011-12-22 2016-02-24 深圳万兴信息科技股份有限公司 混音处理方法、装置及智能设备
US9349385B2 (en) * 2012-02-22 2016-05-24 Htc Corporation Electronic device and gain controlling method
US9070371B2 (en) * 2012-10-22 2015-06-30 Ittiam Systems (P) Ltd. Method and system for peak limiting of speech signals for delay sensitive voice communication
CN103021419A (zh) * 2012-12-26 2013-04-03 大唐移动通信设备有限公司 一种混合音频的处理方法及装置
US10469947B2 (en) * 2014-10-07 2019-11-05 Nokia Technologies Oy Method and apparatus for rendering an audio source having a modified virtual position

Also Published As

Publication number Publication date
CN106558314B (zh) 2021-05-07
KR102084338B1 (ko) 2020-03-03
KR20180048786A (ko) 2018-05-10
CN106558314A (zh) 2017-04-05
EP3358567A4 (en) 2019-05-29
EP3358567A1 (en) 2018-08-08
JP2018533294A (ja) 2018-11-08
US10283134B2 (en) 2019-05-07
EP3358567B1 (en) 2020-07-22
US20180268833A1 (en) 2018-09-20
WO2017054494A1 (zh) 2017-04-06

Similar Documents

Publication Publication Date Title
JP6587742B2 (ja) サウンド混合処理方法および装置、装置、並びに記憶媒体
CN109102821B (zh) 时延估计方法、系统、存储介质及电子设备
CN104134444B (zh) 一种基于mmse的歌曲去伴奏方法和装置
US11462225B2 (en) Method for processing speech/audio signal and apparatus
EP4254408A1 (en) Speech processing method and apparatus, and apparatus for processing speech
CN111863015A (zh) 一种音频处理方法、装置、电子设备和可读存储介质
US11694700B2 (en) Method, apparatus and device for processing sound signal
US11380312B1 (en) Residual echo suppression for keyword detection
CN111739544B (zh) 语音处理方法、装置、电子设备及存储介质
WO2024088142A1 (zh) 音频信号处理方法、装置、电子设备及可读存储介质
CN113496706B (zh) 音频处理方法、装置、电子设备及存储介质
CN109920444A (zh) 回声时延的检测方法、装置以及计算机可读存储介质
CN111968620A (zh) 算法的测试方法、装置、电子设备及存储介质
TW201709199A (zh) 聲音辨識裝置及聲音辨識處理方法
CN112398912B (zh) 一种语音信号加速方法、装置、计算机设备及存储介质
WO2021057239A1 (zh) 语音数据的处理方法、装置、电子设备及可读存储介质
CN114827363A (zh) 用于通话过程中消除回声的方法、设备和可读存储介质
CN111243631B (zh) 一种自动增益控制方法及电子设备
US9313582B2 (en) Hearing aid and method of enhancing speech output in real time
CN116982111A (zh) 音频特征补偿方法、音频识别方法及相关产品
CN111724808A (zh) 音频信号处理方法、装置、终端及存储介质
CN113707163B (zh) 语音处理方法及其装置和模型训练方法及其装置
CN113808606B (zh) 语音信号处理方法和装置
WO2017054507A1 (zh) 音效模拟方法和装置及系统
CN113707163A (zh) 语音处理方法及其装置和模型训练方法及其装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180522

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190528

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190820

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190910

R150 Certificate of patent or registration of utility model

Ref document number: 6587742

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250