JP4784016B2 - 周波数解析方法および音響信号の符号化方法 - Google Patents
周波数解析方法および音響信号の符号化方法 Download PDFInfo
- Publication number
- JP4784016B2 JP4784016B2 JP2001244084A JP2001244084A JP4784016B2 JP 4784016 B2 JP4784016 B2 JP 4784016B2 JP 2001244084 A JP2001244084 A JP 2001244084A JP 2001244084 A JP2001244084 A JP 2001244084A JP 4784016 B2 JP4784016 B2 JP 4784016B2
- Authority
- JP
- Japan
- Prior art keywords
- main
- sub
- zero
- unit section
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Combined Controls Of Internal Combustion Engines (AREA)
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Description
【発明の属する技術分野】
本発明は周波数解析方法および音響信号の符号化方法に関し、特に、生体信号の解析、医療診断・カルテ作成支援、医学教育等の医療関連、エンジン音の解析等の故障診断、自然音を音楽素材として取り込んだ音響コンテンツ制作支援への応用に適した技術に関する。
【0002】
【従来の技術】
音響信号に代表される時系列信号には、その構成要素として複数の周期信号が含まれている。このため、与えられた時系列信号にどのような周期信号が含まれているかを解析する手法は、古くから知られている。例えば、フーリエ解析は、与えられた時系列信号に含まれる周波数成分を解析するための方法として広く利用されている。
【0003】
このような時系列信号の解析方法を利用すれば、音響信号を符号化することも可能である。コンピュータの普及により、原音となるアナログ音響信号を所定のサンプリング周波数でサンプリングし、各サンプリング時の信号強度を量子化してデジタルデータとして取り込むことが容易にできるようになってきており、こうして取り込んだデジタルデータに対してフーリエ解析などの手法を適用し、原音信号に含まれていた周波数成分を抽出すれば、各周波数成分を示す符号によって原音信号の符号化が可能になる。
【0004】
一方、電子楽器による楽器音を符号化しようという発想から生まれたMIDI(Musical Instrument Digital Interface)規格も、パーソナルコンピュータの普及とともに盛んに利用されるようになってきている。このMIDI規格による符号データ(以下、MIDIデータという)は、基本的には、楽器のどの鍵盤キーを、どの程度の強さで弾いたか、という楽器演奏の操作を記述したデータであり、このMIDIデータ自身には、実際の音の波形は含まれていない。そのため、実際の音を再生する場合には、楽器音の波形を記憶したMIDI音源が別途必要になるが、その符号化効率の高さが注目を集めており、MIDI規格による符号化および復号化の技術は、現在、パーソナルコンピュータを用いて楽器演奏、楽器練習、作曲などを行うソフトウェアに広く採り入れられている。
【0005】
そこで、音響信号に代表される時系列信号に対して、所定の手法で解析を行うことにより、その構成要素となる周期信号を抽出し、抽出した周期信号をMIDIデータを用いて符号化しようとする提案がなされている。例えば、特開平10−247099号公報、特開平11−73199号公報、特開平11−73200号公報、特開平11−95753号公報、特開2000−99009号公報、特開2000−99092号公報、特開2000−99093号公報、特開2000−261322号公報、特開2001−5450号公報、特開2001−148633号公報には、任意の時系列信号について、構成要素となる周波数を解析し、その解析結果からMIDIデータを作成することができる種々の方法が提案されている。
【0006】
【発明が解決しようとする課題】
上記各公報において提案してきたMIDI符号化方式により、演奏録音等から得られる音響信号の効率的な符号化が可能になった。上記のように提案してきたMIDI符号化方式は、大きく2通りに分けられる。1つは、特開平10−247099号公報に代表されるような時系列信号の波形から強度値のピークを抽出すると共に抽出したピークの出現頻度に基づいて周波数を決定する手法である。もう1つは、特開2000−261322号公報に代表されるような短時間フーリエ変換や一般化調和解析により時系列信号の解析を行なって、周波数成分を抽出する手法である。
【0007】
前者は、所定の強度値以上をとるピークに基づいて抽出する周波数成分を決定していくため、時間分解能が高いと共に演算処理にかかる負荷が小さいという利点があるが、所定の区間において1つの周波数成分しか抽出できないという欠点がある。後者は、所定の区間において複数の周波数成分を抽出することができるが、周期関数との多数回の積和演算を必要とするため演算負荷が膨大であり、また、解析区間をオーバーラップさせながら演算するために充分な時間分解能が得られないという欠点がある。
【0008】
特に、生体信号の一つである心音を解析しようとする場合、心音の波形成分は時間長が短いため、時間分解能が低い手法であるフーリエ変換や一般化調和解析を用いた手法は用いられることは少ない。この場合、信号強度のピークに基づいて周波数成分を抽出する手法が用いられることになるが、上述のように同時に1つの周波数成分しか抽出できないため、特徴的な1つの音しか判断することができず、隠れた疾患から生ずる僅かな音を検出することができないという問題がある。
【0009】
上記のような点に鑑み、本発明は、所定の区間において複数の周波数成分を抽出することができ、かつ、演算負荷を抑え、時間分解能を高めることが可能であると共に、特に心音の解析を行なう場合に隠れた音成分も抽出することが可能な周波数解析方法および音響信号の符号化方法を提供することを課題とする。
【0010】
【課題を解決するための手段】
上記課題を解決するため、本発明では、正負両極性の時系列信号から所定の主周波数の含有信号成分を分離するための周波数解析方法として、前記時系列信号に対して信号が0レベルと交差する複数の主ゼロ交差点を求めるための主ゼロ交差点検出段階と、前記主ゼロ交差点の中から、主ゼロ交差点t1、t2が、差t2−t1で定まる周期と主ゼロ交差点2つ分に相当する単位周期の関係が所定の条件を満たす範囲で、差t2−t1が最大となる場合に、前記主ゼロ交差点t1を始点、前記主ゼロ交差点t2を終点として選出することにより、全区間に渡って複数の単位区間を設定する単位区間設定段階と、前記各単位区間の始点となる主ゼロ交差点t1と、終点となる主ゼロ交差点t2の間にk個の主ゼロ交差点が存在するとき、(t2−t1)×2/kを主周期として算出し、前記単位区間における時系列信号の最大振幅を主振幅として求める主成分算出段階と、前記各単位区間の隣接主ゼロ交差点間における前記時系列信号の直流成分を除去して補正時系列信号を得る時系列信号補正段階と、前記補正時系列信号に対して信号が0レベルと交差する複数の副ゼロ交差点を求めるための副ゼロ交差点算出段階と、前記各単位区間における副ゼロ交差点の配置から副周期を算出し、当該単位区間における補正時系列信号から副振幅を求める副成分算出段階と、を有し、前記単位区間設定段階において設定された全ての単位区間について、前記主成分算出段階以降を繰り返すことにより、前記時系列信号における各単位区間に対応する主周期と主振幅および副周期と副振幅を算出するようにしたことを特徴とする。
【0011】
本発明によれば、時系列信号に対して主ゼロ交差点を求め、この主ゼロ交差点を基に単位区間を設定し、各単位区間について主周期と主振幅を算出した後、時系列信号の補正を行って補正後の補正時系列信号から副周期と副振幅を算出するようにしたので、1つの区間において、複数の周波数成分を抽出することが可能となる。
【0012】
【発明の実施の形態】
以下、本発明を図示する実施形態に基づいて説明する。
(1.本発明の基本原理)
はじめに、本発明に係る周波数解析方法および音声信号の符号化方法の基本原理を図1を参照しながら説明する。図1の上段に示すように、時系列の強度信号としてアナログ音響信号が与えられたものとする。図示の例では、横軸に時間軸t、縦軸に信号強度Aをとってこの音響信号を示している。本発明では、まずこのアナログ音響信号を、デジタルの音響信号として取り込む処理を行う。これは、従来の一般的なPCMの手法を用い、所定のサンプリング周波数でこのアナログ音響信号をサンプリングし、信号強度Aを所定の量子化ビット数を用いてデジタルデータに変換する処理を行えばよい。ここでは、説明の便宜上、PCMの手法でデジタル化した音響信号の波形も、図1の上段のアナログ音響信号と同一の波形で示すことにする。
【0013】
次に、このデジタル音響信号の時間軸t上に複数の単位区間を設定する。図示の例では、6つの単位区間U1〜U6が設定されている。第i番目の単位区間Uiは、時間軸t上の始端siおよび終端eiの座標値によって、その時間軸t上での位置と長さとが示される。たとえば、単位区間U1は、始端s1〜終端e1までの(e1−s1)なる長さをもつ区間である。
【0014】
こうして、複数の単位区間が設定されたら、個々の単位区間内の音響信号に基づいて、個々の単位区間を代表する所定の代表周波数および代表強度を定義する。ここでは、第i番目の単位区間Uiについて、代表周波数Fiおよび代表強度Aiが定義された状態が示されている。たとえば、第1番目の単位区間U1については、代表周波数F1および代表強度A1が定義されている。代表周波数F1は、始端s1〜終端e1までの区間に含まれている音響信号の周波数成分の代表値であり、代表強度Aiは、同じく始端s1〜終端e1までの区間に含まれている音響信号の信号強度の代表値である。単位区間U1内の音響信号に含まれる周波数成分は、通常、単一ではなく、信号強度も変動するのが一般的である。従来の手法とも共通する基本原理のポイントは、1つの単位区間について、1つもしくは複数の代表周波数と代表強度を定義し、これら代表値を用いて符号化を行う点にある。
【0015】
すなわち、個々の単位区間について、それぞれ代表周波数および代表強度が定義されたら、時間軸t上での個々の単位区間の始端位置および終端位置を示す情報と、定義された代表周波数および代表強度を示す情報と、により符号データを生成し、個々の単位区間の音響信号を個々の符号データによって表現するのである。単一の周波数をもち、単一の信号強度をもった音響信号が、所定の期間だけ持続する、という事象を符号化する手法として、MIDI規格に基づく符号化を利用することができる。MIDI規格による符号データ(MIDIデータ)は、いわば音符によって音を表現したデータということができ、図1では、下段に示す音符によって、最終的に得られる符号データの概念を示している。
【0016】
結局、各単位区間内の音響信号は、代表周波数F1に相当する音程情報(MIDI規格におけるノートナンバー)と、代表強度A1に相当する強度情報(MIDI規格におけるベロシティー)と、単位区間の長さ(e1−s1)に相当する長さ情報(MIDI規格におけるデルタタイム)と、をもった符号データに変換されることになる。このようにして得られる符号データの情報量は、もとの音響信号のもつ情報量に比べて、著しく小さくなり、飛躍的な符号化効率が得られることになる。なお、代表周波数をノートナンバーnの関数f(n)としたときに、代表周波数f(n)とノートナンバーn(0≦n≦127)との関係は、以下に示す〔数式1〕で定義されることになる。
【0017】
〔数式1〕
f(n)=440×2γ (n)
γ(n)=(n−69)/12
【0018】
また、周波数と周期は互いに逆数の関係にあり、一方が定まれば他方も一義的に定まり、上記〔数式1〕により周波数が定まればノートナンバーも定まる。したがって、本発明においては、周波数・周期・ノートナンバーのいずれか1つの用語を用いている場合においても、他の2つについても同時に定まっているものとして説明していく。
【0019】
(本発明に係る音響信号の符号化方法の具体的な手順)
上記基本原理をふまえて、以下、本発明に係る周波数解析方法を音響信号の符号化と共に説明する。図2は、本発明のより具体的な手順を示すフローチャートである。まず、符号化対象となる原音響信号をデジタルデータの形式で入力する(ステップS1)。
【0020】
続いて、入力された原音響信号に対して信号から主ゼロ交差点を検出する(ステップS2)。主ゼロ交差点とは、音響信号が0レベルになる地点であるゼロ交差点のうち、補正処理が行われていない原音響信号に対して検出されるものを示す。ここで、図1に示した原音響信号の一部を時間軸方向に拡大したものを図3(a)に示す。ステップS2においては、信号が0レベルとなるゼロ交差点を検出する。このゼロ交差点は、時刻で表現されることになる。図3(a)の原音響信号から検出された主ゼロ交差点を図3(b)に示す。
【0021】
次に、ステップS2において検出された主ゼロ交差点にしたがって、単位区間を決定する(ステップS3)。単位区間とは、周波数成分の抽出および符号データを作成するための基本となる区間であり、図1の単位区間Uに相当する。単位区間は、始点となる主ゼロ交差点t1から終点となる主ゼロ交差点t2までの区間として設定される。始点となる主ゼロ交差点t1としては、単位区間として未だ設定されていない区間において、時間的に先頭の主ゼロ交差点が選出される。終点となる主ゼロ交差点t2は、以下のようにして選出される。
【0022】
図3(a)に示すように原音響信号の波形は、始点となるゼロ交差点から2つ移動した位置のゼロ交差点で1周期となっている。そのため、この整数倍のセロ交差点を移動した位置を終点とするのが好ましい。また、安定した周波数値を得るため、終点をできる始点から離れた位置にとり、その平均周期をこの単位区間の周期とできるようにすることが好ましい。そのために、まず始点となる主ゼロ交差点t1から2つ移動した主ゼロ交差点までの距離を単位周期TBと設定する。終点となる主ゼロ交差点t2としては、始点となる主ゼロ交差点t1から2の整数倍だけ離れた主ゼロ交差点のうち以下の〔数式2〕を満たす範囲で、t2−t1が最大となるものを選出するようにする。
【0023】
〔数式2〕
|NA−NB| ≦ 1
ただし、N=40×log10(1/440T)+69
T=(t2−t1)×2/k
【0024】
上記〔数式2〕において、NAはt2−t1間の平均周期TAにより定まるノートナンバー、NBは単位周期TBにより定まるノートナンバーである。また、kは、始点となる主ゼロ交差点から終点となる主ゼロ交差点までに移動した主ゼロ交差点の数であり、2の整数倍となっている。なお、上記〔数式2〕において、第2式は、周期TからノートナンバーNを求めるためのものであり、第3式は、平均周期TAを求めるためのものであり、k=2とした場合に単位周期TBが得られる。上記〔数式2〕においては、終点となる主ゼロ交差点t2を、始点となる主ゼロ交差点t1から、4個分、6個分、8個分…というように2の整数倍だけ離れた主ゼロ交差点に仮設定して判断していく。結局、ステップS2における処理は、単位周期TBで定まる周波数と、平均周期TAで定まる周波数をそれぞれノートナンバーに変換した際に、半音の差(ノートナンバーとしては±1の差)以内に収まるような主ゼロ交差点t2を終点として選出する処理を行うことになる。単位区間の設定は音響信号の全区間に渡って行われる。後続する単位区間においては、先行する単位区間の終点となる主ゼロ交差点の次の主ゼロ交差点を、始点となる主ゼロ交差点として、上記説明と同様に処理を行っていく。
【0025】
全単位区間の設定が行われたら、各単位区間について、主周波数成分の算出を行う(ステップS4)。周波数成分とは、周期(周波数)および振幅を意味するものである。周期としては、単位区間における平均周期TAが設定され、振幅としては、単位区間内において、信号の絶対値が最大となる値Aが設定される。なお、主周波数成分とは、周波数成分のうち、補正が行われていない原音響信号から抽出されたものをいい、ステップS7で算出される副周波数成分と区別している。
【0026】
上記ステップS3およびステップS4による処理、すなわち、ゼロ交差点を用いて単位区間を決定し、単位区間に対応する周波数成分を算出する処理については、従来から行われているものと同様である。ただし、これでは、上記発明が解決しようとする課題の段落で説明したように、1つの単位区間について1つの周波数成分しか抽出できない。本発明では、1つの単位区間から複数の周波数成分を抽出するために後述するようなステップS5以下の処理を行っている。
【0027】
ステップS4において主周波数成分が算出されたら、次にその単位区間における音響信号から直流成分の除去を行う(ステップS5)。ここでの、直流成分の除去は単位区間全体に渡って一律に行うのではなく、音響信号が0以上になっている部分については、当該部分の平均強度を各時刻の信号強度から減じるようにし、音響信号が0以下になっている部分についても、当該部分の平均強度を正負の符号をそのままにして信号強度から減じる(実際には平均強度は増加していることになる)ようにする。これにより、振幅の大きな部分が抑えられた補正音響信号が得られることになる。図3(c)に示した原音響信号を補正した補正音響信号を図3(d)に示す。
【0028】
続いて、補正音響信号に対して、信号が0レベルと交差する副ゼロ交差点を検出する(ステップS6)。これは、上記ステップS2において、原音響信号に対して主ゼロ交差点を検出したのと全く同様な処理で行われる。ただし、図3(d)に示したように、補正音響信号では、原音響信号に比べて明らかにゼロ交差点が増えているので、多くの副ゼロ交差点が検出されることになる。図3(d)に示した補正音響信号から検出された副ゼロ交差点を図3(e)に示す。
【0029】
続いて、補正音響信号および検出された副ゼロ交差点に従って、副周波数成分の算出を行う(ステップS7)。副周波数成分のうち、周期としては、単位区間における始点となる副ゼロ交差点t3と終点となる副ゼロ交差点t4で定まる平均周期が与えられる。また、副周波数成分のうち、振幅としては、単位区間内において、補正音響信号の絶対値が最大となる値が設定される。
【0030】
上記ステップS5〜ステップS7の処理は、所定の回数だけ繰り返され、繰り返された回数分の副周波数成分が抽出されることになる。
【0031】
全ての単位区間について、主周波数成分、副周波数成分の抽出が行われたら、抽出された周波数成分を基に符号化を行う(ステップS8)。符号化の段階では、特に主周波数成分と副周波数成分は区別せず、1つの単位区間に複数の周波数成分があるものとして扱われる。こうして、各単位区間について、所定数の周波数成分が得られたら、各周波数成分の周期(周波数)に対応する「音の高さを示す情報」、各周波数成分の振幅に対応する「音の強さを示す情報」、当該単位区間の始点(主ゼロ交差点t1)に対応する「音の発音開始時刻を示す情報」、当該単位区間の終点(主ゼロ交差点t2)に対応する「音の発音終了時刻を示す情報」、の4つの情報を含む所定数の符号データを作成すれば、当該単位区間内の区間信号を所定数の符号データにより符号化することができる。符号データとして、MIDIデータを作成するのであれば、「音の高さを示す情報」としてノートナンバーを用い、「音の強さを示す情報」としてベロシティーを用い、「音の発音開始時刻を示す情報」としてノートオン時刻を用い、「音の発音終了時刻を示す情報」としてノートオフ時刻を用いるようにすれば良い。
【0032】
以上、本発明の好適な実施形態について説明したが、上記周波数解析方法および音響信号の符号化方法は、コンピュータ等で実行されることは当然である。具体的には、図1のフローチャートに示したようなステップを上記手順で実行するためのプログラムをコンピュータに搭載しておく。そして、音響信号をPCM方式等でデジタル化した後、コンピュータに取り込み、ステップS1〜ステップS8の処理を行った後、周波数解析を行った場合はその周波数成分を抽出し、符号化まで行った場合はMIDI形式等の符号データをコンピュータより出力する。符号化を行った場合は、出力された符号データは、例えば、MIDIデータの場合、MIDIシーケンサ、MIDI音源を用いて音声として再生される。
【0033】
【発明の効果】
以上、説明したように本発明によれば、時系列信号に対して信号が0レベルと交差する複数の主ゼロ交差点を求めるための主ゼロ交差点検出段階と、前記主ゼロ交差点の中から始点となる主ゼロ交差点と終点となる主ゼロ交差点を選出することにより、全区間に渡って複数の単位区間を設定する単位区間設定段階と、前記各単位区間における主ゼロ交差点の配置から主周期を算出し、前記単位区間における時系列信号から主振幅を求める主成分算出段階と、前記各単位区間における隣接主ゼロ交差点間に対応する前記時系列信号の直流成分を除去して補正時系列信号を得る時系列信号補正段階と、前記補正時系列信号に対して信号が0レベルと交差する複数の副ゼロ交差点を求めるための副ゼロ交差点算出段階と、前記各単位区間における副ゼロ交差点の配置から副周期を算出し、当該単位区間における補正時系列信号から副振幅を求める副成分算出段階とを有し、全単位区間について、前記主成分算出段階以降を繰り返すことにより、前記時系列信号における各単位区間に対応する主周期と主振幅および副周期と副振幅を算出するようにしたので、1つの区間において、複数の周波数成分を抽出することが可能となるという効果を奏する。特に生体信号の1つである心音の解析に用いた場合に隠れた疾患に基づく音成分も抽出することが可能となるという効果も奏する。
【図面の簡単な説明】
【図1】本発明に係る周波数解析方法および音響信号の符号化方法の基本原理を示す図である。
【図2】本発明に係る周波数解析方法および音響信号の符号化方法のフローチャートである。
【図3】音響信号における単位区間の設定および周期・振幅の決定を説明するための図である。
【符号の説明】
TA ・・・平均周期
TB ・・・単位周期
t1・・・始点となる主ゼロ交差点
t2・・・終点となる主ゼロ交差点
t3・・・始点となる副ゼロ交差点
t4・・・終点となる副ゼロ交差点
Claims (7)
- 正負両極性の時系列信号から所定の主周波数の含有信号成分を分離するための周波数解析方法であって、
前記時系列信号に対して信号が0レベルと交差する複数の主ゼロ交差点を求めるための主ゼロ交差点検出段階と、
前記主ゼロ交差点の中から、主ゼロ交差点t1、t2が、差t2−t1で定まる周期と主ゼロ交差点2つ分に相当する単位周期の関係が所定の条件を満たす範囲で、差t2−t1が最大となる場合に、前記主ゼロ交差点t1を始点、前記主ゼロ交差点t2を終点として選出することにより、全区間に渡って複数の単位区間を設定する単位区間設定段階と、
前記各単位区間の始点となる主ゼロ交差点t1と、終点となる主ゼロ交差点t2の間にk個の主ゼロ交差点が存在するとき、(t2−t1)×2/kを主周期として算出し、前記単位区間における時系列信号の最大振幅を主振幅として求める主成分算出段階と、
前記各単位区間の隣接主ゼロ交差点間における前記時系列信号の直流成分を除去して補正時系列信号を得る時系列信号補正段階と、
前記補正時系列信号に対して信号が0レベルと交差する複数の副ゼロ交差点を求めるための副ゼロ交差点算出段階と、
前記各単位区間における副ゼロ交差点の配置から副周期を算出し、当該単位区間における補正時系列信号から副振幅を求める副成分算出段階と、を有し、
前記単位区間設定段階において設定された全ての単位区間について、前記主成分算出段階以降を繰り返すことにより、前記時系列信号における各単位区間に対応する主周期と主振幅および副周期と副振幅を算出するようにしていることを特徴とする周波数解析方法。 - 前記副成分算出段階が、前記単位区間内の最初の副ゼロ交差点t3と、末端となる副ゼロ交差点t4の間にk個の副ゼロ交差点が存在するとき、前記副周期として(t4−t3)×2/kを与え、副振幅として前記単位区間における補正時系列信号の最大振幅を与えることを特徴とする請求項1に記載の周波数解析方法。
- 前記時系列信号補正段階から副成分算出段階までを所定の回数繰り返し、1つの単位区間に対して複数の副周期と副振幅を算出するようにすることを特徴とする請求項1または請求項2に記載の周波数解析方法。
- 時系列信号として与えられた音響信号を符号化する方法であって、
前記音響信号に対して信号が0レベルと交差する複数の主ゼロ交差点を求めるための主ゼロ交差点検出段階と、
前記主ゼロ交差点の中から、主ゼロ交差点t1、t2が、差t2−t1で定まる周期と主ゼロ交差点2つ分に相当する単位周期の関係が所定の条件を満たす範囲で、差t2−t1が最大となる場合に、前記主ゼロ交差点t1を始点、前記主ゼロ交差点t2を終点として選出して単位区間を設定する単位区間設定段階と、
前記各単位区間の始点となる主ゼロ交差点t1と、終点となる主ゼロ交差点t2の間にk個の主ゼロ交差点が存在するとき、(t2−t1)×2/kを主周期として算出し、前記単位区間における音響信号の最大振幅を主振幅として求める主成分算出段階と、
前記単位区間の隣接主ゼロ交差点間における前記音響信号の直流成分を除去し、補正音響信号を得るための音響信号補正段階と、
前記補正音響信号に対して信号が0レベルと交差する複数の副ゼロ交差点を求めるための副ゼロ交差点算出段階と、
前記単位区間内の最初の副ゼロ交差点t3と、末端となる副ゼロ交差点t4の間にk個の主ゼロ交差点が存在するとき、(t4−t3)×2/kを副周期として算出し、当該単位区間における補正音響信号の最大振幅を副振幅として求める副成分算出段階と、を有し、
前記単位区間設定段階において設定された全ての単位区間について、前記主成分算出段階以降を繰り返すことにより、前記音響信号における各単位区間に対応する主周期と主振幅および副周期と副振幅を算出し、
前記算出された主周期または副周期に対応する音の高さ情報と、主振幅または副振幅に対応する音の強さ情報と、各単位区間の始点となる主ゼロ交差点に対応する発音開始時刻と、各単位区間の終点となる主ゼロ交差点に対応する発音終了時刻とからなる情報に変換を施して符号データを生成することを特徴とする音響信号の符号化方法。 - 前記音響信号補正段階から副成分算出段階までを所定の回数繰り返し、1つの単位区間に対して複数の副周期と副振幅を算出するようにすることを特徴とする請求項4に記載の音響信号の符号化方法。
- コンピュータに、
時系列信号に対して信号が0レベルと交差する複数の主ゼロ交差点を求めるための主ゼロ交差点検出段階、
前記主ゼロ交差点の中から、主ゼロ交差点t1、t2が、差t2−t1で定まる周期と主ゼロ交差点2つ分に相当する単位周期の関係が所定の条件を満たす範囲で、差t2−t1が最大となる場合に、前記主ゼロ交差点t1を始点、前記主ゼロ交差点t2を終点として選出することにより、全区間に渡って複数の単位区間を設定する単位区間設定段階、
前記各単位区間の始点となる主ゼロ交差点t1と、終点となる主ゼロ交差点t2の間にk個の主ゼロ交差点が存在するとき、(t2−t1)×2/kを主周期として算出し、前記単位区間における時系列信号の最大振幅を主振幅として求める主成分算出段階、
前記各単位区間の隣接主ゼロ交差点間における前記時系列信号の直流成分を除去して補正時系列信号を得る時系列信号補正段階、
前記補正時系列信号に対して信号が0レベルと交差する複数の副ゼロ交差点を求めるための副ゼロ交差点算出段階、
前記各単位区間内の最初の副ゼロ交差点t3と、末端となる副ゼロ交差点t4の間にk個の主ゼロ交差点が存在するとき、(t4−t3)×2/kを副周期として算出し、当該単位区間における補正時系列信号の最大振幅を副振幅として求める副成分算出段階、
を実行させ、
前記単位区間設定段階において設定された全ての単位区間について、前記主成分算出段階以降を繰り返し実行させることにより、前記時系列信号における各単位区間に対応する主周期と主振幅および副周期と副振幅を算出するためのプログラム。 - 前記時系列信号補正段階から副成分算出段階までを所定の回数繰り返し、1つの単位区間に対して複数の副周期と副振幅を算出するようにすることを特徴とする請求項6に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001244084A JP4784016B2 (ja) | 2001-08-10 | 2001-08-10 | 周波数解析方法および音響信号の符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001244084A JP4784016B2 (ja) | 2001-08-10 | 2001-08-10 | 周波数解析方法および音響信号の符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003058191A JP2003058191A (ja) | 2003-02-28 |
JP4784016B2 true JP4784016B2 (ja) | 2011-09-28 |
Family
ID=19074074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001244084A Expired - Fee Related JP4784016B2 (ja) | 2001-08-10 | 2001-08-10 | 周波数解析方法および音響信号の符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4784016B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107172483A (zh) * | 2017-05-05 | 2017-09-15 | 广州华多网络科技有限公司 | 一种直播场景下的音质识别的方法、装置及终端设备 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57150900A (en) * | 1981-03-14 | 1982-09-17 | Takehiko Hirata | Identification of cyclic sound wave by zero crossing wave analysis |
JPS58190999A (ja) * | 1982-04-30 | 1983-11-08 | 松下電器産業株式会社 | 音声認識装置 |
JPS58190998A (ja) * | 1982-04-30 | 1983-11-08 | 松下電器産業株式会社 | 音声認識装置 |
JPS58202500A (ja) * | 1982-05-20 | 1983-11-25 | シャープ株式会社 | 音声の特徴抽出方式 |
JPS59105700A (ja) * | 1982-12-08 | 1984-06-19 | 電子計算機基本技術研究組合 | 音声認識方式 |
JPS6111799A (ja) * | 1984-06-27 | 1986-01-20 | シャープ株式会社 | 音声の特徴抽出方式 |
JP2628690B2 (ja) * | 1987-08-04 | 1997-07-09 | コーリン電子株式会社 | 呼吸数モニタ装置 |
JP2557497B2 (ja) * | 1988-10-05 | 1996-11-27 | 積水化学工業株式会社 | 男女声の識別方法 |
JPH03241400A (ja) * | 1990-02-20 | 1991-10-28 | Fujitsu Ltd | 音声検出器 |
JPH05197792A (ja) * | 1992-01-17 | 1993-08-06 | Fujitsu Ltd | 指紋照合装置用2値化回路 |
JP3096880B2 (ja) * | 1994-05-18 | 2000-10-10 | 長野日本無線株式会社 | 音声信号処理方法及び装置 |
JP2685719B2 (ja) * | 1994-10-25 | 1997-12-03 | ローランド株式会社 | 電子効果付加装置 |
JP2000276194A (ja) * | 1999-03-25 | 2000-10-06 | Yamaha Corp | 波形圧縮方法及び波形生成方法 |
JP3534012B2 (ja) * | 1999-09-29 | 2004-06-07 | ヤマハ株式会社 | 波形分析方法 |
-
2001
- 2001-08-10 JP JP2001244084A patent/JP4784016B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107172483A (zh) * | 2017-05-05 | 2017-09-15 | 广州华多网络科技有限公司 | 一种直播场景下的音质识别的方法、装置及终端设备 |
Also Published As
Publication number | Publication date |
---|---|
JP2003058191A (ja) | 2003-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8946534B2 (en) | Accompaniment data generating apparatus | |
JP3789326B2 (ja) | テンポ抽出装置、テンポ抽出方法、テンポ抽出プログラム及び記録媒体 | |
WO2004051622A1 (ja) | 楽曲データ作成装置及び方法 | |
JP3776196B2 (ja) | 音声信号の符号化方法および音声の記録再生装置 | |
JP4132362B2 (ja) | 音響信号の符号化方法およびプログラム記録媒体 | |
JP3795201B2 (ja) | 音響信号の符号化方法およびコンピュータ読み取り可能な記録媒体 | |
JP4784016B2 (ja) | 周波数解析方法および音響信号の符号化方法 | |
CN115762449A (zh) | 基于Transformer的条件音乐主题旋律自动生成方法及系统 | |
JP4037542B2 (ja) | 音響信号の符号化方法 | |
JP4968421B2 (ja) | 時系列信号解析装置 | |
JP4202964B2 (ja) | 映像データへの楽曲データ付加装置 | |
JPH1173200A (ja) | 音響信号の符号化方法およびコンピュータ読み取り可能な記録媒体 | |
JP4331289B2 (ja) | 音響信号の符号化方法 | |
JP2001005450A (ja) | 音響信号の符号化方法 | |
JP5879813B2 (ja) | 複数音源の識別装置および複数音源に連動する情報処理装置 | |
JP4152502B2 (ja) | 音響信号の符号化装置および符号データの編集装置 | |
US6314403B1 (en) | Apparatus and method for generating a special effect on a digital signal | |
JP4268328B2 (ja) | 音響信号の符号化方法 | |
JP4695781B2 (ja) | 音響信号の符号化方法 | |
JPH1173199A (ja) | 音響信号の符号化方法およびコンピュータ読み取り可能な記録媒体 | |
JP4331373B2 (ja) | 時系列信号の解析方法および音響信号の符号化方法 | |
JP4156252B2 (ja) | 音響信号の符号化方法 | |
JP4156268B2 (ja) | 時系列信号の周波数解析方法および音響信号の符号化方法 | |
JP2008096844A (ja) | 自動採譜装置及び方法 | |
JP3935745B2 (ja) | 音響信号の符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080709 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101006 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101014 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110315 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110513 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110614 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110627 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140722 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |