JP2001027895A - Signal separation and apparatus therefor - Google Patents

Signal separation and apparatus therefor

Info

Publication number
JP2001027895A
JP2001027895A JP11200078A JP20007899A JP2001027895A JP 2001027895 A JP2001027895 A JP 2001027895A JP 11200078 A JP11200078 A JP 11200078A JP 20007899 A JP20007899 A JP 20007899A JP 2001027895 A JP2001027895 A JP 2001027895A
Authority
JP
Japan
Prior art keywords
signal
frequency
frequency component
analysis
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11200078A
Other languages
Japanese (ja)
Inventor
So Kishida
創 岸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP11200078A priority Critical patent/JP2001027895A/en
Publication of JP2001027895A publication Critical patent/JP2001027895A/en
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

PROBLEM TO BE SOLVED: To synthesize signals of original signal sources respectively independently or to an arbitrary number of signals from mixed signals from plural signal sources by continuously analyzing the mixed signals with lapse of time, separating the same by a single signal source and reconstituting the signal of the desired signal source from the results of the separation. SOLUTION: When a frequency component appears in a proximity frequency band, a harmonic structure decision section forms a harmonic structure and decides this structure as a candidata for the frequency component constituting the single signal source. Next, the manipulation to change frequency resolution is repeated by a frequency resolution changing section to detect the harmonic component group of integer times in a central frequency and is determined as the frequency component of the candidate for constituting the signal from the single signal source. Next, the rise and fall of the previously obtained frequency component are compared by noticing a Bregman rule and the frequency component which is the same in either of the rise or fall time is extracted. The frequency component of the single signal source is identified and is reconstituted, by which the separation of the single signal source is made possible.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、信号分離方法及び
装置に関し、より具体的には、例えば、生活環境下にお
ける音声信号と環境雑音の混合音、及び複数の楽器の同
時演奏音等の、複数の音源からの音響信号の混合信号か
ら所望の音源の信号を分離する方法及び装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method and apparatus for separating signals, and more specifically, for example, to a mixed sound of a voice signal and environmental noise in a living environment and a simultaneous performance sound of a plurality of musical instruments. The present invention relates to a method and an apparatus for separating a signal of a desired sound source from a mixed signal of acoustic signals from a plurality of sound sources.

【0002】[0002]

【従来の技術】従来、音響信号の分離にはくし型フィル
タ等が使用されているが、特定の周波数帯域の音声信号
又は音響信号以外の信号を分離するのは困難であった。
2. Description of the Related Art Conventionally, a comb filter or the like has been used for separating an acoustic signal, but it has been difficult to separate a signal other than a sound signal or a sound signal in a specific frequency band.

【0003】特開平10−228296号公報に記載の
音響信号分離方法では、混合信号を複数の音源に分離す
ることは可能であるが、基本的にテンプレートマッチン
グ法を採用するので、予め対象の信号に含まれている可
能性のある波形をテンプレートとしてすべて記憶してお
く必要がある。従って、対象の信号に含まれる信号又は
音源の性質が未知である場合、正確に信号を分離出来
ず、柔軟性に欠ける。
In the acoustic signal separation method described in Japanese Patent Application Laid-Open No. 10-228296, it is possible to separate a mixed signal into a plurality of sound sources. However, since a template matching method is basically adopted, a target signal It is necessary to store all the waveforms that may be included in the template as a template. Therefore, when the properties of the signal or the sound source included in the target signal are unknown, the signal cannot be accurately separated and lacks flexibility.

【0004】特開平05−127668号公報には、ウ
ェーヴレット変換により音響信号からMIDIコード等
を自動採譜する方法が開示されている。しかし、この公
報には、信号源が単一の周波数成分の純音ではなく、複
数の周波数成分が重畳した複合信号であり、且つその信
号源が複数個存在するというような複雑な構成の混合信
号に対して、MIDIコードを正確に得るための手段は
開示されていない。
Japanese Patent Application Laid-Open No. 05-127668 discloses a method for automatically transcribing MIDI codes and the like from audio signals by wavelet transform. However, this publication discloses that a signal source is not a pure tone of a single frequency component, but a complex signal in which a plurality of frequency components are superimposed, and a mixed signal having a complicated configuration in which a plurality of signal sources exist. On the other hand, means for accurately obtaining a MIDI code is not disclosed.

【0005】[0005]

【発明が解決しようとする課題】しかし、通常の生活環
境等においては、複数且つ不特定の音源からの音響信号
又は音声信号が混在している。このような状況で、周波
数帯域及び信号波形等を特定せずに、所望の音源からの
信号を分離する手段が望まれている。
However, in a normal living environment or the like, sound signals or sound signals from a plurality of unspecified sound sources are mixed. In such a situation, a means for separating a signal from a desired sound source without specifying a frequency band, a signal waveform, or the like is desired.

【0006】本発明は、このような要望を満たし、複数
の信号源からの信号の混合信号から所望の信号源の信号
を分離する信号分離方法及び装置を提示することを目的
とする。
SUMMARY OF THE INVENTION It is an object of the present invention to satisfy such a demand and to provide a signal separating method and apparatus for separating a signal of a desired signal source from a mixed signal of signals from a plurality of signal sources.

【0007】[0007]

【課題を解決するための手段】本発明に係る信号分離方
法は、観察信号が複数の信号源からの信号の混合信号を
分離する信号分離方法であって、当該混合信号を時間的
に連続解析して単一の信号源毎に分離する解析分離ステ
ップと、当該分離ステップの分離結果から所望の信号源
の信号を再構成する再構成ステップとを有することを特
徴とする。
SUMMARY OF THE INVENTION A signal separation method according to the present invention is a signal separation method in which an observation signal separates a mixed signal of signals from a plurality of signal sources. And a reconstructing step of reconstructing a signal of a desired signal source from a result of the separation in the separating step.

【0008】本発明に係る信号分離装置は、観察信号が
複数の信号源からの信号の混合信号を分離する信号分離
装置であって、当該混合信号を時間的に連続解析して単
一の信号源毎に分離する解析分離手段と、当該分離手段
の分離結果から所望の信号源の信号を再構成する再構成
手段とを有することを特徴とする。
A signal separating apparatus according to the present invention is a signal separating apparatus for separating a mixed signal of observation signals from signals from a plurality of signal sources. It is characterized by having analysis separation means for separating each source, and reconstruction means for reconstructing a signal of a desired signal source from the separation result of the separation means.

【0009】[0009]

【実施例】以下、図面を参照して、本発明の実施例を詳
細に説明する。
Embodiments of the present invention will be described below in detail with reference to the drawings.

【0010】図1は、本発明の一実施例の概略構成とフ
ローチャートを示す図である。音響信号では、Breg
manの4つの発見的法則がある。すなわち、 (1)共通の立上り/立下りに関する規則 (2)漸近的変化に関する規則 (3)調波関係に関する規則 (4)一つの音響事象に生じる変化に関する法則であ
る。 最後の法則(4)は、「一つの音響事象に生じる変化は
その音を構成する各成分に同じ様な影響を与える」とい
う意味である。
FIG. 1 is a diagram showing a schematic configuration and a flow chart of an embodiment of the present invention. For audio signals, Breg
There are four heuristic rules of man. That is, (1) rules relating to common rise / fall, (2) rules relating to asymptotic changes, (3) rules relating to harmonic relationships, and (4) rules relating to changes occurring in one acoustic event. The last rule (4) means that a change occurring in one acoustic event has a similar effect on each component constituting the sound.

【0011】本実施例では、これらの規則または法則を
物理的制約条件として利用して、複数の音響信号からな
る混合信号から所望の音響信号を分離する。
In this embodiment, a desired acoustic signal is separated from a mixed signal composed of a plurality of acoustic signals by using these rules or rules as physical constraints.

【0012】Bregmanの法則(3)に着目し、打
楽器等の一部の楽器を除いた多くの楽器音の周波数成分
が調波構造を成すことを利用する。所定の周波数分解能
により入力信号の周波数成分に分解し、基本周波数成分
と中心周波数が倍音関係にある周波数成分とを抽出し、
調波構造が検出されるまで、順次、周波数分解能の変更
を繰り返す。
Paying attention to Bregman's law (3), it utilizes the fact that the frequency components of many instrument sounds excluding some instruments such as percussion instruments form a harmonic structure. Decompose into frequency components of the input signal with a predetermined frequency resolution, and extract the fundamental frequency component and the frequency component whose center frequency is in a harmonic relationship,
The change of the frequency resolution is sequentially repeated until the harmonic structure is detected.

【0013】本実施例では、解析開始時には、観察信号
(分離対象の信号)に含まれる基本周波数及び倍音成分
の周波数は未知であることを前提とする。例えば、人の
可聴域を参考とすると、人の可聴域は一般に約20〜2
0,000Hzにあるとされるので、初期設定する周波
数分解能を可聴域の低周波側として最低通過周波数を2
0Hzに設定し、最低通過周波数の整数倍の周波数40
Hz、60Hz、80Hz、・・・、20,000Hz
のフィルタバンクを形成し、その通過帯域幅を基本周波
数と同等の20Hzとして観察信号をろ波する。
In this embodiment, it is assumed that, at the start of the analysis, the fundamental frequency and the frequency of the harmonic component contained in the observation signal (signal to be separated) are unknown. For example, referring to the audible range of a person, the audible range of a person is generally about 20-2.
Since the frequency is set to be 0000 Hz, the frequency resolution to be initially set is set to the lower frequency side of the audible range, and the lowest pass frequency is set to 2
Set to 0Hz, frequency 40 which is an integral multiple of the lowest passing frequency
Hz, 60Hz, 80Hz, ..., 20,000Hz
Is formed, and the observation signal is filtered by setting the pass bandwidth to 20 Hz which is equivalent to the fundamental frequency.

【0014】近接する周波数帯域に周波数成分が現われ
れば、調波構造判定部が、調波構造を形成し単一信号源
を構成する周波数成分の候補と判定する。初期周波数分
解能設定機能により観察信号の性質を知らずに第1回目
の周波数分解を定めても、上手く調波構造を捉えること
は難しい。そこで、本実施例では、周波数分解能変更部
により、例えば、順次、最低通過周波数をシフトさせる
操作を繰り返す。第2回目の操作では、高周波側に最低
通過周波数をnHz変更すると、最低通過周波数は(2
0+n)Hzとなり、高域側の通過周波数は(40+2
n)Hz、(60+3n)Hz、(80+4n)Hz、
・・・、(20,000+1000n)Hzとなる。こ
の周波数分解能変更操作の繰り返しにより、やがて中心
周波数が整数倍の倍音成分群が検出され、これが単一信
号源からの信号を構成する候補の周波数成分となる。こ
の、周波数分解能を順次変更して周波数分解を反復して
繰り返す手段により、未知の信号源からの信号を構成す
る調波構造の周波数成分の候補を得ることができる。
If a frequency component appears in an adjacent frequency band, the harmonic structure determination unit determines a candidate for a frequency component forming a harmonic structure and constituting a single signal source. Even if the first frequency resolution is determined by the initial frequency resolution setting function without knowing the nature of the observation signal, it is difficult to capture the harmonic structure well. Therefore, in the present embodiment, the frequency resolution changing unit repeats, for example, an operation of sequentially shifting the lowest pass frequency. In the second operation, when the lowest pass frequency is changed to nHz on the high frequency side, the lowest pass frequency becomes (2
0 + n) Hz, and the pass frequency on the high frequency side is (40 + 2).
n) Hz, (60 + 3n) Hz, (80 + 4n) Hz,
.., (20,000 + 1000n) Hz. By repeating this frequency resolution changing operation, a harmonic component group whose center frequency is an integral multiple is eventually detected, which becomes a candidate frequency component constituting a signal from a single signal source. By this means for sequentially changing the frequency resolution and repeating and repeating the frequency decomposition, it is possible to obtain a candidate for a frequency component of a harmonic structure constituting a signal from an unknown signal source.

【0015】上述のように、単純に周波数分解能をシフ
トするようにすると、シフトの刻み幅の設定が広すぎる
場合に、最適周波数分解能を飛び越して最適周波数分解
能を検出出来ないことがある。又は、フィルタの通過帯
域幅と解析信号の帯域幅が合致せずに、周波数成分が検
出されないこともある。しかし、周波数分解能変更部及
び解析条件変更部は、調波構造が検出されるまで周波数
分解能、又はフィルタを用いる場合にはそのフィルタの
通過帯域幅などの解析条件を変更して、調波構造が検出
されるまで解析条件の変更操作を繰り返す。これによ
り、調波構造が有るのに誤って無しと判定するのを防止
できる。
As described above, if the frequency resolution is simply shifted, the optimum frequency resolution may not be detected by skipping the optimum frequency resolution when the setting of the shift width is too wide. Alternatively, the frequency component may not be detected because the pass bandwidth of the filter does not match the bandwidth of the analysis signal. However, the frequency resolution changing unit and the analysis condition changing unit change the analysis conditions such as the frequency resolution or, if a filter is used, the pass bandwidth of the filter until the harmonic structure is detected, and the harmonic structure is changed. The operation of changing the analysis conditions is repeated until a detection is made. Thus, it is possible to prevent a false determination that there is no harmonic structure.

【0016】解析条件変更手段の詳細を限定せずに、例
えば調波構造の探索を早めるには、分解された周波数成
分の信号の大きさの情報を参照すればよい。ニュートン
法又は最急降下法などの、何らかの収束アルゴリズムを
用いるのが適当である。ニュートン法を用いる場合、周
波数分解能のシフト幅と検出される周波数成分の信号の
大きさ変化を傾きとする関数を定義し、その解を求める
ことで、通常3回程度で実用レベルに収束し、最適周波
数分解能を得ることが出来る。
In order to expedite the search for the harmonic structure, for example, without limiting the details of the analysis condition changing means, it is sufficient to refer to information on the magnitude of the signal of the decomposed frequency component. It is appropriate to use some convergence algorithm, such as Newton's method or steepest descent method. In the case of using the Newton method, a function that defines the gradient of the shift width of the frequency resolution and the change in the magnitude of the signal of the detected frequency component is defined, and the solution is obtained. The optimum frequency resolution can be obtained.

【0017】図1に示すフローにおける「解析継続判定
部1:解析終了条件に達したか」は、真に調波構造が無
い場合、又は、実用上は無視出来る程度の周波数成分し
か存在しない場合に、無限ループに陥るのを避けるため
に設けられている。予め所定の解析終了条件を定め、処
理を強制終了させる。
In the flow shown in FIG. 1, "analysis continuation judging section 1: whether or not the analysis end condition has been reached" means that there is no truly harmonic structure, or that there are practically negligible frequency components. Is provided to avoid falling into an infinite loop. A predetermined analysis end condition is determined in advance, and the process is forcibly ended.

【0018】Bregmanの規則(1)に着目し、先
に得られた周波数成分の立上り立下りを比較し、立上り
及び立下り時間の少なくとも一方が同一である周波数成
分を抽出する。調波構造だけでなく、立上り立下り時間
にも注目するのは、異なる信号源の周波数成分でありな
がら、何らかの事情で周波数帯域が近接している結果、
上述の手段だけでは同一信号源の周波数成分と見なされ
てしまう成分を弁別除去し、異なる信号源の周波数成分
を誤って再構成してしまうのを防止するためである。こ
の結果、信号源分離精度が向上する。
Focusing on Bregman's rule (1), the rise and fall of the previously obtained frequency components are compared, and frequency components having at least one of the same rise and fall times are extracted. Focusing not only on the harmonic structure but also on the rise and fall times, the frequency components of different signal sources, but as a result of the fact that the frequency bands are close for some reason,
This is because the components that are regarded as the frequency components of the same signal source are discriminated and removed only by the above-described means, and the frequency components of different signal sources are prevented from being erroneously reconstructed. As a result, signal source separation accuracy is improved.

【0019】立上り時間及び立下り時間の両方に注目す
るか、片方だけに注目するかを選択可能にしたのは、以
下の理由による。すなわち、第1に、解析対象信号の全
体を一度に走査する場合、一般的には、立上り時間と立
下り時間の両方に注目する方が分離精度が向上すると考
えられる。しかし、信号の継続時間が未知の場合には、
必ずしもそうとは言えない。本実施例では、観察対象信
号全体の時間長に対し、解析のために読み込む時間長を
特に定めない。従って、解析時間長を短く区分し、これ
を時間的に連続して繰り返す解析を行う場合、解析に当
たり解析時間内で常に立上りと立下りの両方を観察でき
る保証が無い。例えば、解析時間が信号の継続時間に対
して相対的に短い場合、周波数成分が時間的に区切られ
てしまい、同一解析時間内では立上りか立下りのどちら
か一方しか観察できないことがありうる。
The reason why it is possible to select whether to pay attention to both the rise time and the fall time or only one of them is as follows. That is, first, when scanning the entire analysis target signal at once, it is generally considered that focusing on both the rise time and the fall time improves the separation accuracy. However, if the duration of the signal is unknown,
Not necessarily. In this embodiment, the time length to be read for analysis is not particularly defined with respect to the time length of the entire observation target signal. Therefore, when the analysis time length is divided into short lengths and the analysis is repeated continuously in time, there is no guarantee that both the rise and the fall can always be observed within the analysis time. For example, if the analysis time is relatively short with respect to the duration of the signal, the frequency components are temporally separated, and only one of the rise and fall may be observed within the same analysis time.

【0020】第2に、信号源から信号を採取する際の音
圧レベルの検出精度、及び信号源の音圧レベルの立上り
立下り特性等により、観察される立上り時間又は立下り
時間が見かけ上ずれることがある。信号の大きさの時間
的立上りが極めて緩やかであるか、又は、検出精度が観
察信号レベルに対し不充分である場合、真の信号立上り
時間より遅れた時間が立上り時間として検出される。全
ての周波数成分が同じ時間幅だけずれてその立上り時間
が検出されるならば、解析への影響は少ないが、本来、
同一信号源であっても特定の周波数成分が見かけ上、立
上り時間が遅い場合に、別な信号源の信号の周波数成分
として誤認識されてしまう懸念がある。同様に、信号の
立下り解析時にも、真の信号立下り時間より速い立下り
であると誤認識されることがある。
Second, the apparent rise time or fall time is apparent due to the detection accuracy of the sound pressure level at the time of sampling the signal from the signal source, and the rise and fall characteristics of the sound pressure level of the signal source. May shift. If the temporal rise of the signal magnitude is extremely slow or the detection accuracy is insufficient for the observation signal level, a time later than the true signal rise time is detected as the rise time. If the rise time is detected with all frequency components shifted by the same time width, the effect on the analysis is small, but originally,
Even if the same signal source has a specific rise in apparent rise time, there is a concern that a specific frequency component may be erroneously recognized as a frequency component of a signal from another signal source. Similarly, when analyzing the fall of a signal, it may be erroneously recognized that the fall is faster than the true signal fall time.

【0021】立上り時間及び立下り時間の双方の一致す
る周波数成分だけに注目して単一信号源の周波数成分を
抽出する場合、この第1又は第2の事態に陥いったとき
に、過剰に成分を振り落とす危険性があり、却って再生
信号の品質劣化を招く虞がある。
When the frequency component of a single signal source is extracted by paying attention only to the frequency component where both the rise time and the fall time coincide, when the first or second situation occurs, excessively There is a danger that components will be shaken off, which may lead to deterioration of the quality of the reproduced signal.

【0022】そこで、本実施例では、立上り時間及び立
下り時間のどちらか一方が一致した場合に、単一信号源
の周波数成分であると同定することにした。本実施例で
解析時間長を短く区切る第1の理由は、使用メモリ容量
の削減であるが、第2の理由は、解析を連続的に行うこ
とにより、観察信号の読み込みから僅かな時間遅れで信
号解析結果を得られるので、ほぼリアルタイムな解析環
境が得られるからである。
Therefore, in the present embodiment, when either one of the rise time and the fall time coincides, the frequency component of the single signal source is identified. The first reason for shortening the analysis time length in the present embodiment is to reduce the used memory capacity, but the second reason is that the analysis is performed continuously, with a slight time delay from the reading of the observation signal. This is because a signal analysis result can be obtained, and an almost real-time analysis environment can be obtained.

【0023】本実施例では更に、Bregmanの規則
(2)にも注目し、信号の代表的大きさにより周波数成
分を時間的に区分する。この目的は、同一周波数帯域に
別な信号源の信号成分が重畳した場合に、これを分離で
きるようにすることである。Bregmanの規則
(2)を適用し、同一信号源の中では基本的に音圧レベ
ルは漸近的に変化すると捉える。即ち、同一周波数帯域
内であっても急に信号の大きさが大きくなる又は小さく
なる等、信号の大きさに不連続が観察された場合には、
別の信号源の信号であると判断して、時間的に切り分け
てから再構成する。
In this embodiment, attention is also paid to Bregman's rule (2), and the frequency components are temporally divided according to the representative magnitude of the signal. An object of the present invention is to be able to separate a signal component of another signal source when the signal component is superimposed on the same frequency band. Applying Bregman's rule (2), it is considered that the sound pressure level basically changes asymptotically within the same signal source. That is, even if the signal magnitude suddenly increases or decreases even within the same frequency band, if a discontinuity is observed in the signal magnitude,
Judgment is made of a signal from another signal source, and the signal is temporally separated and then reconstructed.

【0024】更に本実施例では、ピアノの音の様に急激
な音圧レベルの立上りをみせる信号源にも対応できる。
即ち、上述のように、信号の代表的大きさを平均的に捉
えるだけでは、急激な立上りピークが不連続点とみなさ
れ、ピーク位置で別の信号源として区分されてしまう。
ここで、Bregmanの法則(4)を適用すると、周
波数分解された他の成分にもピーク点は観察され、これ
を信号の代表的大きさとして複数の周波数成分をグルー
プ化して同一信号源の周波数成分として抽出できる。即
ち、他の周波数成分との対比によって、同一周波数帯域
に別な信号源の成分が重畳した場合にもこれらを分離で
きる。
Further, the present embodiment can cope with a signal source which shows a sudden rise in sound pressure level like a piano sound.
That is, as described above, if the representative magnitude of the signal is merely averaged, the sudden rising peak is regarded as a discontinuous point, and the peak position is classified as another signal source.
Here, when Bregman's law (4) is applied, a peak point is also observed in other frequency-resolved components, and a plurality of frequency components are grouped by using this as a representative magnitude of a signal to obtain a frequency of the same signal source. Can be extracted as a component. That is, even when components of different signal sources are superimposed on the same frequency band, these components can be separated by comparison with other frequency components.

【0025】このような手段を設けることで、単一信号
源の周波数成分を同定し、これを再構成することによ
り、単一信号源の信号を分離できる。
By providing such means, the frequency component of a single signal source can be identified and reconstructed to separate the signal of the single signal source.

【0026】更に、本実施例では、図1に示す解析継続
判定部2及び解析継続判定部3により、一旦、信号源が
同定され再構成出力されても、周波数分解能の初期設定
が低周波側の場合であれば周波数分解能を更に高周波寄
りに更新し、再び以上の処理を施すことにより、基本周
波数が高周波にシフトした異なる単一音源を順次、同定
し再構成して出力することができる。この反復操作は、
外部から強制的な解析中止入力が無い限り、所定の周波
数分解能に達するか又は信号成分が無くなる迄、継続す
る。これにより、観察信号に含まれる全ての信号源を同
定して、その出力信号を抽出できる。
Furthermore, in this embodiment, even if the signal source is once identified and reconstructed and output by the analysis continuation determining unit 2 and the analysis continuation determining unit 3 shown in FIG. In this case, the frequency resolution is further updated to a higher frequency, and the above processing is performed again. Thus, different single sound sources having the fundamental frequency shifted to the higher frequency can be sequentially identified, reconstructed, and output. This iterative operation
Unless a forced analysis stop input is received from the outside, the processing is continued until a predetermined frequency resolution is reached or no signal component is present. Thereby, all the signal sources included in the observation signal can be identified, and the output signal can be extracted.

【0027】このようにして、各音源の信号は独立して
再生されるが、図2に示すフロチャートのように変更す
ることで、任意の数の信号源を合成して同時に出力する
ことが可能になる。すなわち、再構成された単一音源信
号を順次、再構成信号記憶部に記憶させ、指示された信
号源の信号のみを合成して出力する。
In this manner, the signals of the respective sound sources are reproduced independently. However, by changing the signal as shown in the flowchart of FIG. 2, an arbitrary number of signal sources can be synthesized and output simultaneously. Will be possible. That is, the reconstructed single sound source signals are sequentially stored in the reconstructed signal storage unit, and only the signal of the designated signal source is synthesized and output.

【0028】例えば、4つの楽器A,B,C,Dからの
信号の混合信号から再構成信号出力結果を得たとする。
各楽器の再構成信号出力結果と、各楽器に対応する記憶
部格納番号を知れば、合成信号指示として再構成信号記
憶部の格納番号を再構成信号合成部に入力することで、
例えば、楽器Aと楽器Bの信号のみを合成した合成信号
出力を得ることができる。また、楽器A,B,Cを指定
すれば、楽器Dの信号のみを除いた合成信号が得られ
る。いうまでもないが、単一音源を指定すれば、例え
ば、楽器の演奏をバックにした歌曲の場合に、歌声のみ
を抽出できる。
For example, assume that a reconstructed signal output result is obtained from a mixed signal of signals from four musical instruments A, B, C, and D.
When the reconstructed signal output result of each instrument and the storage unit storage number corresponding to each instrument are known, by inputting the storage number of the reconstructed signal storage unit to the reconstructed signal combining unit as a composite signal instruction,
For example, a synthesized signal output obtained by synthesizing only the signals of the musical instrument A and the musical instrument B can be obtained. If the musical instruments A, B and C are designated, a synthesized signal excluding only the signal of the musical instrument D can be obtained. Needless to say, if a single sound source is designated, for example, in the case of a song with the performance of a musical instrument, only the singing voice can be extracted.

【0029】図3は、解析処理のフローチャートを示
し、図4は、図3の時間・周波数解析部のフローチャー
トを示す。例えば、解析の初期には図1に示すフローを
用い、図1及び図4に示される周波数分解能記憶部に、
観察信号を単一信号源に分解するための周波数分解能を
保存する。図1のフローによる解析が一巡した段階で、
図3及び図4にフローに示す解析の並列処理を実行す
る。先ず、図3に示される信号分配部により、解析信号
を図4に示す少なくとも2ケ以上予め用意された時間周
波数解析部(n)に所定数、分配する。次に、図4に示
す周波数分解能部から所定の周波数分解能を得て信号を
解析する。楽器の合奏など、音源の数が限定されている
場合、又は話者が限定されている状態で音声信号のみ分
離したい場合などでは、反復ループを用いないので解析
負荷が低減される。並列処理により処理を高速化でき
る。
FIG. 3 shows a flowchart of the analysis processing, and FIG. 4 shows a flowchart of the time / frequency analysis unit of FIG. For example, at the beginning of the analysis, the flow shown in FIG. 1 is used, and the frequency resolution storage unit shown in FIG. 1 and FIG.
The frequency resolution for decomposing the observation signal into a single signal source is preserved. At the stage when the analysis by the flow of FIG.
The parallel processing of the analysis shown in the flow in FIGS. 3 and 4 is executed. First, the signal distribution unit shown in FIG. 3 distributes a predetermined number of analysis signals to at least two or more time-frequency analysis units (n) shown in FIG. Next, a predetermined frequency resolution is obtained from the frequency resolution unit shown in FIG. 4 to analyze the signal. When the number of sound sources is limited, such as ensemble of musical instruments, or when it is desired to separate only audio signals in a state where the number of speakers is limited, a repetitive loop is not used, so that the analysis load is reduced. Processing can be sped up by parallel processing.

【0030】以下、本実施例をより具体的に説明する。
本実施例による解析には、基本的に、 (1)周波数成分に分解された情報 (2)時間軸上の情報 (3)信号の大きさの情報 の3つの情報が得られればよく、特定の解析手法に限定
されない。一つの手法として、帯域を細かく区分したフ
ィルタバンクによりろ波することにより、上述の
(1)、(2)及び(3)の情報が得られる。別な手法
としては例えばFFTを用いると、(1)と(3)の情
報が容易に得られる。(2)の情報は得られないが、単
なるFFTではなく、短時間FFTを時間的に連続して
用い、各時間区分毎の結果を逐次比較することにより、
ある周波数成分が何時立上り、何時立下ったかをスペク
トル成分の有無から判定できる。
Hereinafter, this embodiment will be described more specifically.
Basically, the analysis according to the present embodiment only needs to obtain three pieces of information: (1) information decomposed into frequency components, (2) information on a time axis, and (3) information on a signal magnitude. The analysis method is not limited to this. As one method, the above-mentioned information (1), (2) and (3) can be obtained by filtering with a filter bank in which the band is finely divided. As another method, for example, when FFT is used, the information of (1) and (3) can be easily obtained. Although the information of (2) cannot be obtained, it is not a simple FFT, but a short-time FFT is used continuously in time, and the results for each time section are sequentially compared,
It is possible to determine when a certain frequency component rises and when it falls based on the presence or absence of the spectral component.

【0031】ウェーヴレット変換を用いる解析法を詳細
に説明する。ウェーヴレット変換を用いることにより、
以下の効果がある。すなわち、第1に、周波数分解能が
2進移動するので、変換結果は、中心周波数が2倍毎に
設定されるフィルタバンクでろ波したのと等価になる。
ウェーヴレット変換は、フーリエ変換のように周波数解
析だけでなく、時間・周波数解析を行うので、周波数分
解された結果に時間情報も保存される。従って、隣り合
うレベルに同時に周波数成分が現われれば、調波構造を
容易に探索出来る。第2に、周波数分解する際の基底関
数が直交性を持つことを利用すると、分解・再構成アル
ゴリズムが確定しいるので、分解した成分から正確に信
号源を再生できる。
An analysis method using the wavelet transform will be described in detail. By using the wavelet transform,
The following effects are obtained. That is, first, since the frequency resolution moves in a binary manner, the conversion result is equivalent to that obtained by filtering with a filter bank in which the center frequency is set every two times.
Since the wavelet transform performs not only a frequency analysis but also a time / frequency analysis like a Fourier transform, time information is stored as a result of frequency decomposition. Therefore, if frequency components appear simultaneously on adjacent levels, the harmonic structure can be easily searched. Second, by utilizing the fact that the basis functions for frequency decomposition have orthogonality, the decomposition / reconstruction algorithm is determined, so that the signal source can be accurately reproduced from the decomposed components.

【0032】ウェーヴレット変換は一般に下記の数1で
定義される。すなわち、
The wavelet transform is generally defined by the following equation (1). That is,

【0033】[0033]

【数1】 (Equation 1)

【0034】[0034]

【数2】 但し、aは、スケールパラメータ、bはトランスレート
である。解析対象の信号関数f(x)と時間・周波数解
析の基底関数となるアナライジング・ウェーヴレットψ
(x)とを畳み込み積分する。ウェーヴレット変換の特
徴は、アナライジング・ウェーヴレットが数2の条件を
満たし、時間軸上を走査していく際に(トランスレート
bの値を増していくと)、周波数分解能を示すスケール
パラメータaの値が自動的に変化し、連続的に周波数成
分に展開される。このスケールパラメータが自動的に変
化する機能を、解析対象信号に対するズームイン/ズー
ムアウト機能と呼ぶ。これにより、解析対象の周波数成
分が未知であっても周波数成分に適合した最小の分解能
が自動的に得られ、図1及び図2のフローにおける初期
周波数分解能を設定するステップを省略できる。解析対
象の信号の周波数成分が未知の場合に特に有効である。
(Equation 2) Here, a is a scale parameter, and b is a translate. Analyzing wavelet which is a signal function f (x) to be analyzed and a basis function for time / frequency analysis.
(X) is convolved and integrated. The feature of the wavelet transform is that, when the analyzing wavelet satisfies the condition of Equation 2 and scans on the time axis (when the value of translate b is increased), the scale parameter a indicating the frequency resolution Automatically changes and is continuously developed into frequency components. The function of automatically changing the scale parameter is called a zoom-in / zoom-out function for a signal to be analyzed. Thus, even if the frequency component to be analyzed is unknown, the minimum resolution suitable for the frequency component is automatically obtained, and the step of setting the initial frequency resolution in the flow of FIGS. 1 and 2 can be omitted. This is particularly effective when the frequency component of the signal to be analyzed is unknown.

【0035】ウェーヴレット変換を用いる場合、図1の
周波数成分分解部は数1によるウェーヴレット変換を実
行する部分に相当する。通常、ウェーヴレット変換で
は、自動的なズームイン/ズームアウト機能により、解
析対象信号を時間軸上に走査していく際にスケールパラ
メータの最小値が自動的に決定する。図5は、ウェーヴ
レット変換による時間・周波数解析の模式図を示す。レ
ベル−1は最も高周波寄りの周波数成分を示す。以下、
レベルが下がる毎に、レベル内の周波数帯域の中心周波
数は前述の様に2進移動する。
In the case where the wavelet transform is used, the frequency component decomposition unit in FIG. 1 corresponds to a portion for executing the wavelet transform according to Equation 1. Normally, in the wavelet transform, a minimum value of a scale parameter is automatically determined when an analysis target signal is scanned on a time axis by an automatic zoom-in / zoom-out function. FIG. 5 shows a schematic diagram of time / frequency analysis by wavelet transform. Level-1 indicates the frequency component closest to the high frequency. Less than,
Each time the level decreases, the center frequency of the frequency band within the level moves in a binary manner as described above.

【0036】ウェーヴレット変換における各レベルの中
心周波数が、解析対象の音声又は音響信号の基本周波数
及び倍音周波数と一致すれば、図5のレベル−2及び−
3又はレベル−4と−5に示すように、倍音成分が各レ
ベル間に展開された結果を得る。しかし、各レベルの中
心周波数と解析対象信号の各倍音成分の周波数が不一致
の場合、周波数成分は特定のレベルに集中せずに各レベ
ル間に無相関に分散してしまい、どのレベルとどのレベ
ルの成分を選べば元の音を再構成するかの手掛かりを得
ることが出来ない。場当たり的にレベル同士を再構成し
ても、他の音源の成分が含まれている可能性も高く、各
レベルに展開する前の元の信号源を正確に再構成できる
保証はない。
If the center frequency of each level in the wavelet transform matches the fundamental frequency and the overtone frequency of the speech or acoustic signal to be analyzed, the level-2 and -2 in FIG.
As shown at 3 or levels -4 and -5, a result is obtained in which the harmonic components are developed between the levels. However, when the center frequency of each level and the frequency of each harmonic component of the signal to be analyzed do not match, the frequency components are not concentrated on a specific level and are scattered uncorrelated between the levels. If you select the component, you cannot get a clue as to whether to reconstruct the original sound. Even if the levels are reconfigured on an ad hoc basis, there is a high possibility that components of other sound sources are included, and there is no guarantee that the original signal source before being expanded to each level can be accurately reconfigured.

【0037】そこで、本実施例では、通常のウェーヴレ
ット変換の様にアナライジングウェーヴレットのスケー
ルパラメータの値を数1から自動的に決定するのではな
く、以下の方法を採用することにした。すなわち、先ず
周波数解析された結果、隣接するレベル間同士に周波数
成分が現れ、各レベルに倍音成分が分配されているかど
うかを、調波構造判定部(図1)により判定する。ここ
では、ウェーヴレット変換を用いているので、図5に示
すように隣接するレベル同士に成分が集中して出現する
かどうかで、容易に判定できる。
Therefore, in the present embodiment, the following method is adopted instead of automatically determining the value of the scale parameter of the analyzing wavelet from Equation 1 as in the ordinary wavelet transform. That is, as a result of frequency analysis, frequency components appear between adjacent levels, and it is determined by the harmonic structure determination unit (FIG. 1) whether or not harmonic components are distributed to each level. Here, since the wavelet transform is used, it is possible to easily determine whether or not components appear concentrated at adjacent levels as shown in FIG.

【0038】成分が無相関に分散している場合、周波数
分解能変更部(図1)を用いる。一度目の信号走査で自
動的にズームインした結果、得られたスケールパラメー
タの最小値を周波数分解能記憶部に記憶しておき、二度
目以降のウェーヴレット変換の際には、この最小値の使
用を許可せずに適当なきざみ幅で使用許可するスケール
パラメータの最小値を順次微増していく。これにより、
周波数分解能変更操作を容易に実現できる。
When the components are scattered uncorrelatedly, the frequency resolution changing unit (FIG. 1) is used. The minimum value of the scale parameter obtained as a result of automatically zooming in in the first signal scan is stored in the frequency resolution storage unit, and this minimum value is used for the second and subsequent wavelet transforms. The minimum value of the scale parameter that is permitted to be used in an appropriate step width without permission is gradually increased. This allows
The frequency resolution changing operation can be easily realized.

【0039】この操作を、中心周波数が2倍づつの構成
のフィルタバンクで捉えるなら、初期に構成されるフィ
ルタバンクは、各レベルの中心周波数が分離したい信号
源の周波数成分より高周波側にずれていても、調波構造
判定部による反復操作により帯域が順次シフトし、分離
したい信号に最適なフィルタバンクが自動的に生成され
ることを示す。
If this operation is perceived by a filter bank having a configuration in which the center frequency is doubled, the filter bank initially configured has the center frequency of each level shifted to a higher frequency side than the frequency component of the signal source to be separated. However, it is shown that the band is sequentially shifted by the repetitive operation by the harmonic structure determination unit, and the optimum filter bank for the signal to be separated is automatically generated.

【0040】くし型フィルタ又はテンプレートマッチン
グによる従来の分離方法では、無数の特性のくし型フィ
ルタ又はテンプレートを用意しなければならないのに対
し、本実施例で必要となるのは基本的には一つのアナラ
イジングウェーヴレットだけであり、処理はパラメータ
値の変更だけで済む。この結果、本実施例では、システ
ムが用意しておく情報量が大幅に少なくなり、混合信号
のブラインド分離も可能な極めて柔軟性に富んだシステ
ムを構築できる。
In the conventional separation method using the comb filter or the template matching, a comb filter or a template having innumerable characteristics must be prepared. On the other hand, in this embodiment, basically only one comb filter or a template is required. Only the analyzing wavelet, the processing only needs to change the parameter value. As a result, in this embodiment, the amount of information prepared by the system is significantly reduced, and a highly flexible system capable of blind separation of mixed signals can be constructed.

【0041】ウェーヴレット変換を用いる場合、数3に
示す逆ウエーヴレット変換式によりレベルを再構成し、
混合音の中から元の単一音源信号を再構成することがで
きる。
When the wavelet transform is used, the level is reconstructed by the inverse wavelet transform formula shown in Expression 3, and
The original single sound source signal can be reconstructed from the mixed sound.

【0042】[0042]

【数3】 (Equation 3)

【0043】[0043]

【数4】 数4は、数3の右辺を定義するためのアドミッシブル条
件である。
(Equation 4) Equation 4 is an admissible condition for defining the right side of Equation 3.

【0044】図5(1)が、観察時間tの間に得た混
合観察信号であり、時間t間をウェーヴレット変換に
より走査し、本実施例では、レベル−1から−6のウェ
ーヴレット成分に分解した。ウェーヴレット変換では、
あるレベルからより低次のレベルへの周波数展開は2進
移動するので、レベル−2とレベル−3の周波数成分は
調波構造の関係にあり、同じく、レベル−4とレベル−
5の周波数成分も調波構造の関係にある。
FIG. 5A shows the mixed observation signal obtained during the observation time t n , which is scanned by the wavelet transform during the time t n , and in this embodiment, the waves of levels -1 to -6 are obtained. Decomposed into let components. In wavelet transform,
Since the frequency expansion from a certain level to a lower level moves in a binary manner, the frequency components of level-2 and level-3 have a harmonic structure relationship, and similarly, level-4 and level-
The fifth frequency component also has a harmonic structure relationship.

【0045】レベル−2とレベル−3には、時間tna
〜tnb間に共通の立上り及び立下り時間を示す周波数
成分があり、レベル−4とレベル−5には時間tnc
間に共通の立上り及び立下り時間を示す周波数成
分がある。従ってレベル−2とレベル−3のtna〜t
nb間の周波数成分は同一の信号源成分とみなされ、同
じくレベル−4とレベル−5のtnc〜tnd間の周波
数成分もこれに続くなんらかの単一信号源の成分とみな
せる。
At the time of level-2 and level-3, the time t na
To t nb, there is a common frequency component indicating the rise and fall times, and the level -4 and the level -5 have the time t nc to
is t n d the frequency component representing a common rise and fall times between. Therefore, t na to t of level-2 and level-3
Frequency components between nb can be regarded as the same signal source is considered a component, components same level -4 and level -5 t nc ~t any single signal source frequency components followed by between nd.

【0046】立上り立下り時間判定部により、周波数解
析だけでけなく時間解析も併用している効果は次の通り
である。即ち、時間tna〜tnbが時間tnc〜t
ndに先行していること、及び、立下り時間tnbと立
上り時間tncが殆ど時間的に一致していることを、容
易に解析できる。
The effect of using not only the frequency analysis but also the time analysis by the rise / fall time determination unit is as follows. That is, the times t na to t nb are changed from the times t nc to t
nd , and that the fall time t nb and the rise time t nc almost coincide with each other can be easily analyzed.

【0047】周波数成分を再構成する際には、解析対象
の信号の素性と目的として得たい解析結果により、再構
成の方法に微妙な差異を設ける必要がある。本実施例の
場合、立上り立下り時間は異なるが、レベル−2からレ
ベル−5迄の成分は全て互いに調波構造にあるので、同
一の音源が異なる音程の音を発している可能性がある。
解析者がこの信号が楽器の音であることを知っている場
合、再構成には解析目的により2つの方法がある。
When reconstructing the frequency components, it is necessary to make a subtle difference in the reconstruction method depending on the characteristics of the signal to be analyzed and the analysis result desired to be obtained. In the case of the present embodiment, the rise and fall times are different, but since the components from level-2 to level-5 are all in a harmonic structure, there is a possibility that the same sound source emits sounds of different pitches. .
If the analyst knows that this signal is the sound of a musical instrument, there are two methods of reconstruction, depending on the purpose of the analysis.

【0048】再生信号を楽器の音として聞きたい場合に
は、以下のようにする。即ち、レベル−2から−5を時
間tna〜tnd迄まとめて再構成した方が、立上り時
間及び立下り時間を抽出する際の微弱な周波数成分の切
り落としの影響が少なく、一般に高品質の再生音を期待
できる。図5では、レベル−2,−3の周波数成分は、
時間tna〜tnbに示されているが、微弱な周波数成
分が時間tnb以降も継続していることを必ずしも否定
出来ない。一般に、高周波成分の有無は音色の違いとし
て人に知覚される事が多いので、微弱な周波数成分であ
っても再生音の品質は向上すると考えて良い。低周波側
のレベル−4,−5では、時間tna〜tnbに有意な
周波数成分が無いとみなせば(例えば、ピアノなどの場
合、一般に、急激な音圧レベルの立ち上りを示す。)、
再構成に用いても用いなくても、再生音品質には余り影
響がないと判断される。
If the user wants to hear the reproduced signal as the sound of a musical instrument, the following is performed. That is, when the levels -2 to -5 are collectively reconstructed from the time t na to t nd , the effect of cutting off the weak frequency components when extracting the rise time and the fall time is small, and generally, the quality is high. We can expect reproduction sound. In FIG. 5, the frequency components at levels -2 and -3 are
Although shown in time t na ~t nb, not necessarily can deny that weak frequency component is continuing the time t nb later. In general, the presence or absence of a high frequency component is often perceived by a human as a difference in tone, so it can be considered that the quality of reproduced sound is improved even with a weak frequency component. The low frequency side level -4, in -5, is regarded that there is no significant frequency components in the time t na ~t nb (for example, in the case of piano, generally indicates a rise of rapid sound pressure level.)
It is determined that the quality of the reproduced sound has little effect whether or not it is used for the reconstruction.

【0049】音程情報が欲しい場合には、以下のように
する。すなわち、同一楽器から連続的に信号が出ている
場合、旋律を奏でていると考えられる。音程情報を得て
自動採譜する場合、レベル−2,−3とレベル−4,−
5を分けて再生することにより、各々が独立した音程と
して再構成される。これは、音響情報をコ−ド化する処
理の前処理の機能を実現できることを示す。
If pitch information is desired, the following is performed. That is, when signals are continuously output from the same musical instrument, it is considered that a melody is being played. When obtaining pitch information and automatically transcribing, level-2, -3 and level-4,-
By playing back the five segments separately, each is reconstructed as an independent pitch. This indicates that the function of the pre-processing of the process of converting the acoustic information into a code can be realized.

【0050】図5の例では、先行するレベル−2,−3
の音は信号レベルが低く、後続するレベル−4,−5の
方が信号レベルが高いので、これが音声である場合に
は、レベル−2,−3の音は子音であり、レベル−4,
−5は母音であると判定出来る。この場合も、再生音の
品質を優先するなら、第1の場合のように、レベル−2
からレベル−5を時間tna〜tnd迄まとめて再構成
する。何故なら、子音と母音の間には、通常、わたり音
と称される過渡的部分が介在し、また、母音を単独で発
音する場合と子音との連続で発音する場合とでは母音の
波形が微妙に変化するので、まとめて連続再生した方が
より自然な音声として知覚されるからである。
In the example of FIG. 5, the preceding levels -2, -3
Has a lower signal level and the subsequent levels -4 and -5 have a higher signal level. Therefore, if this is a voice, the sounds at levels -2 and -3 are consonants, and the levels -4 and -5 are consonants.
-5 can be determined to be a vowel. Also in this case, if priority is given to the quality of the reproduced sound, as in the first case, level-2
To -5 are collectively reconstructed from time t na to t nd . Because a consonant and a vowel usually have a transitional part called a crossover, and the vowel waveform is different between a case where the vowel is pronounced alone and a case where the consonant is pronounced continuously. The reason for this is that subtle changes occur, so that continuous continuous reproduction is perceived as a more natural sound.

【0051】音声入力システム等でテキスト・コード化
することを目的とする場合には、子音と母音を分けて再
生した方が、音声認識部の負荷が低減される。
In the case where the purpose is to perform text coding by a voice input system or the like, the load on the voice recognition unit is reduced by reproducing consonants and vowels separately.

【0052】以上をまとめると、時間に無相関なレベル
−1の高周波成分を例えばノイズ成分とみなし、レベル
−6の低周波成分を例えば何らかの信号歪みとみなし
て、音源の再構成には用いず、レベル−2〜−5の周波
数成分のみを再構成することにより、単一信号源をノイ
ズ環境の中から分離抽出することが可能となる。
To summarize the above, the high-frequency component of level -1 which is uncorrelated with time is regarded as, for example, a noise component, and the low-frequency component of level -6 is regarded as, for example, some kind of signal distortion. , Level-2 to -5, it is possible to separate and extract a single signal source from the noise environment.

【0053】図6は、基本周波数が異なる2つの音の混
合信号をウェーヴレット変換した場合の波形例を示す。
図6(1)は対象となる観察信号であり、同(2)〜
(5)はアナライジングウェーヴレットψ(x)によ
る展開結果を示し、同(6)〜(11)はアナライジン
グウェーヴレットψ(x)による展開結果をそれぞれ
示す。ここで問題となるのは、同一の最小周波数分解能
のアナライジングウェーヴレットを用いると、互いの周
波数成分が倍音関係にない限り、2つの音を一度の操作
で調波構造を成す周波数成分に上手く展開出来ないこと
である。
FIG. 6 shows an example of a waveform when a mixed signal of two sounds having different fundamental frequencies is subjected to wavelet transform.
FIG. 6A shows an observation signal to be observed, and FIGS.
(5) shows a development result by the analyzing wavelet ψ n (x), and (6) to (11) show a development result by the analyzing wavelet m m (x). The problem here is that using an analyzing wavelet with the same minimum frequency resolution, unless the frequency components of each other have an overtone relationship, the two tones will work well with the frequency components forming the harmonic structure in one operation. It cannot be expanded.

【0054】個々では、各音源の調波構造を同定出来る
ように、図1に示す周波数分解能変更部及び調波構造判
定部が、アナライジング・ウェーヴレットのスケールパ
ラメータ最小値を順次変更して最適値を求め、次に、同
一立上り立下り時間周波数成分抽出部が、周波数成分を
抽出する。抽出結果再構成部が、抽出結果を再構成し
て、再生信号を出力する。
In order to identify the harmonic structure of each sound source individually, the frequency resolution changing unit and the harmonic structure judging unit shown in FIG. 1 sequentially change the minimum value of the scale parameter of the analyzing wavelet and optimize it. Then, the same rise and fall time frequency component extraction unit extracts a frequency component. An extraction result reconstruction unit reconstructs the extraction result and outputs a reproduced signal.

【0055】最小スケールパラメータがa−1=nの場
合、アナライジングウェーヴレットψ(x)による展
開では、レベル−2n,−3nを得た。
When the minimum scale parameter is a −1 = n, levels −2n and −3n are obtained by the expansion using the analyzing wavelet n n (x).

【0056】次に反復ループを再度、実行することによ
り、最小スケールパラメータa−1が、 a−1=m:(n<m) の時、ψ(x)とは異なる最小周波数分解能のアナラ
イジングウェーヴレットψ(x)による展開により、
レベル−3m〜−5mを得た。
Next, by executing the iterative loop again, when the minimum scale parameter a −1 is a −1 = m: (n <m), the analog of the minimum frequency resolution different from n n (x) is obtained. Rising Wavelet m m (x)
Levels -3m to -5m were obtained.

【0057】図6では、本実施例では最小周波数分解能
の異なるアナライジングウェ−ヴレットを用いることに
より、異なる基本周波数の複数の信号源を分離できた。
In FIG. 6, in this embodiment, a plurality of signal sources having different fundamental frequencies could be separated by using the analyzing wavelets having different minimum frequency resolutions.

【0058】図6ではまた、例えばレベル−3m〜−5
mのように信号源が広い周波数帯域に分布していても、
同一信号源の周波数成分として抽出できることを示す。
これは、例えば音源がピアノであり、和音を演奏してい
て帯域が広い場合でも、他の信号源から分離できること
を示す。従来の分離法の多くは、単旋律の分離にしか対
応してないことので、本実施例が極めて有効な方法であ
ることが分かる。
In FIG. 6, for example, levels -3m to -5
Even if the signal source is distributed over a wide frequency band like m
This shows that it can be extracted as the frequency component of the same signal source.
This indicates that even if the sound source is a piano, for example, and a chord is played and the band is wide, it can be separated from other signal sources. Since many of the conventional separation methods correspond only to single melody separation, it can be seen that this embodiment is an extremely effective method.

【0059】図7は、調波構造が類似しているが基本周
波数が異なる信号源からの信号の混合信号を展開した例
を示す。レベル−2,−3,−4とレベル−4,−5に
それぞれ異なる信号源の周波数成分が現れている。
FIG. 7 shows an example in which a mixed signal of signals from signal sources having similar harmonic structures but different fundamental frequencies is developed. Different frequency components of signal sources appear at levels -2, -3, -4 and levels -4, -5, respectively.

【0060】高周波側の信号と低周波側の信号の周波数
成分が重複しているように見えるレベル−4に着目す
る。レベル−4の周波数成分は、Bregmnの規則
(1)を適用すると、立上り立下り時間判定部により、
レベル−4の中で高周波側の信号源を構成する成分が同
じく高周波側の成分であるレベル−2,−3とほぼ同じ
立上り立下り時間tna〜tnc間にあると判定出来
る。同様に、レベル−4の中で低周波側の信号源を構成
する成分がもう一つの低周波側の成分レベル−5の立上
り立下り時間tnb〜tnd間にあると判定出来る。こ
の判定結果により、レベル−4では、時間tnb〜t
nc間に高周波側の成分と低周波側の成分が重複してい
ることが分かり、この成分を高周波側と低周波側のどち
らに含めるかが問題となる。
Attention is paid to level-4 in which the frequency components of the high-frequency signal and the low-frequency signal appear to overlap. When the Bregmn rule (1) is applied to the level-4 frequency component, the rise / fall time determination unit calculates
It can be determined that the component constituting the signal source on the high frequency side in the level-4 is between the rising and falling times t na to t nc which are almost the same as the components on the high frequency side, levels −2 and −3. Similarly, level components constituting the source of the low frequency side in -4 can be determined to be in between another lower frequency rise and fall times of the component levels -5 t nb ~t nd. According to this determination result, at level-4, the time t nb -t
It can be seen that the high frequency side component and the low frequency side component overlap between nc, and it becomes a problem whether to include this component on the high frequency side or on the low frequency side.

【0061】ここで、Bregmanの規則(1)に加
えて法則(4)を適用する。図1に示す信号の大きさ比
較判定部及び信号の大きさによるグル−ピング部が、B
regmanの規則(1)及び法則(4)を適用する。
図7において、レベル−4では時間tna〜tnd間に
周波数成分が観察されるが、時刻tnbより前の信号の
代表的大きさを、例えば振幅ピ−ク幅hに代表させ、
時刻tnbより後の信号の代表的大きさを振幅ピ−ク幅
に代表させた場合に、信号の大きさ比較判定部が両
者の信号の代表的大きさに有意な差異を判定すると、レ
ベル−4の周波数成分を時間軸上の時刻tnbの前後で
別の信号源の周波数成分として弁別できる。それを下記
式のように表現するとする。すなわち、
Here, rule (4) is applied in addition to Bregman's rule (1). The signal magnitude comparison / determination unit and the signal magnitude grouping unit shown in FIG.
regman's rule (1) and rule (4) apply.
7, the frequency components are observed between the level -4 time t na ~t nd, a representative magnitude of the signal before the time point t nb, e.g. amplitude peak - is represented click width h 4,
Representative magnitude of the signal after time t nb amplitude peak - when a representative to click width l 4, when the size comparison section of the signal to determine a significant difference in representative magnitude of the two signals , Level-4 can be discriminated as a frequency component of another signal source before and after the time t nb on the time axis. Let it be expressed as the following equation. That is,

【0062】[0062]

【数5】{h,}<{l,} 次に、信号の大きさによるグル−ピング部が、レベル−
4前後の高周波側及び低周波側の各レベル毎の信号の代
表的大きさを比較する。各レベルの信号の代表的大きさ
が高周波側の方が小さい場合、下記式のように表現する
と。即ち、
{H 4 ,} <{l 4 ,} Next, the grouping unit according to the signal magnitude is applied to the level-
The representative magnitudes of the signals at each of the four high-frequency and low-frequency levels are compared. When the representative magnitude of the signal of each level is smaller on the high frequency side, it is expressed as the following equation. That is,

【0063】[0063]

【数6】{h,h,h,}<{l,l} このように、同一周波数帯域を先ず信号の大きさで時間
区分し、次に数5及び数6に示すような条件を見出せた
場合には、レベル−4の時間tnb〜tnc間のように
成分が重複する区間の周波数成分を、信号の代表的大き
さの大きい周波数成分グル−プの方に包含されるとみな
す。
{H 2 , h 3 , h 4 , {<{l 4 , l 5 }} Thus, the same frequency band is first time-divided according to the signal magnitude, and then shown in equations 5 and 6. If such a condition can be found, the frequency components in the section where the components overlap, such as between the time t nb and t nc of the level-4, are shifted to the frequency component group having the larger signal representative magnitude. Considered included.

【0064】図7では、信号の代表的大きさとして信号
の平均ピ−ク値を利用したが、例えば低域側の信号源が
ピアノの様に急激な音圧レベルの立上りをみせる信号の
場合、Bregmanの法則(4)を適用すれば、各レ
ベルで同時に鋭い立上りを見せる周波数成分を抽出して
グル−プ化することにより、レベル−4のように同一帯
域に二つの信号源が重畳しても弁別可能となる。
In FIG. 7, the average peak value of the signal is used as the representative magnitude of the signal. For example, in the case where the signal source on the low frequency side is a signal that shows a sharp rise in sound pressure level like a piano. By applying Bregman's law (4), two signal sources are superimposed on the same band as in level-4 by extracting and grouping frequency components showing sharp rising at each level at the same time. Even discrimination is possible.

【0065】図7の場合、信号源を再構成する際に、高
周波側の再構成にはレベル−2と−3に対して時間t
na〜tnc間の成分を用い、レベル−4に対して時間
na〜tnb間の成分を用いる。低周波側の再構成で
は、レベル−4,−5に対して時間tnb〜tnd間の
成分を用いる。
In the case of FIG. 7, when reconstructing the signal source, the reconstruction on the high frequency side requires time t with respect to levels -2 and -3.
The components between na and t nc are used, and the components between times t na and t nb are used for level-4. In the reconstruction on the low frequency side, components between times t nb and t nd are used for levels −4 and −5.

【0066】時間tnb〜tnc間は、高周波数側成分
が重複して含まれているのに、これを低周波側の周波数
成分として再構成するのは、信号処理上、一見、厳密さ
を欠くかの如くみえる。しかし、再構成信号を音として
人が聴く場合を想定すると、人の聴覚特性により、低周
波側の音圧レベルの高い音により高周波側の音圧レベル
の低い音がマスキングされ聴覚上知覚され難いので、再
構成信号の品質劣化を回避できる。
Although the high-frequency component is included in the overlapped period between the times t nb and t nc , reconstructing the high-frequency component as the low-frequency component is apparently strict in terms of signal processing. It looks as if it lacks. However, assuming that a person listens to the reconstructed signal as a sound, the sound with a low sound pressure level on the high frequency side is masked by the sound with a high sound pressure level on the low frequency side and is hardly perceived aurally due to the human hearing characteristics. Therefore, quality degradation of the reconstructed signal can be avoided.

【0067】[0067]

【発明の効果】以上の説明から容易に理解できるよう
に、本発明によれば、複数の信号源からの信号の混合信
号から、元の信号源の信号を各々単独に或いは任意の数
の信号を合成して連続した分離信号として得ることがで
きる。
As can be easily understood from the above description, according to the present invention, the signals of the original signal sources can be individually or arbitrarily selected from the mixed signals of the signals from the plurality of signal sources. Can be combined to obtain a continuous separated signal.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の一実施例の概略構成とフローチャー
トを示す図である
FIG. 1 is a diagram showing a schematic configuration and a flowchart of an embodiment of the present invention.

【図2】 任意の数の信号源の信号を合成出力する概略
構成とフローチャートを示す図である。
FIG. 2 is a diagram showing a schematic configuration and a flowchart for synthesizing and outputting signals from an arbitrary number of signal sources.

【図3】 信号解析の概略構成とフローチャートを示す
図である。
FIG. 3 is a diagram showing a schematic configuration and a flowchart of signal analysis.

【図4】 時間・周波数解析部の概略構成とフローチャ
ートを示す図である。
FIG. 4 is a diagram showing a schematic configuration and a flowchart of a time / frequency analysis unit.

【図5】 本実施例による、信号源にノイズ/歪みが重
畳した信号の処理結果の模式図である。
FIG. 5 is a schematic diagram of a processing result of a signal in which noise / distortion is superimposed on a signal source according to the present embodiment.

【図6】 本実施例による、異なる周波数分解能のアナ
ライジングウェーヴレットによる信号処理結果の模式図
である。
FIG. 6 is a schematic diagram of a signal processing result by analyzing wavelets having different frequency resolutions according to the present embodiment.

【図7】 本実施例による、時間的に一部重畳した混合
信号の処理結果の模式図である。
FIG. 7 is a schematic diagram of a processing result of a mixed signal partially superimposed temporally according to the present embodiment.

Claims (20)

【特許請求の範囲】[Claims] 【請求項1】 観察信号が複数の信号源からの信号の混
合信号を分離する信号分離方法であって、 当該混合信号を時間的に連続解析して単一の信号源毎に
分離する解析分離ステップと、 当該分離ステップの分離結果から所望の信号源の信号を
再構成する再構成ステップとを有することを特徴とする
信号分離方法。
1. A signal separation method in which an observation signal separates a mixed signal of signals from a plurality of signal sources, wherein the mixed signal is analyzed continuously in time and separated for each single signal source. And a reconstruction step for reconstructing a signal of a desired signal source from a separation result of the separation step.
【請求項2】 当該解析分離ステップが、単一信号源の
信号として再構成された信号を一時的に記憶する記憶ス
テップを具備する請求項1に記載の信号分離方法。
2. The signal separation method according to claim 1, wherein the analysis separation step includes a storage step of temporarily storing a signal reconstructed as a signal of a single signal source.
【請求項3】 当該解析分離ステップが、当該混合信号
を任意の数に分配する分配ステップを具備する請求項1
に記載の信号分離方法。
3. The analysis and separation step includes a distribution step of distributing the mixed signal to an arbitrary number.
3. The signal separation method according to 1.
【請求項4】 当該解析分離ステップが、当該混合信号
を任意の周波数分解能をもって周波数成分に分解する周
波数分解ステップと、当該周波数成分間の調波構造の有
無を判定する調波構造判定ステップと、当該調波構造判
定ステップにより周波数成分が調波構造に無いと判定さ
れた場合に、調波構造を得る迄、周波数分解能等の解析
条件を順次変更する解析条件変更ステップと、当該周波
数分解ステップにより分解された周波数成分を抽出する
周波数成分抽出ステップと、当該周波数分解能を記憶す
る記憶ステップとを有する請求項1に記載の信号分離方
法。
4. The analyzing and separating step includes: a frequency decomposition step of decomposing the mixed signal into frequency components with an arbitrary frequency resolution; a harmonic structure determining step of determining whether a harmonic structure exists between the frequency components; When it is determined by the harmonic structure determination step that the frequency component is not in the harmonic structure, an analysis condition changing step of sequentially changing analysis conditions such as frequency resolution until a harmonic structure is obtained, and the frequency decomposition step The signal separation method according to claim 1, further comprising: a frequency component extracting step of extracting the decomposed frequency components; and a storing step of storing the frequency resolution.
【請求項5】 当該解析分離ステップが、周波数分解さ
れた周波数成分を時間軸で走査し信号の大きさから周波
数成分の立上り及び立下り時間を判定する立上がり立下
がり時間判定ステップと、当該周波数成分間同士の立上
り時間及び立下り時間を比較する比較ステップと、当該
立上り時間及び当該立下り時間の少なくとも一方が両者
が一致する時間区分内の周波数成分を抽出する抽出ステ
ップとを有する請求項4に記載の信号分離方法。
5. The rising / falling time determining step in which the frequency separation is performed on the time axis to determine the rising and falling times of the frequency component from the magnitude of the signal. 5. The method according to claim 4, further comprising: a comparing step of comparing a rise time and a fall time between each other, and an extraction step of extracting a frequency component in a time segment in which at least one of the rise time and the fall time matches both. The signal separation method as described.
【請求項6】 当該解析分離ステップが、同一周波数帯
域に分解された周波数成分を時間軸上で走査し、信号の
代表的大きさに不連続が観察される場合に、当該信号の
代表的大きさの継続する時間で解析対象周波数成分を区
分し抽出する解析対象周波数成分抽出ステップと、区分
された周波数成分を隣接する帯域の周波数成分と比較
し、異なる信号源の周波数成分と判定する信号源判定ス
テップとを有する請求項5に記載の信号分離方法。
6. The analysis / separation step scans frequency components decomposed into the same frequency band on a time axis, and when a discontinuity is observed in a representative magnitude of the signal, the representative magnitude of the signal is determined. An analysis target frequency component extracting step of classifying and extracting an analysis target frequency component in a continuous time, and a signal source for comparing the divided frequency component with a frequency component of an adjacent band and determining the frequency component of a different signal source The signal separation method according to claim 5, further comprising a determining step.
【請求項7】 当該再構成ステップは、周波数成分間の
調波構造が判定され、且つ当該周波数成分が立上り時間
及び立下り時間の少なくとも一方が同一と判定された周
波数成分を再構成し、出力する請求項5に記載の信号分
離方法。
7. The reconstructing step reconstructs a frequency component in which a harmonic structure between frequency components is determined, and the frequency component is determined to have at least one of a rise time and a fall time equal to each other. The signal separation method according to claim 5, wherein
【請求項8】 当該再構成ステップは、周波数成分間の
調波構造が判定され、且つ周波数成分の代表的な大きさ
により抽出された周波数成分を各信号源毎に再構成する
請求項6に記載の信号分離方法。
8. The method according to claim 6, wherein in the reconstructing step, a harmonic structure between the frequency components is determined, and the frequency components extracted based on the representative magnitude of the frequency components are reconstructed for each signal source. The signal separation method as described.
【請求項9】 当該解析分離ステップが、所定の解析条
件及び解析結果の少なくとも一方を参照して、解析を継
続・停止するステップを具備する請求項7又は8に記載
の信号分離方法。
9. The signal separation method according to claim 7, wherein the analysis separation step includes a step of continuing / stopping the analysis by referring to at least one of a predetermined analysis condition and an analysis result.
【請求項10】 解析過程の周波数分解と周波数成分の
再構成にウェーヴレット変換を用いる請求項7又は8に
記載の信号分離方法。
10. The signal separation method according to claim 7, wherein a wavelet transform is used for frequency decomposition and frequency component reconstruction in an analysis process.
【請求項11】 観察信号が複数の信号源からの信号の
混合信号を分離する信号分離装置であって、 当該混合信号を時間的に連続解析して単一の信号源毎に
分離する解析分離手段と、 当該分離手段の分離結果から所望の信号源の信号を再構
成する再構成手段とを有することを特徴とする信号分離
装置。
11. A signal separation apparatus for separating a mixed signal of observation signals from a plurality of signal sources, wherein the separated signal is analyzed continuously and temporally and separated for each single signal source. And a reconstructing means for reconstructing a signal of a desired signal source from the separation result of the separating means.
【請求項12】 当該解析分離手段が、単一信号源の信
号として再構成された信号を一時的に記憶する記憶手段
を具備する請求項11に記載の信号分離装置。
12. The signal separating apparatus according to claim 11, wherein said analyzing and separating means includes a storage means for temporarily storing a signal reconstructed as a signal of a single signal source.
【請求項13】 当該解析分離手段が、当該混合信号を
任意の数に分配する分配手段を具備する請求項11に記
載の信号分離装置。
13. The signal separation device according to claim 11, wherein the analysis separation means includes a distribution means for distributing the mixed signal to an arbitrary number.
【請求項14】 当該解析分離手段が、当該混合信号を
任意の周波数分解能をもって周波数成分に分解する周波
数分解手段と、当該周波数成分間の調波構造の有無を判
定する調波構造判定手段と、当該調波構造判定手段によ
り周波数成分が調波構造に無いと判定された場合に、調
波構造を得る迄、周波数分解能等の解析条件を順次変更
する解析条件変更手段と、当該周波数分解手段により分
解された周波数成分を抽出する周波数成分抽出手段と、
当該周波数分解能を記憶する記憶手段とを有する請求項
11に記載の信号分離装置。
14. A frequency decomposition means for decomposing the mixed signal into frequency components with an arbitrary frequency resolution, a harmonic structure determination means for determining the presence or absence of a harmonic structure between the frequency components, When a frequency component is determined not to be in the harmonic structure by the harmonic structure determining means, an analysis condition changing means for sequentially changing analysis conditions such as frequency resolution until a harmonic structure is obtained, and the frequency decomposing means. Frequency component extracting means for extracting the decomposed frequency component,
The signal separation device according to claim 11, further comprising storage means for storing the frequency resolution.
【請求項15】 当該解析分離手段が、周波数分解され
た周波数成分を時間軸で走査し信号の大きさから周波数
成分の立上り及び立下り時間を判定する立上がり立下が
り時間判定手段と、当該周波数成分間同士の立上り時間
及び立下り時間を比較する比較手段と、当該立上り時間
及び当該立下り時間の少なくとも一方が両者が一致する
時間区分内の周波数成分を抽出する抽出手段とを有する
請求項14に記載の信号分離装置。
15. Rising and falling time determining means for scanning the frequency components subjected to frequency decomposition on the time axis to determine the rise and fall times of the frequency components from the magnitude of the signal, A comparison means for comparing a rise time and a fall time between each other, and an extraction means for extracting a frequency component in a time section in which at least one of the rise time and the fall time coincides with each other. A signal separation device as described in the above.
【請求項16】 当該解析分離手段が、同一周波数帯域
に分解された周波数成分を時間軸上で走査し、信号の代
表的大きさに不連続が観察される場合に、当該信号の代
表的大きさの継続する時間で解析対象周波数成分を区分
し抽出する解析対象周波数成分抽出手段と、区分された
周波数成分を隣接する帯域の周波数成分と比較し、異な
る信号源の周波数成分と判定する信号源判定手段とを有
する請求項15に記載の信号分離装置。
16. The analysis / separation means scans the frequency components decomposed into the same frequency band on the time axis, and when a discontinuity is observed in the representative magnitude of the signal, the representative magnitude of the signal is determined. Analysis target frequency component extracting means for classifying and extracting the analysis target frequency component in a continuous time, and a signal source for comparing the divided frequency component with a frequency component of an adjacent band and determining the frequency component of a different signal source The signal separation device according to claim 15, further comprising a determination unit.
【請求項17】 当該再構成手段は、周波数成分間の調
波構造が判定され、且つ当該周波数成分が立上り時間及
び立下り時間の少なくとも一方が同一と判定された周波
数成分を再構成し、出力する請求項15に記載の信号分
離装置。
17. The reconstructing means reconstructs a frequency component for which a harmonic structure between frequency components is determined and for which the frequency component is determined to have at least one of a rise time and a fall time, and outputs The signal separation device according to claim 15, wherein:
【請求項18】 当該再構成手段は、周波数成分間の調
波構造が判定され、且つ周波数成分の代表的な大きさに
より抽出された周波数成分を各信号源毎に再構成する請
求項16に記載の信号分離装置。
18. The method according to claim 16, wherein said reconstructing means determines a harmonic structure between frequency components, and reconstructs a frequency component extracted based on a representative magnitude of the frequency component for each signal source. A signal separation device as described in the above.
【請求項19】 当該解析分離手段が、所定の解析条件
及び解析結果の少なくとも一方を参照して、解析を継続
・停止する手段を具備する請求項17又は18に記載の
信号分離装置。
19. The signal separation device according to claim 17, wherein the analysis separation means includes means for continuing or stopping the analysis by referring to at least one of a predetermined analysis condition and an analysis result.
【請求項20】 解析過程の周波数分解と周波数成分の
再構成にウェーヴレット変換を用いる請求項17又は1
8に記載の信号分離装置。
20. The wavelet transform according to claim 17, wherein a wavelet transform is used for frequency decomposition and frequency component reconstruction in an analysis process.
9. The signal separation device according to 8.
JP11200078A 1999-07-14 1999-07-14 Signal separation and apparatus therefor Pending JP2001027895A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11200078A JP2001027895A (en) 1999-07-14 1999-07-14 Signal separation and apparatus therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11200078A JP2001027895A (en) 1999-07-14 1999-07-14 Signal separation and apparatus therefor

Publications (1)

Publication Number Publication Date
JP2001027895A true JP2001027895A (en) 2001-01-30

Family

ID=16418496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11200078A Pending JP2001027895A (en) 1999-07-14 1999-07-14 Signal separation and apparatus therefor

Country Status (1)

Country Link
JP (1) JP2001027895A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007003964A (en) * 2005-06-27 2007-01-11 Ricoh Co Ltd Image forming apparatus
JP2008518270A (en) * 2004-10-29 2008-05-29 ゼンフ・ステューディオズ,インコーポレイテッド Method, system and computer program product for detecting notes in an audio signal
KR101403086B1 (en) 2006-09-26 2014-06-03 소니 주식회사 Signal processing apparatus and method
US11018915B2 (en) 2017-01-11 2021-05-25 Fujitsu Limited Wireless analysis device and wireless analysis method

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6134600A (en) * 1984-07-27 1986-02-18 株式会社日立製作所 Voice recognition equipment
JPS6361296A (en) * 1986-09-02 1988-03-17 株式会社河合楽器製作所 Electronic musical instrument
JPH07295573A (en) * 1994-04-22 1995-11-10 Kawai Musical Instr Mfg Co Ltd Waveform generation device and electronic musical instrument using its output waveform
JPH08329046A (en) * 1995-05-31 1996-12-13 Toshiba Corp Signal analyzing device using wavelet conversion
JPH0990956A (en) * 1995-09-25 1997-04-04 Yamaha Corp Musical sound signal analyzing method
JPH10143194A (en) * 1996-11-13 1998-05-29 Oki Electric Ind Co Ltd Mixed speech separation system
JPH10197575A (en) * 1997-01-14 1998-07-31 Atr Ningen Joho Tsushin Kenkyusho:Kk Signal analyzing method
JPH10313497A (en) * 1996-09-18 1998-11-24 Nippon Telegr & Teleph Corp <Ntt> Sound source separation method, system and recording medium
JPH10319948A (en) * 1997-05-15 1998-12-04 Nippon Telegr & Teleph Corp <Ntt> Sound source kind discriminating method of musical instrument included in musical playing
JPH11184471A (en) * 1997-12-18 1999-07-09 Casio Comput Co Ltd Waveform generating device

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6134600A (en) * 1984-07-27 1986-02-18 株式会社日立製作所 Voice recognition equipment
JPS6361296A (en) * 1986-09-02 1988-03-17 株式会社河合楽器製作所 Electronic musical instrument
JPH07295573A (en) * 1994-04-22 1995-11-10 Kawai Musical Instr Mfg Co Ltd Waveform generation device and electronic musical instrument using its output waveform
JPH08329046A (en) * 1995-05-31 1996-12-13 Toshiba Corp Signal analyzing device using wavelet conversion
JPH0990956A (en) * 1995-09-25 1997-04-04 Yamaha Corp Musical sound signal analyzing method
JPH10313497A (en) * 1996-09-18 1998-11-24 Nippon Telegr & Teleph Corp <Ntt> Sound source separation method, system and recording medium
JPH10143194A (en) * 1996-11-13 1998-05-29 Oki Electric Ind Co Ltd Mixed speech separation system
JPH10197575A (en) * 1997-01-14 1998-07-31 Atr Ningen Joho Tsushin Kenkyusho:Kk Signal analyzing method
JPH10319948A (en) * 1997-05-15 1998-12-04 Nippon Telegr & Teleph Corp <Ntt> Sound source kind discriminating method of musical instrument included in musical playing
JPH11184471A (en) * 1997-12-18 1999-07-09 Casio Comput Co Ltd Waveform generating device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008518270A (en) * 2004-10-29 2008-05-29 ゼンフ・ステューディオズ,インコーポレイテッド Method, system and computer program product for detecting notes in an audio signal
JP2007003964A (en) * 2005-06-27 2007-01-11 Ricoh Co Ltd Image forming apparatus
KR101403086B1 (en) 2006-09-26 2014-06-03 소니 주식회사 Signal processing apparatus and method
US11018915B2 (en) 2017-01-11 2021-05-25 Fujitsu Limited Wireless analysis device and wireless analysis method

Similar Documents

Publication Publication Date Title
Saint-Arnaud et al. Analysis and synthesis of sound textures
EP2264696B1 (en) Voice converter with extraction and modification of attribute data
Duxbury et al. Separation of transient information in musical audio using multiresolution analysis techniques
US9330546B2 (en) System and method for automatically producing haptic events from a digital audio file
JP4207902B2 (en) Speech synthesis apparatus and program
JP4065314B2 (en) Target sound analysis apparatus, target sound analysis method, and target sound analysis program
US6336092B1 (en) Targeted vocal transformation
US7565213B2 (en) Device and method for analyzing an information signal
JP4645241B2 (en) Voice processing apparatus and program
Ebner et al. Audio inpainting with generative adversarial network
EP1662479A1 (en) System and method for generating audio wavetables
JP2015138053A (en) Acoustic signal processing device and method thereof
JP2010210758A (en) Method and device for processing signal containing voice
EP1918911A1 (en) Time scale modification of an audio signal
JP3174777B2 (en) Signal processing method and apparatus
JP2001027895A (en) Signal separation and apparatus therefor
Haider et al. Extraction of rhythmical features with the Gabor scattering transform
JP5163606B2 (en) Speech analysis / synthesis apparatus and program
JP4513556B2 (en) Speech analysis / synthesis apparatus and program
Anikin Package ‘soundgen’
JP2000003200A (en) Voice signal processor and voice signal processing method
JP2008096844A (en) Automatic music transcription device and method
Delgado Castro Iterative Separation of Note Events from Single-Channel Polyphonic Recordings
Ligtenberg The Effect of Deep Learning-based Source Separation on Predominant Instrument Classification in Polyphonic Music
JP4267954B2 (en) GENERAL CYCLE SIGNAL GENERATION METHOD, DEVICE, VOICE SYNTHESIS METHOD, DEVICE, VOICE SYNTHESIS PROGRAM AND RECORDING MEDIUM

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060706

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080703

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090120

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090602