RO127591A2 - Sistem pentru separarea oarbă a semnalelor acustice din amestecuri convolutive - Google Patents
Sistem pentru separarea oarbă a semnalelor acustice din amestecuri convolutive Download PDFInfo
- Publication number
- RO127591A2 RO127591A2 ROA201001193A RO201001193A RO127591A2 RO 127591 A2 RO127591 A2 RO 127591A2 RO A201001193 A ROA201001193 A RO A201001193A RO 201001193 A RO201001193 A RO 201001193A RO 127591 A2 RO127591 A2 RO 127591A2
- Authority
- RO
- Romania
- Prior art keywords
- signals
- block
- convolutional
- sources
- mixtures
- Prior art date
Links
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
Invenţia se referă la un sistem de separare oarbă a semnalelor acustice din amestecuri convolutive, fără a se cunoaşte date despre sursele iniţiale. Sistemul conform invenţiei este alcătuit dintr-un bloc (2) de analiză ce cuprinde un număr debancuri identice de analiză, fiecare având un set defiltre (5) trece-bandă, care descompun un semnal de amestec pesubbenzi, dintr-un bloc (3) de calcul neuronal, format din bancuri de reţele neuronale (6), ce separă pe fiecare subbandă semnalele surselor din amestec, şi dintr-un bloc (4) de sinteză alcătuit din bancuri de filtre (7), ce reconstruiesc semnalele surselor iniţiale pe baza ieşirilor din blocul (3) de calcul neuronal.
Description
Invenția se referă la un sistem destinat extragerii din mai multe amestecuri de semnale a e unor surse sonore ale semnalelor surselor inițiale fără cunoașterea unor date despre acestea. Aceasta se bazează pe procesarea semnalelor acustice pe subbenzi și utilizarea rețelelor neuronale. Acest sistem are numeroase aplicații în comunicațiile radio, diagnosticarea neevazivă și analiza semnalelor biomedicale (EEG, MEG, EKG, RMN), explorări geologice, prelucrări de semnale acustice și imagini. Din aplicațiile din domeniul acustic putem aminti sistemele karaoke, detecția subacvatică, transmiterea informației audio codate.
Una din problemele clasice de separare a semnalelor este cea de „cocktail-party”, care presupune separarea vocilor suprapuse folosind mai multe microfoane pe post de senzori. Amestecarea vocilor este afectată și de reverberația indusă de dimensiunile finite al e încăperii, de zgomotele generate în încăpere. Separarea se bazează pe diversitatea temporală și spațială a semnalelor transmise pe mai multe canale.
Brevetul EP2245861 prezintă o metoda de separare oarba a semnalelor puternic corelate și un algoritm de formare a fasciculului de semnale. Pentru a se extrage semnalul dorit, semnalele primite sunt preprocesate pentru a oferi direcționalitate, iar apoi sunt calibrate cu diferiți factori, semnalele dintr-o anumită direcție fiind amplificate, iar celelalte atenuate.
Dezavantajul metodei consta în dificultatea determinării precise a direcției semnalelor și ει factorilor de calibrare a acestora, metoda fiind inaplicabila atunci când nu se cunosc date despre sursele inițiale.
Brevetul KR20090016463 prezintă, pentru îmbunătățirea performantelor, o metoda de preprocesare a semnalului înainte de separarea oarbă a semnalelor. Metoda consta in: a) recepționarea unui prim semnal asociat unui prim senzor și recepționarea unui al doilea semnal asociat unui al doilea senzor; b) preprocesarea celui de-al doilea semnal pentru a-1 separa de primul semnal; c) aplicând tehnica de separare oarba a semnalelor se obțin primul și al doilea semnal. Preprocesarea semnalelor se face utilizând sisteme adaptive de filtrare după care are loc calibrarea semnalelor cu diferiți factori.
Dezavantajul metodei consta în dificultatea aplicării acesteia pentru separarea amestecurilor convolutive provenind de la un număr mare de surse, mai ales atunci când sursele nu sunt cunoscute.
US2009268962 oferă o metoda și un aparat pentru separarea oarbă a semnalelor acustice. Metoda se bazează pe algoritm ESPRIT și cuprinde următoarele etape: a) descompunerea amestecului în reprezentări unde un număr mic de componente conțin un procent mare al energiei semnalului; b) efectuarea unor analize locale ale reprezentărilor considerând că în acea regiune sunt active doar câteva surse; c) crearea unei histograme multidimensionale; d) identificarea de vârfuri în histogramă pentru a β- 2 Ο 1 Ο - 01 f 9 3 - -
5 -11- 2010 determina numărul de surse; e) estimarea surselor pentru fiecare regiune locală.
Dezavantajul metodei consta în necesitatea amplasării senzorilor sub forma unor matrici, locația lor fiind deosebit de importanta. Metoda nu oferă rezultate corespunzătoare atunci când se dorește a fi utilizata pentru extragerea de semnale din amestecuri convolutive provenind de la surse necunoscute.
KR20060017703 prezintă un aparat de separare oarbă a semnalelor care consta din: a) unitate de preprocesare care recepționează o mulțime de semnale și care dă la ieșire o mulțime de semnale cu ajutorul unui algoritm de triere la sursa; b) o unitate de actualizare care primește semnalele de la unitatea precedenta și utilizează un algoritm de predeterminare a ponderilor prin invitare care stabilește ponderile inițiale; c) o unitate de stabilire a ponderilor și a coeficienților de ponderare. Unitatea de preprocesare conține (L+l) elemente identice, unitatea de actualizare conține un număr de element identice organizate sub forma unei matrice sistolice.
Dezavantajul acestei soluții consta în numărul mare și complexitatea operațiilor care se efectuează asupra semnalelor, cu efect asupra timpului de procesare.
Problema tehnica pe care o rezolva invenția propusa este realizarea unui sistem simplu și eficient, pentru separarea oarbă a semnalelor acustice din amestecuri convolutive, care oferă posibilitatea extragerii semnalelor surselor inițiale din mai multe amestecuri de semnale, fără cunoașterea unor date despre aceste surse.
Sistemul pentru separarea oarbă a semnalelor acustice din amestecuri convolutive (rezultat în urma cuplajului acustic 1 datorat încăperii) cu ajutorul procesării pe subbenzi, conform invenției, este alcătuit dintr-un bloc de analiză 2, un bloc de calcul neuronal 3 și un bloc de sinteză 4 (Figura 1). Blocul de analiza 2 cuprinde un număr de l bancuri identice de analiză, fiecare având un set de l filtre trece-bandă 5, care descompun semnalul de amestec x/t) pe l subbenzi. Blocul de calcul neuronal 3 este format din bancuri de rețele neuronale 6, care separa pe fiecare subbandă semnalele surselor din amestec. Blocul de sinteza 4 este alcătuit din bancuri de filtre 7, care reconstruiesc semnalele surselor inițiale pe baza ieșirilor din blocul de calcul neuronal 3.
Se dă în continuare un exemplu de realizare a invenției în legătură cu figurile 1, 2, 3 și 4 care reprezintă: figura 1, schema bloc a sistemului;
- figura 2, schema blocului de analiza;
figura 3, schema bloc a rețelei neuronale;
figura 4, schema blocului de sinteză.
Se consideră că există un număr n de surse sonore Sj(t), j = 1, 2, independente și necunoscute.
(γΖ Ο 1 ο - ο ' ' ? 3
5 -11- 2010
Aceste semnale sunt recepționate ca un amestec convolutiv de un număr de m senzori amplasați în încăpere xft), i = 1,2, ..., m. Mixarea semnalelor surselor este realizată de blocul 1 (modelul cuplajului acustic) din figura 1 și nu există date nici despre surse sfk), i=l, 2, ..., n și nici despre modul de amestecare.
Fiecare semnal amestec este împărțit pe l subbenzi cu ajutorul blocului de analiză 2. Acest bloc este alcătuit dintr-un număr de m seturi de filtre trece-bandă 5; fiecare set are la intrare un semnal amestec iar la ieșire semnalele x'(&),x,2(£),K , x\(k), unde i=l, 2, ... m (Figura 2). Seturile de filtre 5 sunt identice, structura interna este ilustrata în figura 2. Fiecare set este alcătuit din l filtre trece-bandă 8. Filtrele trece banda 8 au frecvența centrală com=2xk/l, k=O,..., l-l și o lățime de bandă egală cu 2π/1. împărțirea pe subbenzi este realizată prin deplasarea în frecvență (cu ajutorul unor mixere digitale 10) a semnalului de intrare și filtrarea acestuia cu filtrele trece banda 8. Semnalul obținut după filtrarea trece-banda sunt decimate de filtrele de decimare 9, având factorul de decimare egala cu numărul subbenzilor l. Frecvența fiecărei rețele neuronale este coborâtă prin subeșantionare (l-t) în blocul 2 de analiză (Fig. 2). Descompunerea semnalelor pe subbenzi se realizează prin:
- multipla deplasare a semnalului în frecventa cu ajutorul mixerelor 10;
- filtrarea ramurile cu filtru tip trece-banda 8;
- decimarea ramurilor (9) cu factorul de decimare egala cu numărul subbenzilor.
Blocul de calcul neuronal 3 este cel care face separarea oarbă a semnalelor și este compus dintr-un set de l rețele neuronale 6, fiecare rețea realizând separarea oarbă pe o subbandă. Structura rețelei neuronale 6 este ilustrata în figura 3. Intrarea rețelei neuronale de pe banda 5 este vectorul [<(£),x2 5 (*),···<,(*)], iar ieșirea este vectorul (k), y2 (£),...y*(£)] · Separarea se face pe baza ponderilor neuronale 11, ale căror valori sunt estimate de algoritmul de învățare 12. Algoritmul de învățare 12 are rolul de modificare dinamică a ponderărilor Wij(t), i=l,l,2, ..., m, j = 1, 2, ...,n (fig. 2).
Rețeaua de separare din blocul 3 livrează semnalele surselor pe subbenzi conform relației:
ys(k) =Vfs(k)-Xs(k) (1.) unde ieșirea este vectorul y5(k) = [/(&),y2(Â:),...y*(Â:)], intrarea xs(k) = [%/(&),x2(k),...,xs m(k)], iar ws(k) este matricea de separare din banda 5 . Acest bloc este reprezentat în figura 3. Adaptarea este guvernată de algoritmul stohastic descendent:
wJ (£ + !) = wJ (Λ) + q(k) [i - f (yf (£)) y' (k)T ] · w5 (Λ).
(2.) unde rj(k) este rata de învățare la momentul k , iar f(y)=[fi(yi),-.,fn(yn)]T este vectorul de învățare.
^2 g ț 0 - 3 c 3
5 -11- ;?010
(3.)
Fiecare element al vectorului de învățare poate fi ales ca:
Λ(ζ·) = + tanh(/y.), unde a>0 și γ>2 sunt constante pozitive.
Reconstrucția semnalelor inițiale ale surselor se face cu ajutorul blocului de sinteză 4. Acest bloc este format din n seturi de filtre 7 și recompune semnalul sursă [y, ?„(£)] din ieșirile rețelelor neuronale [^(£),^(^),...,^(^)^,5 = 1,2,K ,1.. Fiecare set de filtre 7 este format din / blocuri de interpolare 13, cu factorul de supraeșantionare egal cu numărul subbenzilcr l. Blocurile de interpolare 13 facilitează revenirea la frecvența de eșantionare inițiala. După interpolare;, semnalele sunt filtrate cu l filtre trece-bandă 14, iar apoi semnalele din subbenzi sunt aduse le frecvența lor centrală cu ajutorul mixerelor 15. Reconstrucția este finalizată de sumatorul 16.
Refacerea semnalelor surselor inițiale se realizează prin:
- interpolare cu un factor de supraeșantionare egal cu numărul subbenzilor executat de interpolatorul 13;
filtrare tip trece banda 14 pe fiecare ramura;
deplasarea semnalelor la frecventa lor centrala cu ajutorul mixerelor 15; (4) adunarea subbenzilor cu sumatorul (16).
Pentru evaluarea performanței sistemului de separare este folosit raportul semnal interferență (signal to interference ratio) SIR. Dacă avem doar două surse sft), s2(t), două amestecuri xft), x2(t) și două estimări yi(t), y2(t), atunci SIR poate fi exprimat ca:
SIR(yx(t)) = (4.) yi(t) este sursa estimată, sj(t) sursa inițială, s2(t) sursa interferență și E(x} i speranța semnalului x. Această mărime poate fi interpretată ca raportul dintre intercorelația dintre semnalul estimat și cel original și intercorelația dintre semnalul estimat și cel interferent. Când SIR ia valori negative, sursele nu sunt separate.
Prin aplicarea invenției se obțin următoarele avantaje:
sistemul nu necesită date referitoare la sursele acustice inițiale;
sistemul asigură convergența și stabilitate mai bune în comparație cu alte metode de separare;
- costurile de proiectare și de execuție sunt reduse datorită modularizării.
^2010-01193--
Claims (5)
- REVENDICĂRI1. Sistem pentru separarea oarbă a semnalelor acustice din amestecuri convolutive, caracterizat prin aceea că, pentru a se realiza separarea semnalelor, fără a cunoaște date despre sursele inițiale, natura și numărul lor și nici despre modul de amestecare, sistemul este alcătuit dintr-un bloc de analiză (2) care cuprinde un număr de l bancuri identice de analiză, fiecare având un set de l filtre trece-bandă (5), cane descompun semnalul de amestec x/t) pe l subbenzi, dintr-un bloc de calcul neuronal (3) format din bancuri de rețele neuronale (6), care separă pe fiecare subbandă semnalele surselor din amestec și dintr-un bloc de sinteză (4) alcătuit din bancuri de filtre (7), care reconstruiesc semnalele surselor inițiale pe baza ieșirilor din blocul de calcul neuronal (3).
- 2. Sistem pentru separarea oarbă a semnalelor acustice din amestecuri convolutive, conform revendicării 1, caracterizat prin aceea că, utilizează o metodă care se bazează pe diversitatea spațială și temporală a semnalelor acustice de tip sursă, prin separarea oarbă a semnalelor pe subbenzi fapt ce transformă amestecul convolutiv pe întreaga bandă în amestecuri liniare pe fiecare subbandă, iar dacă numărul de senzori utilizați este mai mare ca numărul de surse, se vor obține la ieșire un număr de semnale nule, iar pentru a obține o convergență cât mai bună trebuie asigurat un număr suficient de senzori și de subbenzi.
- 3. Sistem pentru separarea oarbă a semnalelor acustice din amestecuri convolutive, conform revendicării 1, caracterizat prin aceea că, pentru a putea fi utilizate dispozitive digitale mai puțin pretențioase, sistemul este astfel conceput ca o mare parte a sa să lucreze la frecvențe mai joase decât frecvența de eșantionare a semnalelor acustice, astfel rețelele neuronale (6) lucrează la frecvență redusă de eșantionare, datorită subeșantionării dinaintea blocului de calcul neuronal (3) și supraeșantionării de după acesta, factorul de decimare fiind egal cu numărul de subbenzi considerate.
- 4. Sistem pentru separarea oarbă a semnalelor acustice din amestecuri convolutive, conform revendicării 1, caracterizat prin aceea că, sistemul oferă convergență și stabilitate bună datorită, în primul rând prelucrării pe subbenzi, separarea adaptivă realizată de rețelele neuronale pe subbenzi fiind mult mai stabilă deoarece, pe subbenzi, amestecul este aproape liniar și nu convolutiv ca pe întreaga bandă, iar durată de învățare specifică calculului neuronal este redusă.
- 5. Sistem pentru separarea oarbă a semnalelor acustice din amestecuri convolutive, conform revendicării 1, caracterizat prin aceea că, sistemul oferă simplitatea constructivă și modulară deoarece el se compune din seturi identice de elemente: filtre trece-bandă, elemente de mixare, interpolare, însumare, rețele neuronale și, în plus, o corelație bună a blocurilor de analiză (2) și a blocurilor de sinteză (4) asigură facilități de reconstrucție.0^2010-01193--
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| ROA201001193A RO127591A2 (ro) | 2010-11-25 | 2010-11-25 | Sistem pentru separarea oarbă a semnalelor acustice din amestecuri convolutive |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| ROA201001193A RO127591A2 (ro) | 2010-11-25 | 2010-11-25 | Sistem pentru separarea oarbă a semnalelor acustice din amestecuri convolutive |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| RO127591A2 true RO127591A2 (ro) | 2012-06-29 |
Family
ID=46319422
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ROA201001193A RO127591A2 (ro) | 2010-11-25 | 2010-11-25 | Sistem pentru separarea oarbă a semnalelor acustice din amestecuri convolutive |
Country Status (1)
| Country | Link |
|---|---|
| RO (1) | RO127591A2 (ro) |
-
2010
- 2010-11-25 RO ROA201001193A patent/RO127591A2/ro unknown
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Ur Rehman et al. | Filter bank property of multivariate empirical mode decomposition | |
| DK2608197T3 (en) | Method, device and system for noise reduction in multi-microphone array | |
| KR102429152B1 (ko) | 골진동 센서 및 마이크로폰 신호를 융합한 딥 러닝 음성 추출 및 노이즈 저감 방법 | |
| CN103262159B (zh) | 用于对多声道音频信号进行编码/解码的方法和装置 | |
| CN110931031A (zh) | 一种融合骨振动传感器和麦克风信号的深度学习语音提取和降噪方法 | |
| CN103219012B (zh) | 一种基于声源距离的双麦克风噪声消除方法及装置 | |
| Mimilakis et al. | A recurrent encoder-decoder approach with skip-filtering connections for monaural singing voice separation | |
| CN106504763A (zh) | 基于盲源分离与谱减法的麦克风阵列多目标语音增强方法 | |
| CN103106903A (zh) | 一种单通道盲源分离法 | |
| CN106226739A (zh) | 融合子带分析的双声源定位方法 | |
| Holighaus et al. | Reassignment and synchrosqueezing for general time–frequency filter banks, subsampling and processing | |
| CN106096579A (zh) | 一种心电信号预处理的方法 | |
| CN103944535B (zh) | 一种利用频响特性配置的全相位滤波器组的方法及其装置 | |
| DE60000185T2 (de) | Verfahren und Vorrichtung zur Audiokodierung und -dekodierung mittels Verschachtelung geglätteter Hüllkurven kritischer Bänder höherer Frequenzen | |
| CN104637494A (zh) | 基于盲源分离的双话筒移动设备语音信号增强方法 | |
| CN106960672A (zh) | 一种立体声音频的带宽扩展方法与装置 | |
| Dey et al. | Single channel blind source separation based on variational mode decomposition and PCA | |
| Kokkinakis et al. | Subband-based blind signal processing for source separation in convolutive mixtures of speech | |
| Looney et al. | Subspace denoising of EEG artefacts via multivariate EMD | |
| RO127591A2 (ro) | Sistem pentru separarea oarbă a semnalelor acustice din amestecuri convolutive | |
| Furnon et al. | Attention-based distributed speech enhancement for unconstrained microphone arrays with varying number of nodes | |
| CN103559886A (zh) | 基于组稀疏低秩表达的语音信号增强方法 | |
| Swarnkar et al. | Performance of wavelet filters for ECG compression based on linear predictive coding using different thresholding functions | |
| EP2840570A1 (en) | Enhanced estimation of at least one target signal | |
| DE102023125214A1 (de) | Herzmessung unter Verwendung von akustischen Techniken |