PL211141B1

PL211141B1 - Sposób miksowania sygnałów dźwiękowych

Info

Publication number: PL211141B1
Application number: PL376464A
Authority: PL
Inventors: Piotr Kleczkowski
Original assignee: Piotr Kleczkowski
Priority date: 2005-08-03
Filing date: 2005-08-03
Publication date: 2012-04-30
Also published as: WO2007015652A3; PL376464A1; WO2007015652A2; US20080199027A1

Description

(12) OPIS PATENTOWY (19) PL (11) 211141 (13) B1 (21) Numer zgłoszenia: 376464 ^{(51) Int.Cl.}

G10L 21/02 (2006.01) H04H 60/04 (2008.01) (22) Data zgłoszenia: 03.08.2005 (54)

Sposób miksowania sygnałów dźwiękowych

	(73) Uprawniony z patentu:
(43) Zgłoszenie ogłoszono:	KLECZKOWSKI PIOTR, Kraków, PL
05.02.2007 BUP 03/07	(72) Twórca(y) wynalazku:
	PIOTR KLECZKOWSKI, Kraków, PL
(45) O udzieleniu patentu ogłoszono:
30.04.2012 WUP 04/12	(74) Pełnomocnik:
	rzecz. pat. Małgorzata Geissler

PL 211 141 B1

Opis wynalazku

Przedmiotem wynalazku jest sposób miksowania sygnałów dźwiękowych. Sposób dotyczy zarówno miksowania sygnałów w studiach nagrań jak i miksowania sygnałów z osobnych torów elektroakustycznych na żywo.

Wynalazek może być zastosowany dla dowolnych materiałów dźwiękowych: muzycznych, słownych czy efektów dźwiękowych, a także dla dowolnej ilości torów przy nagraniach monofonicznych oraz w technikach wielokanałowych.

W znanych i powszechnie stosowanych sposobach proces miksowania polega jedynie na sumowaniu sygnałów dźwiękowych. Przeprowadza się go w technice analogowej przy pomocy konsolet mikserskich, albo w technice cyfrowej przy pomocy cyfrowych stołów mikserskich lub komputerów z odpowiednim oprogramowaniem.

Znane jest też podobne rozwiązanie ze zgłoszenia patentowego nr P-358531 pt. Sposób zwiększania wyrazistości dźwięku solowego na tle dźwięków tła akustycznego. Wynalazek ten, z uwagi na inaczej postawione zagadnienie techniczne, dotyczy miksowania ścieżki solowej z tłem dając nieznaczne zwiększenie wyrazistości tylko tej ścieżki.

Zgodnie z tym rozwiązaniem sposób zwiększania wyrazistości polega na dynamicznym tłumieniu tła akustycznego w zależności od obecności dźwięku solowego i charakteryzuje się tym, że cyfrowe sygnały dźwięku solowego i tła akustycznego poddaje się analizie czasowo-częstotliwościowej w elektronicznym urządzeniu procesorowym. Następnie, według przyjętych algorytmów obliczeniowych, wyznacza się obszary koncentracji energii dźwięku solowego i odpowiadające im obszary tłumienia tła oraz określa stopień tłumienia, po czym dokonuje się tłumienia i resyntezy dźwięku tła oraz miesza go z dźwiękiem solowym.

Celem wynalazku jest opracowanie technicznego sposobu miksowania sygnałów dźwiękowych pozwalającego na odbieranie przez słuch większej ilości szczegółów w słuchanych dźwiękach.

Sposób polega na odwzorowaniu sygnałów wejściowych na płaszczyzny czasowo-częstotliwościowe i obróbce tych sygnałów w dziedzinie czasowo-częstotliwościowej. Po dokonaniu obróbki realizowane jest sumowanie na zmiksowany sygnał wyjściowy.

Istotą sposobu według wynalazku jest to, że w procesie obróbki sygnałów, z pojedynczych elementów sygnałów w analogicznych mikroobszarach na płaszczyznach czasowo-częstotliwościowych, wybiera się co najmniej jeden element uprzywilejowany. Analogiczne mikroobszary utworzone są przez mikroobszary o jednakowych współrzędnych, znajdujące się na płaszczyznach czasowo-częstotliwościowych. W przypadku wyboru jednego elementu uprzywilejowanego wybiera się element o najwyższej wartości energii, w innych przypadkach, kolejno dwa najwyższe i dalsze, jednak zawsze łącznie z najwyższymi. Tak wybrane elementy sygnałów, określane jako elementy uprzywilejowane, przesyła się do sumowania na zmiksowany sygnał wyjściowy. Elementy sygnałów, które pozostały po oddzieleniu sygnałów uprzywilejowanych, tłumi się przed sumowaniem. Opisane wybieranie uprzywilejowanych elementów realizuje się dla wszystkich mikroobszarów na płaszczyznach czasowo-częstotliwościowych.

Korzystnie jest gdy w procesie obróbki sygnałów przed wybieraniem, w każdej z płaszczyzn, wartości energii elementów sygnałów w mikroobszarach zastępuje się średnimi wartościami energii wyliczonymi dla większych obszarów złożonych z wielu sąsiadujących ze sobą mikroobszarów. Wyliczone wartości przypisuje się jednemu mikroobszarów!, ulokowanemu w środku tego obszaru.

Korzystnie jest jeśli elementy sygnałów wybiera się z mikroobszarów połączonych w grupy za pomocą odpowiedniego algorytmu obliczeniowego. Wielkość takiej grupy mikroobszarów może wynosić od 2, dla najniższych, do 500 mikroobszarów, dla najwyższych częstotliwości akustycznych. Do tworzenia grup mikroobszarów wykorzystuje się sztuczne sieci neuronowe lub logikę rozmytą.

Korzystne jest również, gdy przed wybieraniem, wartości energii danego sygnału mnoży się przez współczynnik o wartości od 0,1 do 10. Tę pomnożoną wartość energii uwzględniamy w wybieraniu z analogicznych mikroobszarów. Po dokonaniu wyboru przekazuje się do miksowania sygnał o pierwotnej wartości energii. Dotyczy to przypadków, gdy jeden lub kilka z sygnałów ma być traktowany inaczej od pozostałych.

Następujące po obróbce tłumienie sygnałów, daje korzystny rezultat, jeśli elementy sygnałów, inne niż uprzywilejowane, doprowadza się do zerowej wartości energii.

PL 211 141 B1

Korzystnie jest także, jeśli przed sumowaniem wzmacnia się elementy uprzywilejowane, tak aby wartość ich energii była równa sumie wartości energii elementów sygnałów przed obróbką, przypadających na analogiczne mikroobszary.

Ze względów technicznych korzystnym jest gdy sumowanie sygnałów odbywa się w dziedzinie czasowo-częstotliwościowej.

Sposób, według wynalazku, nadaje się zarówno do nagrań monofonicznych, jak i wielokanałowych, na przykład stereofonicznych. W przypadku nagrań wielokanałowych sposób, według wynalazku stosuje się oddzielnie dla każdego z kanałów.

Dzięki takiemu sposobowi miksowania uzyskuje się znaczną poprawę jakości nagrania, szczególnie zwiększenie wyrazistości dźwięków. Zmiksowany sygnał na wyjściu jest czystszy a w nagraniach stereofonicznych łatwiejsza jest ocena lokalizacji poszczególnych źródeł dźwięku. W szczególności wynalazek jest przydatny dla poprawiania brzmienia nagrań dokonywanych z wielu mikrofonów jednocześnie, gdy powstają przesłuchy. Wynalazek w wysokim stopniu eliminuje to zjawisko.

Sposób według wynalazku przybliżono, na przykładzie przedstawionym na rysunku, na którym fig. 1 jest schematem blokowym, fig. 2 jest graficznym obrazem procesu wybierania mikroobszarów, a fig. 3 jest graficznym obrazem procesu wybierania grup mikroobszarów.

Poszczególne sygnały do zmiksowania otrzymuje się z mikrofonów lub innych źródeł. Każdy z sygnałów na wejściu WE może przechodzić przez przedwzmacniacz mikrofonowy 1, a następnie zostaje przetworzony w przetworniku a/c 2 do postaci cyfrowej. Sygnały w postaci cyfrowej wprowadzane są do procesora cyfrowego 3, w którym przeprowadza się obróbkę zgodnie z istotą wynalazku.

Procesor cyfrowy może być niezależnym urządzeniem przeznaczonym do tego zadania, kartą rozszerzającą do komputera z procesorem sygnałowym DSP lub wprost procesorem zwykłego komputera personalnego.

Po wykonaniu obróbki sygnał cyfrowy przekazywany jest do przetwornika c/a 4 i po przetworzeniu do toru elektroakustycznego 5 zawierającego wzmacniacze i głośniki.

Jeśli przedstawiony sposób miksowania służy do produkcji nagrań, wtedy sygnały z przedwzmacniaczy mikrofonowych 1 najpierw są nagrywane na osobnych ścieżkach, a następnie podczas odtwarzania są przekazywane do obróbki w procesorze cyfrowym 3.

Zmiksowane sygnały z wyjścia procesora cyfrowego 3 są nagrywane w postaci cyfrowej.

Dźwięk można rozłożyć na składowe częstotliwościowe. Dźwięki mowy i muzyki są zmienne w czasie i dlatego właściwa jest dla nich analiza w dziedzinie czasowo-częstotliwościowej.

Na rysunku fig. 2 pokazano płaszczyzny 6 wykresu czas - częstotliwość. Każda płaszczyzna odpowiada jednemu sygnałowi. Jeśli czas trwania sygnału wynosi 3 minuty to ilość niepodzielnych mikroobszarów 7, odpowiadających elementom sygnału, sięga do 8 milionów. Na fig. 2 zaznaczono przykładowe analogiczne mikroobszary 7. Wartości energii sygnału w mikroobszarach 7 obrazowane są na wykresie stopniem zaczernienia. Podczas obróbki porównuje się mikroobszary we wszystkich sygnałach, co schematycznie zaznaczono linią A-A.

Przykład, w którym obróbkę prowadzi się na obszarach utworzonych przez grupy mikroobszarów obrazuje fig. 3. Na płaszczyznach 6 wykresów czas - częstotliwość pokazano analogiczne grupy mikroobszarów 8. Wartości energii sygnału w grupach mikroobszarów 8 obrazowane są na wykresie stopniem zaczernienia. Dla czytelności zobrazowania przykładu pominięto zaczernianie pozostałych mikroobszarów. Podczas obróbki porównuje się grupy mikroobszarów we wszystkich sygnałach, co schematycznie zaznaczono linią B-B.

Claims

Zastrzeżenia patentowe

1. Sposób miksowania sygnałów dźwiękowych, polegający na odwzorowaniu sygnałów wejściowych na płaszczyzny czasowo-częstotliwościowe, obróbce tych sygnałów w dziedzinie czasowo-częstotliwościowej, a następnie sumowaniu na zmiksowany sygnał wyjściowy, znamienny tym, że w procesie obróbki sygnałów, z elementów sygnałów w analogicznych mikroobszarach na płaszczyznach czasowo-częstotliwościowych wybiera się co najmniej jeden element uprzywilejowany, poczynając od najwyższej wartości energii, i te elementy uprzywilejowane przesyła się do sumowania na zmiksowany sygnał wyjściowy, natomiast elementy sygnałów w pozostałych mikroobszarach tłumi się przed sumowaniem, przy czym wybieranie realizuje się dla wszystkich mikroobszarów płaszczyzny czasowo-częstotliwościowej.

PL 211 141 B1
2. Sposób według zastrz. 1, znamienny tym, że w procesie obróbki sygnałów, przed wybieraniem, wartości energii elementów sygnałów w mikroobszarach zastępuje się średnimi wartościami energii wyliczonymi dla obszarów złożonych z wielu sąsiadujących ze sobą mikroobszarów.
3. Sposób według zastrz. 1, znamienny tym, ż e elementy sygnałów wybiera się z mikroobszarów połączonych w grupy za pomocą odpowiedniego algorytmu obliczeniowego, przy czym wielkość grupy mikroobszarów wynosi 2 - 500 mikroobszarów.
4. Sposób według zastrz. 1, znamienny tym, że do wyboru grup mikroobszarów wykorzystuje się sztuczne sieci neuronowe.
5. Sposób według zastrz. 1, znamienny tym, że do wyboru grup mikroobszarów wykorzystuje się logikę rozmytą.
6. Sposób według zastrz. 1, znamienny tym, że przed wybieraniem wszystkie elementy sygnału mnoży się przez współczynnik o wartości od 0,1 do 10, a po ich wybraniu przekazuje się do miksowania sygnał o pierwotnej wartości energii.
7. Sposób według zastrz. 1, znamienny tym, że elementy sygnałów, z wyjątkiem uprzywilejowanych, tłumi się do zera.
8. Sposób wedł ug zastrz. 1, znamienny tym, ż e przed sumowaniem wzmacnia się elementy uprzywilejowane do wartości energii równej sumie energii elementów wszystkich sygnałów przed obróbką, przypadających na analogiczne mikroobszary.
9. Sposób według zastrz. 1, znamienny tym, że przed sumowaniem wzmacnia się elementy uprzywilejowane do wartości energii równej sumie energii elementów wszystkich sygnałów przed obróbką, przypadających na analogiczne grupy mikroobszarów.
10. Sposób według zastrz. 1, znamienny tym, że sumowanie sygnałów odbywa się w dziedzinie czasowo-częstotliwościowej.